Data scouting - ricerca di dati aperti sul patrimonio culturale italiano 2021
Data scouting - ricerca di dati aperti sul patrimonio culturale italiano 2021 | |
---|---|
Stato Concluso | |
Relazione Sessione Relazione finale lavoro di ricerca di seguito | |
Categoria contenuti liberi, ricerca, Wiki Loves Monuments | |
Ruolo di Wikimedia Italia Sostegno economico | |
Inizio 2020 | |
Fine 2021 | |
Budget Nel budget di Il patrimonio culturale italiano su Wikipedia, i progetti Wikimedia e OpenStreetMap | |
Fornitore Synapta (referente Giorgio Bevilacqua) | |
Volontari Iolanda Pensa all'interno di Il patrimonio culturale italiano su Wikipedia, i progetti Wikimedia e OpenStreetMap | |
Referente Wikimedia Italia Marta Arosio |
Una ricerca sui dati aperti realizzata nel 2020 da Synapta ha mostrato come i migliori dataset disponibili sono al momento:
- dati.puglia.it
- dati.lombardia.it - Architetture della Regione Lombardia (dataset #2)
- dati.regione.sardegna.it - Schede di catalogazione di architettura - A 3.00 (dataset #4)
- dati.emilia-romagna.it - Arte e Cultura (dataset #12)
I dati sono poi stati oggetto di caricamento attraverso lo strumento OLAF.
Relazione finale lavoro di ricerca
Metodologia
Lo scouting è stato svolto effettuando analisi dei dataset a tema cultura/turismo/territorio presenti all’interno dei portali open data regionali, come pure dei dataset messi a disposizione a livello nazionale dal MIBACT.
Nel corso dello scouting sono state privilegiate fonti dato distribuite con licenza CC zero in ottica dell’integrazione dei dati su pagine Wikidata (es: dati.puglia.it - Luoghi di interesse turistico, culturale, naturalistico). In subordine, sono state valutate fonti distribuite con licenze CC più restrittive di CC0 in ottica di semplice interlinking con Wikidata (non compatibili quindi per il caricamento su Wikidata dei metadati descrittivi dei beni culturali).
Tra le fonti dato rilevanti sono state incluse solo quelle che disponevano di risorse immediatamente open data; sono stati esclusi quindi siti web o portali che presentassero schede sui beni culturali unicamente sotto forma di pagine html.
Dal punto di vista del contenuto informativo, sono state privilegiate le fonti che contengono un numero significativo di beni appartenenti alle tipologie di beni individuate come di interesse per il progetto (quindi, principalmente “monumenti”, “beni architettonici” o altro di interesse per Wiki Loves Monuments).
Struttura del report tabellare
Il Report tabellare sul data scouting, con un elenco di 20 fonti accessibili e metadatate è disponibile al seguente link: https://docs.google.com/spreadsheets/d/1xtW_6Lrvi59gvBF4G-wvpI_NSHJDg-80nu72o2VaR7o/edit#gid=105460182 Data Scouting Patrimonio Culturale su Wiki - WMIT
Il report è composto da 2 tabelle. La prima “Lista dataset”, riporta principalmente informazioni su su licenze, numero di beni, referenti, modalità e tempistiche di accesso al dataset. In particolare:
- Titolo del dataset
- Regione/Prov Autonoma/Altro ente
- Descrizione testuale del dataset
- Tipologia di beni rappresentati
- Numero di beni rappresentati
- Numero di beni di interesse
- Licenza
- Titolare
- Mail del referente
- Home page del progetto/portale di riferimento
- Localizzazione sorgente dati
- URL accesso diretto al dataset
- Modalità di collegamento al file
- Estensione del file
- Data di rilascio
- Data di ultimo aggiornamento
- Tempistiche di aggiornamento dei dati
- Data di ultimo accesso al dataset
- Note scouting
La seconda tabella (“Check metadati”) riporta informazioni sulla presenza di metadati catalografici, in particolare:
- Codice identificativo
- Localizzazione
- Indirizzo
- Coordinate Geografiche
- Immagine
- Descrizione
- Data di produzione
- Autore
- Link dataset/Sample scheda
Analisi fonti
4 fonti che sono state valutate come le più adatte per il passaggio alla fase di data integration (su cui proponiamo di configurare l’interfaccia di interlinking OLAF), per numero e qualità dei beni rappresentati, oltre che per disponibilità di licenze compatibili:
1. dati.puglia.it - Luoghi di interesse turistico, culturale, naturalistico (dataset #9)
- licenza: CC0 (unica fonte in CC0, compatibile anche con il caricamento dei metadati su Wikidata)
- 2.149 beni architettonici/paesaggistici e musei, tra cui: abbazie, castelli, chiese, palazzi storici, grotte, spiagge, laghi
- con la ripartizione di beni tra province documentata nel report
2. dati.lombardia.it - Architetture della Regione Lombardia (dataset #2)
- licenza: Creative Commons Attribuzione 4.0 Internazionale (CC BY 4.0)
- 17.778 beni architettonici, tra cui: castelli, chiese, monasteri, palazzi, torri, ville
- con la ripartizione di beni tra province documentata nel report
3. dati.regione.sardegna.it - Schede di catalogazione di architettura - A 3.00 (dataset #4)
- licenza: Creative Commons Attribuzione 4.0 Internazionale (CC BY 4.0)
- 3.657 beni architettonici e paesaggistici, tra cui: cappelle, chiese, fontane, insediamenti religiosi complessi
- con la ripartizione di beni tra province documentata nel report
4. dati.emilia-romagna.it - Arte e Cultura (dataset #12)
- licenza: Creative Commons Attribuzione 2.5 Italia (CC BY 2.5 IT)
- 4.333 beni tra cui: abbazie, monasteri, santuari; archi, porte, mura, portici; architettura moderna; castelli, torri, campanili; chiese, pievi, battisteri; opere artistiche; piazze, logge, vie storiche; siti archeologici; ville, dimore, teatri storici
- con la ripartizione di beni tra province documentata nel report
Altre fonti
Fonti in CC0
Alto Adige
- daten.buergernetz.bz.it - Servizi web del Catalogo dei Beni Culturali in Alto Adige
[NOTA: si segnala in quanto unica altra fonte disponibile con CC0, ma NON SONO PRESENTI MONUMENTI, SOLO REPERTORIO DI OPERE MUSEALI]
Altre fonti in ordine di stima qualità/interesse
(licenza CC BY 4.0, salvo ove diversamente indicato)
Lombardia
- Beni culturali Bella Lombardia. NOTA: il dataset non presenta coordinate geografiche per tutte le voci; laddove si intendesse integrare l’informazione mancante, si potrebbe valutare l’integrazione con alcuni dataset affini disponibili sul portale open data lombardo:
- Mappa beni culturali della Lombardia [basato sul dataset Beni Culturali Bella Lombardia]
- Beni Culturali architettonici nel Comune di Codogno [mappa con vista estendibile a tutti i comuni]
Sardegna
- Schede di catalogazione di monumenti e complessi archeologici - MACA 3.00
- Anagrafe degli Istituti e Luoghi della cultura
- Schede di catalogazione di opere e oggetti d'arte
ICCD
- dati.beniculturali.it - Catalogo ICCD (progetto ArCo)
Sicilia
- dati.sicilia.it - Castelli (CC BY SA 4.0)
- dati.sicilia.it - Torri costriere (CC BY SA 4.0)
- dati.sicilia.it - Siti archeologici
- dati.sicilia.it - Parchi e aree archeologiche
Campania
- dati.regione.campania - Alberi Monumentali Della Campania
- hetor.it - Castelli e torri costiere (Regione Campania)
Lazio
- dati.lazio.it - Schede dei beni architettonici nella regione Lazio
- dati.lazio.it - Fototeca del Centro Regionale di Documentazione
Si segnala inoltre la disponibilità di dataset contenenti dati esclusivamente cartografici, sebbene non siano stati inclusi tra le fonti da promuoversi alla fase di data integration, in quanto carenti appunto di alcuni metadati necessari per il progetto:
- Geoportale Regione Calabria [dataset vari in tema in tema “vincoli”]
- Vincoli Regione Liguria - Carta Regionale Informatizzata [mappa interattiva su beni vincolati; la scheda che raccoglie i dati descrittivi sul vincolo e sul bene - in html - ed eventuali allegati - in pdf - non è una risorsa disponibile come open data]
- . Sito archeologico (Marche)
- Sottosistema Storico-Culturale (Marche)
- Edificio o manufatto storico (Marche)
- Vincolo paesistico (D.Lgs.42/2004) (Marche)
Documenti correlati
Cartella nextcloud
Su google drive
- Data Scouting Patrimonio Culturale su Wiki - WMIT https://docs.google.com/spreadsheets/d/1xtW_6Lrvi59gvBF4G-wvpI_NSHJDg-80nu72o2VaR7o/edit?usp=sharing
- Copertura geografica dati OLAF https://docs.google.com/spreadsheets/d/1KFyLbQaj9UVDKcSxgIESsz-rViwpnnzUCwt1fZxH8W8/edit?usp=sharing
Progetti correlati
A inizio 2022, preliminarmente al progetto Dati Regione Lombardia, il dataset delle Architetture della Regione Lombardia risulta rilasciato con Licenza CC0, permettendo così il versamento del dataset in Wikidata senza vincoli. A seguito della chiusura del progetto pilota, si è aperto un dialogo con la Regione Puglia per rendere il dataset "Luoghi di interesse turistico, culturale, naturalistico" compatibile con Wikidata vista l'Italian Open Data License 2.0 (IODL 2.0), e quindi replicare il format del progetto.