Data scouting - ricerca di dati aperti sul patrimonio culturale italiano 2021

Da Wikimedia Italia.
Versione del 2 feb 2023 alle 14:10 di Marta Arosio (Discussione | contributi)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Jump to navigation Jump to search
Data scouting - ricerca di dati aperti sul patrimonio culturale italiano 2021
Stato
Concluso
Relazione
Sessione Relazione finale lavoro di ricerca di seguito
Categoria
contenuti liberi, ricerca, Wiki Loves Monuments
Ruolo di Wikimedia Italia
Sostegno economico
Inizio
2020
Fine
2021
Budget
Nel budget di Il patrimonio culturale italiano su Wikipedia, i progetti Wikimedia e OpenStreetMap
Fornitore
Synapta (referente Giorgio Bevilacqua)
Volontari
Iolanda Pensa all'interno di Il patrimonio culturale italiano su Wikipedia, i progetti Wikimedia e OpenStreetMap
Referente Wikimedia Italia
Marta Arosio


Una ricerca sui dati aperti realizzata nel 2020 da Synapta ha mostrato come i migliori dataset disponibili sono al momento:

  1. dati.puglia.it
  2. dati.lombardia.it - Architetture della Regione Lombardia (dataset #2)
  3. dati.regione.sardegna.it - Schede di catalogazione di architettura - A 3.00 (dataset #4)
  4. dati.emilia-romagna.it - Arte e Cultura (dataset #12)

I dati sono poi stati oggetto di caricamento attraverso lo strumento OLAF.

Relazione finale lavoro di ricerca

Metodologia

Report sul data scouting realizzato nel 2021

Lo scouting è stato svolto effettuando analisi dei dataset a tema cultura/turismo/territorio presenti all’interno dei ​ portali open data regionali​, come pure dei dataset messi a disposizione a livello nazionale dal ​MIBACT​.

Nel corso dello scouting sono state privilegiate ​ fonti dato distribuite con licenza CC zero​ in ottica dell’integrazione dei dati su pagine Wikidata (es: dati.puglia.it - Luoghi di interesse turistico, culturale, naturalistico). In subordine, sono state valutate fonti distribuite con ​ licenze CC più restrittive di CC0​ in ottica di ​ semplice interlinking con Wikidata ​ (non compatibili quindi per il caricamento su Wikidata dei metadati descrittivi dei beni culturali).

Tra le fonti dato rilevanti sono state incluse solo quelle che disponevano di ​ risorse immediatamente open data​; sono stati esclusi quindi siti web o portali che presentassero schede sui beni culturali unicamente sotto forma di pagine html.

Dal punto di vista del contenuto informativo, sono state privilegiate le fonti che contengono un numero significativo di beni appartenenti alle tipologie di beni individuate come di interesse per il progetto (quindi, principalmente “monumenti”, “beni architettonici” o altro di interesse per Wiki Loves Monuments).

Struttura del report tabellare

Il ​ Report tabellare sul data scouting​, con un elenco di 20 fonti accessibili e metadatate è disponibile al seguente link: https://docs.google.com/spreadsheets/d/1xtW_6Lrvi59gvBF4G-wvpI_NSHJDg-80nu72o2VaR7o/edit#gid=105460182 Data Scouting Patrimonio Culturale su Wiki - WMIT

Il report è composto da 2 tabelle​. La prima ​ “Lista dataset”​, riporta principalmente informazioni su su licenze, numero di beni, referenti, modalità e tempistiche di accesso al dataset. In particolare:

  • Titolo del dataset
  • Regione/Prov Autonoma/Altro ente
  • Descrizione testuale del dataset
  • Tipologia di beni rappresentati
  • Numero di beni rappresentati
  • Numero di beni di interesse
  • Licenza
  • Titolare
  • Mail del referente
  • Home page del progetto/portale di riferimento
  • Localizzazione sorgente dati
  • URL accesso diretto al dataset
  • Modalità di collegamento al file
  • Estensione del file
  • Data di rilascio
  • Data di ultimo aggiornamento
  • Tempistiche di aggiornamento dei dati
  • Data di ultimo accesso al dataset
  • Note scouting

La seconda tabella (“​Check metadati​”) riporta informazioni sulla presenza di metadati catalografici, in particolare:

  • Codice identificativo
  • Localizzazione
  • Indirizzo
  • Coordinate Geografiche
  • Immagine
  • Descrizione
  • Data di produzione
  • Autore
  • Link dataset/Sample scheda

Analisi fonti

4 fonti che sono state valutate come le più adatte per il passaggio alla fase di data integration (su cui proponiamo di configurare l’interfaccia di interlinking OLAF), per numero e qualità dei beni rappresentati, oltre che per disponibilità di licenze compatibili:

1. dati.puglia.it - Luoghi di interesse turistico, culturale, naturalistico (dataset #9)

  • licenza: CC0 ​ (​unica fonte in CC0​, compatibile anche con il caricamento dei metadati su Wikidata)
  • 2.149​ beni architettonici/paesaggistici e musei, tra cui: abbazie, castelli, chiese, palazzi storici, grotte, spiagge, laghi
  • con la ripartizione di beni tra province documentata nel report

2. dati.lombardia.it - Architetture della Regione Lombardia (dataset #2)

  • licenza: Creative Commons Attribuzione 4.0 Internazionale (CC BY 4.0)
  • 17.778 ​ beni architettonici, tra cui: castelli, chiese, monasteri, palazzi, torri, ville
  • con la ripartizione di beni tra province documentata nel report

3. dati.regione.sardegna.it - Schede di catalogazione di architettura - A 3.00 (dataset #4)

  • licenza: Creative Commons Attribuzione 4.0 Internazionale (CC BY 4.0)
  • 3.657​ beni architettonici e paesaggistici, tra cui: cappelle, chiese, fontane, insediamenti religiosi complessi
  • con la ripartizione di beni tra province documentata nel report

4. dati.emilia-romagna.it - Arte e Cultura (dataset #12)

  • licenza: Creative Commons Attribuzione 2.5 Italia (CC BY 2.5 IT)
  • 4.333​ beni tra cui: abbazie, monasteri, santuari; archi, porte, mura, portici; architettura moderna; castelli, torri, campanili; chiese, pievi, battisteri; opere artistiche; piazze, logge, vie storiche; siti archeologici; ville, dimore, teatri storici
  • con la ripartizione di beni tra province documentata nel report

Altre fonti

Fonti in CC0

Alto Adige

  • daten.buergernetz.bz.it - Servizi web del Catalogo dei Beni Culturali in Alto Adige

[​NOTA​: si segnala in quanto unica altra fonte disponibile con CC0, ma NON SONO PRESENTI MONUMENTI, SOLO REPERTORIO DI OPERE MUSEALI]

Altre fonti in ordine di stima qualità/interesse

(licenza CC BY 4.0, salvo ove diversamente indicato)

Lombardia

  • Beni culturali Bella Lombardia. NOTA: il dataset non presenta coordinate geografiche per tutte le voci; laddove si intendesse integrare l’informazione mancante, si potrebbe valutare l’integrazione con alcuni dataset affini disponibili sul portale open data lombardo:
  • Mappa beni culturali della Lombardia [basato sul dataset Beni Culturali Bella Lombardia]
  • Beni Culturali architettonici nel Comune di Codogno [mappa con vista estendibile a tutti i comuni]

Sardegna

  • Schede di catalogazione di monumenti e complessi archeologici - MACA 3.00
  • Anagrafe degli Istituti e Luoghi della cultura
  • Schede di catalogazione di opere e oggetti d'arte

ICCD

  • dati.beniculturali.it - Catalogo ICCD (progetto ArCo)

Sicilia

  • dati.sicilia.it - Castelli (CC BY SA 4.0)
  • dati.sicilia.it - Torri costriere (CC BY SA 4.0)
  • dati.sicilia.it - Siti archeologici
  • dati.sicilia.it - Parchi e aree archeologiche

Campania

  • dati.regione.campania - Alberi Monumentali Della Campania
  • hetor.it - Castelli e torri costiere (Regione Campania)

Lazio

  • dati.lazio.it - Schede dei beni architettonici nella regione Lazio
  • dati.lazio.it - Fototeca del Centro Regionale di Documentazione

Si segnala inoltre la disponibilità di dataset contenenti dati esclusivamente cartografici​, sebbene non siano stati inclusi tra le fonti da promuoversi alla fase di data integration, in quanto carenti appunto di alcuni metadati necessari per il progetto:

  1. Geoportale Regione Calabria [dataset vari in tema in tema “vincoli”]
  2. Vincoli Regione Liguria - Carta Regionale Informatizzata [mappa interattiva su beni vincolati; la scheda che raccoglie i dati descrittivi sul vincolo e sul bene - in html - ed eventuali allegati - in pdf - non è una risorsa disponibile come open data]
  3. . Sito archeologico (Marche)
  4. Sottosistema Storico-Culturale (Marche)
  5. Edificio o manufatto storico (Marche)
  6. Vincolo paesistico (D.Lgs.42/2004) (Marche)

Documenti correlati

Cartella nextcloud

Su google drive

Progetti correlati

A inizio 2022, preliminarmente al progetto Dati Regione Lombardia, il dataset delle Architetture della Regione Lombardia risulta rilasciato con Licenza CC0, permettendo così il versamento del dataset in Wikidata senza vincoli. A seguito della chiusura del progetto pilota, si è aperto un dialogo con la Regione Puglia per rendere il dataset "Luoghi di interesse turistico, culturale, naturalistico" compatibile con Wikidata vista l'Italian Open Data License 2.0 (IODL 2.0), e quindi replicare il format del progetto.