Caricamento dei dati dei luoghi della cultura del MiBACT su WikiData 2018 per Wiki Loves Monuments

Da Wikimedia Italia.
Jump to navigation Jump to search
Caricamento dei dati dei luoghi della cultura del MiBACT su WikiData 2018 per Wiki Loves Monuments
Stato
Concluso
Sito web
Report su WikiData
Categoria
Sostegno ai volontari, Wiki Loves Monuments
Delibere del direttivo
Associazione:Delibere/2018/Lavori propedeutici a Wiki Loves Monuments
Inizio
2018
Fine
2018
Budget
8.540 €
Fornitore
Synapta, AlessioMela
Volontari
Nemo_bis (volunteer) and Laurentius (volunteer)


Descrizione del progetto

Il MiBACT pubblica in linked open data i cosiddetti “luoghi della cultura”, ovvero dati riguardanti i beni culturali immobili italiani e le manifestazioni culturali organizzate dal Ministero e dagli altri Istituti. Lo scopo del progetto è quello di interrogare l'endpoint SPARQL http://dati.beniculturali.it/sparql, estraendo con un programma le informazioni delle circa 25.000 (26.899 alla data odierna) entità di classe http://dati.beniculturali.it/cis/CulturalInstituteOrSite.

In particolare il software dovrà raccogliere, dove presenti:

  • label e label alternative
  • descrizione
  • identificativo MiBACT
  • coordinate
  • indirizzo
  • tipo
  • argomento
  • dati di contatto (telefono, email, sito web)

Delle circa 6.500 immagini presenti si valuterà l'inserimento del solo riferimento tramite link o il caricamento del file su Commons.

Il fulcro del progetto consiste nello sviluppo di un bot e dell'algoritmo per stabilire se ogni luogo della cultura sia o meno già presente su Wikidata, e dunque se la relativa entità vada creata ex novo o aggiornata (e rispetto a quali proprietà, creando eventualmente nuove asserzioni con relativa fonte, in caso di discordanza).

Più analiticamente, a partire dai dati raccolti (in particolare: label, coordinate e indirizzo), un bot per Wikibase caricherà su Wikidata le entità, aggiornando gli item già presenti o creandone di nuovi, prediligendo nei casi dubbi una possibile duplicazione delle entità (riconciliabili ex-post dalla comunità). I dati saranno inseriti mappando l'ontologia del MiBACT con quella di Wikidata, aggiungendo il riferimento Q26971668 (bene culturale italiano) a P1435 (stato del patrimonio) per facilitare successive interrogazioni.

Il lavoro include un primo ciclo completo di importazione di tutti i luoghi della cultura attualmente presenti sul portale dati.beniculturali.it, ma sarà possibile in futuro utilizzare il codice per caricare automaticamente su Wikidata nuovi aggiornamenti che dovessero rendersi disponibili.

Terminata l'importazione dei dati, verrà fornita a Wikimedia Italia un'interfaccia per cercare velocemente i beni culturali presenti in un determinato comune (attraverso le API SPARQL di Wikidata), così composta:

Infine, a scopo dimostrativo, si convertirà la lista presente nella pagina w:it:Progetto:Wiki_Loves_Monuments_2017/Monumenti/Piemonte/Città_metropolitana_di_Torino da tabella manuale a tabella automatica attraverso il template w:it:Template:Wikidata list o una soluzione equivalente.

Il software verrà rilasciato su Github con licenza MIT.