Primo bando 2022 per progetti dei volontari/Catalogazione di epigrafi e iscrizioni dell Antica Roma presenti in Italia

Da Wikimedia Italia.
Jump to navigation Jump to search

Catalogazione di epigrafi e iscrizioni dell'Antica Roma presenti in Italia.

Contesto

Un prosieguo della collaborazione con il gruppo WikiClassics. Lo scorso anno, su proposta di Gian Francesco Esposito, fu impostata una collaborazione del gruppo WikiClassics (affiliato di WMF dal 2019) con Wikimedia Italia (e la supervisione di Wikimedia Svizzera) per un primo progetto di valorizzazione della lingua latina.

Il tema della lingua latina e della cultura classica in generale è intrinsecamente transnazionale e per questo si è deciso di porlo al centro come filo conduttore delle varie proposte Wikidata in virtù della natura multilinguistica della piattaforma. La pagina del progetto è https://www.wikidata.org/wiki/Wikidata:Testi_latini. Il progetto “Testi Latini” è stato pensato per migliorare varie porzioni degli elementi relativi alla lingua latina su Wikidata, producendo ordine progressivo in vari settori e in seguito anche in altre piattaforme (in primis Commons e Wikisource in varie lingue).

Il progetto si focalizza in generale su aspetti che normalmente non verrebbero trattati in modo esaustivo o in breve tempo dalla comunità dei volontari, o che al momento raggiungono sulle piattaforme standard più bassi di qualità rispetto a altre aree tematiche. Il suo scopo è agevolare lavoro specifico che altrimenti i volontari porterebbero avanti in modo frammentario e disomogeneo, creando ordine e buone pratiche che possano poi estendersi ad altri settori. Non è prevista una priorità delle varie azioni proposte (per esempio nella pagina di discussione si è abbozzata anche una proposta sui classicisti), il progetto focalizza la propria attività in base alle risorse mobilitabili.

Nel corso del 2020-2021 nella prima porzione di lavoro finanziata da WMI si sono affrontati gli autori in lingua latina, che è il primo passo necessario per ordinare in futuro tutti i testi in questa lingua. Il lavoro era particolarmente necessario soprattutto per i testi medievali ed ha richiesto mesi di lavoro manuale.

Nel corso di questa prima fase del progetto si è comunque anche esplorato il tema delle iscrizioni in ambito archeologico con un’analisi della situazione come si può leggere sul rapporto consegnato a WMI a fine attività. Poiché il bando attuale proposto da WMI riguarda la valorizzazione del patrimonio culturale italiano, con questa proposta si punta a riprende il tema delle iscrizioni e delle epigrafi in lingua latina partendo dal miglioramento degli elementi relativi a quelle presenti nella penisola Italiana.

Obiettivi

Il target è portare la qualità di catalogazione e descrizione su Wikidata e Commons nel campo delle epigrafi a livelli medio-alti, grazie ai quali l’italia possa essere individuata come esempio virtuoso da parte di altri affiliati e comunità wiki.

Impostare il lavoro attorno a un import di metadati di alta qualità sarebbe una strategia possibile, perché in ambito archeologico ci sono vari database completi e consultabili. Tuttavia i loro contenuti non sono nella licenza appropriata per un import massiccio (via OpenRefine), Per esempio http://sicily.classics.ox.ac.uk/inscriptions/ è completo di metadati per la Sicilia, ma è in CC-BY, non CC-0, mentre https://arachne.uni-koeln.de/arachne/ riporta un copyright esclusivo.

Conseguentemente, il lavoro deve focalizzarsi su cosa manca procedendo a livello manuale. Non si tratta quindi un processo rapido, ma limitatamente all’italia è ancora possibile in un tempo contenuto.

Puntiamo quindi alla rifinitura manuale di tutti gli elementi di epigrafi e iscrizioni in lingua latina dellAntica Roma già presenti su Wikidata, e dei file già presenti su Commons, inclusa la creazione di contenuti ancillari necessari per integrare le due piattaforme. I passaggi sono descritti in dettaglio nella sezione successive.


Azioni

Su Wikimedia Commons

Il punto di partenza è creare categorie specifiche per ogni file (o insieme di file) in https://commons.wikimedia.org/wiki/Category:Ancient_Roman_inscriptions_in_Italy con la massima precedenza per quelle del Corpus Inscriptionum Latinarum.

Per ogni file non ci limiterà solo a migliorare la categorizzazione, ma si passerà al miglioramento degli elementi Wikidata relativi per l’inserimento dell’infobox laterale e anche dei metadati strutturati.

Il miglioramento dei metadati (https://commons.wikimedia.org/wiki/Commons:Structured_data) è particolarmente critico per i file di epigrafi e iscrizioni. Per capire il basso livello di partenza, vedasi il risultato di questa ricerca (https://hay.toolforge.org/sdsearch/#q=haswbstatement:P180=Q669777) e quanti pochi termini individua. Arricchendo di metadati i file, è possibile compiere un altro passo per allineare in futuro la ricerca semantica su Commons in questo settore a database più sofisticati.

Su Wikidata

Tutti gli elementi già presenti (al momento solo una ventina secondo Wikidata Query Service) o individuati da Wikimedia Commons vanno migliorati sotto vari punti.

  1. A livello di descrizione, etichette e alias si deve in particolare iniziare e completare il processo di standardizzazione di questi aspetti almeno per degli elementi del Corpus Inscriptionum Latinarum fra cui l’uso del numerale romano e dello 0 nel riempimento dei codici numerici. Si deve pertanto aprire una discussione e poi procedere all’applicazione dello standard su tutti elementi esistenti, ottenuto sia tramite feedback o tramite silenzio-assenso sulla proposta iniziale.
  2. P18 (immagine) e P373 (categoria di Commons) devono essere correttamente riportate ove possibile.
  3. Eventuali coordinate di geolocalizzazione se presenti su Commons vanno riportate sugli elementi, assieme alle proprietà relative all’entita amministrativa e alla collocazione: P7859 (Paese storico), P276 (ubicazione), P17 (paese), P131 (località amministrativa)
  4. : Fondamentale nell’ambito del progetto sono le proprietà relative ai testi: si deve quindi procedere all’inserimento di tali elementi di P282 (sistema di scrittura), P1684 (iscrizione) e P7008 (testo non abbreviato). Per farlo è auspicabile anche in questo caso discutere gli standard di formattazione e di fonti autorevoli con la comunità; pertanto, è improbabile che sia completato in pochi mesi, ma almeno un centinaio di elementi alla fine del progetto dovranno riportare queste informazioni.
  5. Iniziare l’inserimento di identificativi terzi, anche se in modo manuale e quindi difficilmente con una copertura omogenea, è un altro aspetto del progetto. Per esempio, P7021 (Arachne object ID) anche come riportato nella sezione introduttiva, può essere inserito in primis per ragioni di licenza solo manualmente e non come import massivo. Un altro già presente è P8532 (Trismegistos text ID) usato solo in poco più di 350 item al momento della stesura di questo progetto. Cercando di inquadrare gli elementi da creare è abbastanza naturale incontrare le schede di questi archivi e quindi inserirli come ID.
  6. Nei limiti del possibile bisogna iniziare a separare elementi di artefatti dalle iscrizioni vere e proprie, e anche qua si deve iniziare a discutere di uno standard nei progetti competenti e applicarlo in modo sistematico a quanti più elementi possibile.

L’obiettivo è arrivare a dotare almeno un migliaio elementi Wikidata (ampliati o di nuova creazione) di iscrizioni e epigrafi geolocalizzati in Italia di almeno una decina di dichiarazioni. A quelle elencate si possono aggiungere anche proprietà relative al periodo storico, al materiale e alle dimensioni, ma dipendono molto di più dalle fonti terze disponibili, soprattutto se si creassero meno elementi del previsto si punterebbe a migliorare il livello di quelli presenti al massimo livello di dettaglio.

Spese e soggetti beneficiari

L’unico tipo di spesa necessario sono “compensi a professionisti” per la realizzazione delle attività “oggetto della proposta”. Non è prevista alcuna altra voce di spesa, trattandosi di lavoro personale.

Non sono necessarie “spese utili alla promozione del progetto proposto anche sul web” perché va comunicato solo il risultato finale e per questo bastano i canali di Wikimedia Italia. In aggiunta, i canali sociali di ClassicsWiki sono rodati, soprattutto l’account Twitter, e anche i tre canali sociali dell’account Wikidata in italiano sono mirati su follower che hanno specifico interesse su questi temi. Si aggiungono a quelli di Wikimedia Italia come mezzo di disseminazione.

L’attività avrà la durata di quattro mesi e partirà entro un mese dall’approvazione del finanziamento e sarà svolta da Alessandro Marchetti del gruppo WikiClassics, essendo la persona che ha impostato l’analisi sulle iscrizioni e le epigrafi in lingua latina su Commons e Wikidata nel bando precedente.

Budget

L’importo è stimato in 1000.00 EUR. A norma di bando, è previsto un pagamento diretto previa ricezione della fattura intestata a Wikimedia Italia.