Utente:Sannita/Aggiornamenti personali

Da Wikimedia Italia.
< Utente:Sannita
Versione del 14 set 2013 alle 13:16 di Sannita (Discussione | contributi) (note personali)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Jump to navigation Jump to search

Obbiettivo

Integrare i codici delle schede di autorità del SBN (e se ce le abbiamo i corrispettivi codici VIAF) in Wikidata.

Obbiettivo secondario (come in "se capita, sennò non è affar nostro"): aiutare l'ICCU a uscire dall'isolamento nel VIAF, suggerendo a Max Klein di unificare i record.[1]

Benefici attesi

  • Creazione di un collegamento fra i progetti WMF (tramite Wikidata) e il SBN (che potrebbe diventare fonte per una lunga serie di dati)
  • Creazione di una lista di potenziali voci enciclopediche per Wikipedia (SBN ha anche le fonti nelle sue schede di autorità)
  • Possibilmente, un accordo fra WMI e ICCU per approfondire la collaborazione

Modus operandi

  1. Unificare le due liste di partenza --> Yes check.png Fatto limitatamente alla lettera A, Wip.jpg In corso per il resto
  2. Ottenere una prima lista (ridotta) di schede con cui iniziare a lavorare --> Wip.jpg In corso
  3. Verificare quante delle schede di partenza hanno una voce corrispondente su Wikipedia
  4. Trasformare i link a Wikipedia in link a Wikidata
  5. Ottenere una lista finale (XML?) in cui a ogni codice SBN corrisponde un link a Wikidata (e possibilmente al VIAF)
  6. Far correre il bot
  7. Ripetere le operazioni per ogni successivo aggiornamento dei dati

Situazione

Abbiamo due liste di partenza:

  1. circa 42000 record con identità SBN = VIAF, ma senza nomi (ottenuta da VIAF);
  2. circa 6600 record con identità SBN = nomi, ma senza VIAF (ottenuta da SBN).

Entrambe le liste sono di livello 97, ossia di massimo livello di qualità certificato dall'ICCU.

Con sprezzo del pericolo (e delle possibilità di farmi venire il tunnel carpale a 28 anni), ho unito a mano le due liste. Mentre le univo, mi sono accorto che circa 270 record della seconda lista non avevano un corrispettivo nel VIAF, per due motivi:

  1. parte dei record sono pseudonimi o alias, dunque redirigono alla scheda corretta;
  2. parte dei record non sono stati comunicati al VIAF per ragioni a me sconosciute.[2]

Attualmente, sto spulciando – sempre a mano – questi 270 record per cercare di ottenere qualche altro codice. Per il momento, ne ho ottenuti circa una sessantina, ma conto di aumentare sensibilmente l'output.

Indicativamente, avremo una lista di partenza di circa 6500 record con cui passare al punto 3 ("quanti di questi record hanno una voce su Wikipedia?").

Statistiche

Tutte le statistiche sono aggiornate a: 13:16, 14 set 2013 (CEST)

  • 41 codici SBN sono già stati controllati e rimossi dalla lista (tutti e 41 fatti a mano);[3]
  • 6356 codici SBN sono pronti per essere verificati via bot (dato che prevedo crescerà ancora fino a 6400, perlomeno);
  • 194 codici SBN sono attualmente sotto scrutinio manuale (e che per il 99% finiranno nelle voci da verificare via bot);
  • 12 codici SBN presentano "problemi" di varia natura.
  • 38811 codici SBN necessitano ancora di un nome (dato in lentissima decrescita).

Note

  1. Questo non dipende da noi, ma dalle possibilità (o più prosaicamente, dalla voglia di lavorare) di Max.
  2. E che, tutto sommato, non ci interessa sapere.
  3. Per quanto possa interessare, ho anche creato una nuova voce su Wikipedia (it:Mino Argentieri), a conferma che possiamo sfruttare questa collaborazione per ampliare il nostro patrimonio di voci.