Differenze tra le versioni di "Utente:Sannita/Aggiornamenti personali"

Da Wikimedia Italia.
Jump to navigation Jump to search
(aggiornamento)
m (ha spostato Utente:Sannita/ICCU a Utente:Sannita/Aggiornamenti personali: cambiamo radicalmente utilità)
(Nessuna differenza)

Versione delle 10:20, 11 apr 2014

Situazione

Abbiamo due liste di partenza:

  1. circa 42000 record con identità SBN = VIAF, ma senza nomi (ottenuta da VIAF);
  2. circa 6600 record con identità SBN = nomi, ma senza VIAF (ottenuta da SBN).

Entrambe le liste sono di livello 97, ossia di massimo livello di qualità certificato dall'ICCU.

Con sprezzo del pericolo (e delle possibilità di farmi venire il tunnel carpale a 28 anni), ho unito a mano le due liste. Mentre le univo, mi sono accorto che circa 270 record della seconda lista non avevano un corrispettivo nel VIAF, per due motivi:

  1. parte dei record sono pseudonimi o alias, dunque redirigono alla scheda corretta;
  2. parte dei record non sono stati comunicati al VIAF per ragioni a me sconosciute.[1]

Dopo aver controllato a mano anche questi record e aver impiegato qualche altro trucco per rosicchiare qualche altro numero, ho ottenuto una lista iniziale di 6539 schede di autorità. Molte di queste hanno sicuramente una voce su Wikipedia, anzi ne ho viste tante che hanno addirittura un riferimento a essa nel campo "fonte".

Ora sto provando a capire come funziona lo script di Cristian per cercare di risolvere il resto della prima lista (grazie Cris!), così almeno la parte preliminare del lavoro è risolta. Nel frattempo, sto ricavando i primi dati pronti da essere dati in pasto a Wikidata.

Obbiettivi

  • Integrare i codici delle schede di autorità del SBN (e se li abbiamo, i corrispettivi codici VIAF) in Wikidata.
  • Obbiettivo secondario (come in "se capita, sennò non è affar nostro"): aiutare l'ICCU a uscire dall'isolamento nel VIAF, suggerendo a Max Klein di unificare i record.[2]

Benefici attesi

  • Creazione di un collegamento fra i progetti WMF (tramite Wikidata) e il SBN (che potrebbe diventare fonte per una lunga serie di dati).
  • Creazione di una lista di potenziali voci enciclopediche per Wikipedia (SBN ha anche le fonti nelle sue schede di autorità).
  • Possibilmente, un accordo fra WMI e ICCU per approfondire la collaborazione.

Modus operandi

  1. Unificare le due liste di partenza --> Yes check.png Fatto limitatamente alla lettera A, Wip.jpg In corso per il resto
  2. Ottenere una prima lista (ridotta) di schede con cui iniziare a lavorare --> Yes check.png Fatto
  3. Verificare quante delle schede di partenza hanno una voce corrispondente su Wikipedia --> Wip.jpg In corso
  4. Trasformare i link a Wikipedia in link a Wikidata --> Wip.jpg In corso
  5. Ottenere una lista finale (XML?) in cui a ogni codice SBN corrisponde un link a Wikidata (e possibilmente al VIAF)
  6. Far correre il bot
  7. Ripetere le operazioni per ogni successivo aggiornamento dei dati

Statistiche

Tutte le statistiche sono aggiornate a: 18:36, 21 nov 2013 (CET)

  • 58 codici SBN sono già stati controllati e rimossi dalla lista (tutti fatti a mano);[3][4]
  • 152 codici SBN sono pronti per essere importati su Wikidata;
  • 24 codici SBN presentano "problemi" di varia natura e sono stati inseriti in una lista a parte;
  • 6374 codici SBN sono in fase di verifica (sto cercando di sistemare la cosa tramite OpenRefine);
  • 37651 codici SBN necessitano ancora di un nome (dato in lentissima decrescita).

Note

  1. E che, tutto sommato, non ci interessa sapere.
  2. Questo non dipende da noi, ma dalle possibilità (o più prosaicamente, dalla voglia di lavorare) di Max.
  3. Per quanto possa interessare, ho anche creato due nuove voci su Wikipedia (it:Mino Argentieri ed it:Epaminonda Abate) e ne ho pianificata una terza (it:Angelo Abbene), a conferma che possiamo sfruttare questa collaborazione per ampliare il nostro patrimonio di voci.
  4. Dimenticavo: 14 di questi non sono stati trasmessi al VIAF e uno di questi ha un problema per cui bisogna informare l'ICCU.