Differenze tra le versioni di "Utente:Sannita/Aggiornamenti personali"

Da Wikimedia Italia.
Jump to navigation Jump to search
m (ha spostato Utente:Sannita/ICCU a Utente:Sannita/Aggiornamenti personali: cambiamo radicalmente utilità)
(zot)
 
Riga 1: Riga 1:
== Situazione ==
+
Situazione aggiornata all'11 aprile 2014
Abbiamo due liste di partenza:
 
# circa 42000 record con identità SBN = VIAF, ma senza nomi (ottenuta da VIAF);
 
# circa 6600 record con identità SBN = nomi, ma senza VIAF (ottenuta da SBN).
 
  
Entrambe le liste sono di livello 97, ossia di massimo livello di qualità certificato dall'ICCU.
+
== EAGLE ==
 +
{{TBD}}
  
Con sprezzo del pericolo (e delle possibilità di farmi venire il tunnel carpale a 28 anni), ho unito '''a mano''' le due liste. Mentre le univo, mi sono accorto che circa 270 record della seconda lista ''non'' avevano un corrispettivo nel VIAF, per due motivi:
+
== ICCU ==
# parte dei record sono pseudonimi o alias, dunque redirigono alla scheda corretta;
+
;Obbiettivo
# parte dei record non sono stati comunicati al VIAF per ragioni a me sconosciute.<ref>E che, tutto sommato, non ci interessa sapere.</ref>
+
* collaborazione all'esportazione di tutti i dati del Servizio Bibliotecario Nazionale (SBN) in linked open data (LOD) {{Fatto}}
 +
* ottenimento di una copia ''funzionante'' di questi dataset, da poter integrare su Wikidata {{Incorso}}
 +
* creazione di un link fra SBN e Wikidata
  
Dopo aver controllato a mano anche questi record e aver impiegato qualche altro trucco per rosicchiare qualche altro numero, ho ottenuto una lista iniziale di 6539 schede di autorità. Molte di queste hanno sicuramente una voce su Wikipedia, anzi ne ho viste tante che hanno addirittura un riferimento a essa nel campo "fonte".
+
;Status attuale
 +
Oltre ai miei compiti lavorativi, sono stato inserito nel gruppo di lavoro ICCU che si sarebbe occupato di questo lavoro.
  
Ora sto provando a capire come funziona lo script di Cristian per cercare di risolvere il resto della prima lista (grazie Cris!), così almeno la parte preliminare del lavoro è risolta. Nel frattempo, sto ricavando i primi dati pronti da essere dati in pasto a Wikidata.
+
Il primo passo è stato stabilire come "tradurre" i campi UNIMARC del database di SBN in FRBRoo (ossia lo standard che si è scelto di utilizzare). Dopo tre mesi di lavoro e qualche campo su cui abbiamo delle perplessità, posso dire che questo primo step è concluso. Abbiamo inviato il nostro lavoro ai tecnici che si dovranno occupare di creare materialmente i dataset e la loro prima reazione è stata positiva.
  
== Obbiettivi ==
+
Al momento, abbiamo una mappatura dei campi dei libri moderni (post-1830) e degli authority file (di cui mi sono personalmente occupato io). Una sintesi molto tecnica di questa prima fase è disponibile [http://mailman.wikimedia.it/pipermail/bibliotecari/2014-March/002820.html qui].
* Integrare i codici delle schede di autorità del SBN (e se li abbiamo, i corrispettivi codici VIAF) in Wikidata.
 
* Obbiettivo secondario (come in "se capita, sennò non è affar nostro"): aiutare l'ICCU a uscire dall'isolamento nel VIAF, suggerendo a Max Klein di unificare i record.<ref>Questo non dipende da noi, ma dalle possibilità (o più prosaicamente, dalla voglia di lavorare) di Max.</ref>
 
  
== Benefici attesi ==
+
== Biblioteca Universitaria Alessandrina ==
* Creazione di un collegamento fra i progetti WMF (tramite Wikidata) e il SBN (che potrebbe diventare fonte per una lunga serie di dati).
+
;Obbiettivo
* Creazione di una lista di potenziali voci enciclopediche per Wikipedia (SBN ha anche le ''fonti'' nelle sue schede di autorità).
+
* donazione di circa 420 testi del XV-XVI secolo già scansionati, da poter integrare su Commons e Wikisource {{Incorso}}
* Possibilmente, un accordo fra WMI e ICCU per approfondire la collaborazione.
 
  
== Modus operandi ==
+
;Status attuale
# Unificare le due liste di partenza --> {{Fatto}} limitatamente alla lettera A, {{Incorso}} per il resto
+
Sono riuscito a ottenere un contatto con la dott.ssa Flavia Cristiano, direttrice della Biblioteca Universitaria Alessandrina di Roma (che fa capo alla Sapienza), scoprendo che loro hanno scansionato negli scorsi anni il quantitativo di libri sopra esposto grazie ai fondi dell'8x1000.
# Ottenere una prima lista (ridotta) di schede con cui iniziare a lavorare --> {{Fatto}}
 
# Verificare quante delle schede di partenza hanno una voce corrispondente su Wikipedia --> {{Incorso}}
 
# Trasformare i link a Wikipedia in link a Wikidata --> {{Incorso}}
 
# Ottenere una lista finale (XML?) in cui a ogni codice SBN corrisponde un link a Wikidata (e possibilmente al VIAF)
 
# Far correre il bot
 
# Ripetere le operazioni per ogni successivo aggiornamento dei dati
 
  
== Statistiche ==
+
Ho già parlato in un paio di occasioni con la Cristiano e lei è pienamente d'accordo con la donazione, confermatomi di persona l'ultima volta. L'ultima volta ho preso tempo, perché eravamo troppo sotto le elezioni del nuovo direttivo (considerando che è cambiato per 3/5, ho fatto bene ad aspettare.
Tutte le statistiche sono aggiornate a: 18:36, 21 nov 2013 (CET)
 
* 58 codici SBN sono già stati controllati e rimossi dalla lista (tutti fatti a mano);<ref>Per quanto possa interessare, ho anche creato due nuove voci su Wikipedia ([[:it:Mino Argentieri]] ed [[:it:Epaminonda Abate]]) e ne ho pianificata una terza ([[:it:Angelo Abbene]]), a conferma che possiamo sfruttare questa collaborazione per ampliare il nostro patrimonio di voci.</ref><ref>Dimenticavo: 14 di questi non sono stati trasmessi al VIAF e uno di questi ha un problema per cui bisogna informare l'ICCU.</ref>
 
* 152 codici SBN sono pronti per essere importati su Wikidata;
 
* 24 codici SBN presentano "problemi" di varia natura e sono stati inseriti in una lista a parte;
 
* 6374 codici SBN sono in fase di verifica (sto cercando di sistemare la cosa tramite OpenRefine);
 
* 37651 codici SBN necessitano ancora di un nome (dato in lentissima decrescita).
 
  
== Note ==
+
La mia idea è che si possa stabilire un accordo scritto simile a quello della Biblioteca La Vigna – ovviamente senza costi né per loro, né per noi. Sono sicuro di avere ancora da qualche parte il documento mandato alla Cristiano, appena posso lo carico/linko qui sopra.
<references />
 

Versione attuale delle 10:39, 11 apr 2014

Situazione aggiornata all'11 aprile 2014

EAGLE

[.TBD.]

ICCU

Obbiettivo
  • collaborazione all'esportazione di tutti i dati del Servizio Bibliotecario Nazionale (SBN) in linked open data (LOD) Yes check.png Fatto
  • ottenimento di una copia funzionante di questi dataset, da poter integrare su Wikidata Wip.jpg In corso
  • creazione di un link fra SBN e Wikidata
Status attuale

Oltre ai miei compiti lavorativi, sono stato inserito nel gruppo di lavoro ICCU che si sarebbe occupato di questo lavoro.

Il primo passo è stato stabilire come "tradurre" i campi UNIMARC del database di SBN in FRBRoo (ossia lo standard che si è scelto di utilizzare). Dopo tre mesi di lavoro e qualche campo su cui abbiamo delle perplessità, posso dire che questo primo step è concluso. Abbiamo inviato il nostro lavoro ai tecnici che si dovranno occupare di creare materialmente i dataset e la loro prima reazione è stata positiva.

Al momento, abbiamo una mappatura dei campi dei libri moderni (post-1830) e degli authority file (di cui mi sono personalmente occupato io). Una sintesi molto tecnica di questa prima fase è disponibile qui.

Biblioteca Universitaria Alessandrina

Obbiettivo
  • donazione di circa 420 testi del XV-XVI secolo già scansionati, da poter integrare su Commons e Wikisource Wip.jpg In corso
Status attuale

Sono riuscito a ottenere un contatto con la dott.ssa Flavia Cristiano, direttrice della Biblioteca Universitaria Alessandrina di Roma (che fa capo alla Sapienza), scoprendo che loro hanno scansionato negli scorsi anni il quantitativo di libri sopra esposto grazie ai fondi dell'8x1000.

Ho già parlato in un paio di occasioni con la Cristiano e lei è pienamente d'accordo con la donazione, confermatomi di persona l'ultima volta. L'ultima volta ho preso tempo, perché eravamo troppo sotto le elezioni del nuovo direttivo (considerando che è cambiato per 3/5, ho fatto bene ad aspettare.

La mia idea è che si possa stabilire un accordo scritto simile a quello della Biblioteca La Vigna – ovviamente senza costi né per loro, né per noi. Sono sicuro di avere ancora da qualche parte il documento mandato alla Cristiano, appena posso lo carico/linko qui sopra.