Microgrant/2018/Scansioni da BNCF per rari Salgari/Relazione

Da Wikimedia Italia.
< Microgrant‎ | 2018‎ | Scansioni da BNCF per rari Salgari
Versione del 5 ago 2022 alle 14:44 di Dario Crespi (Discussione | contributi)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Jump to navigation Jump to search

Pubblicazione delle scansioni

Per mia fortuna, l'ineffabile Alex Brollo si è buttato a capofitto su questo blocco di Salgari appena viste le immagini. Ha fatto lui tutto il lavoro:

In particolare, Alex

  1. ha suddiviso le immagini (ogni foto contiene due pagine) e le ha salvate in bianco e nero (con ScanTailor),
  2. poi le ha unite in PDF con image2pdf per comodità di caricamento in Internet Archive,
  3. usando IA-upload ha caricato il DjVu in Commons,
  4. ha eseguito il "match & split" in Wikisource.

La procedura è stata delineata con maggior precisione in s:Utente:Alex brollo/Resoconto di una importazione 2018.

BNCF non ci fornisce i TIFF a questo prezzo, ma riducendo le immagini in bianco e nero l'OCR viene abbastanza bene. Mantenendo i colori, invece, l'OCR non dava quasi nessun risultato, anche per via del rumore di fondo e delle pagine non dritte. È stato considerato anche unpaper, ma alla fine è bastato ScanTailor.

Alex ha poi creato le pagine indice e le pagine in namespace principale e cominciato qualche rilettura. Nel far ciò ha scoperto qualche pagina mancante, che ho potuto chiedere e ottenere prontamente da Gap/BNCF.

Il 27 dicembre 2018 abbiamo ricevuto le ulteriori scansioni del secondo lotto. Entro gennaio 2019, tutte le scansioni del secondo lotto sono state caricate su IA e su Commons e sono state create su Wikisource le pagine Indice relative. Il processo di proofreading è cominciato (per le opere già presenti come testi senza scansioni, è già stato effettuato il Match and Split).

Le scansioni hanno confermato la veridicità delle schede di catalogo per quanto riguarda le illustrazioni, cioè che erano fuori testo e in fogli a parte (c. di tav. o "carte di tavole" in gergo). È stato quindi possibile "sbiancare" tali pagine in Wikimedia Commons senza ridurre l'integrità delle immagini a fronte.

Per alcuni dettagli tecnici vedi questa pagina su Wikisource.

Opere rese disponibili

Le opere si trovano nella collezione itwikisource di Internet Archive nonché in Wikimedia Commons (categoria) e si possono rileggere dalle pagine indice:

Ne è stata data notizia nella lista associazione.

L'elenco rende pressoché esaustiva la collezione delle opere di Salgari come visibili alla pagina s:Autore:Emilio Salgari, con 105 testi per 100 titoli. Risultano mancanti solo due romanzi, non disponibili alla biblioteca nazionale centrale.

Costi

A consuntivo, il primo lotto è costato 492,45 € e il secondo 566,65 € (i 70 € di differenza sono stati coperti da una donazione di Nemo). Dall'elenco delle opere (richiede accesso a IA) risultano 5315 pagine scansionate e caricate in Internet Archive.

Il costo medio imputatoci da Gap Srl (operatori delle riproduzioni di BNCF) è quindi di leggermente meno di 0,20 €/pagina. Tale importo è inferiore sia a 0,35 €/A3 sia a 0,25 €/A4 perché la maggior parte delle scansioni ci sono state tariffate come A3 per due facciate e quindi il costo è la metà di 0,35 € per ciascuna facciata nella maggior parte dei casi.

Uso delle scansioni

Le immagini sono in uso nelle rispettive pagine di Wikisource (oltre 5000 ad aprile 2019, simile al numero totale di pagine scansionate come da sopra).

Ad aprile 2019 risulta che le pagine principali dei primi volumi caricati hanno visite mensili nell'ordine delle centinaia, mentre i volumi più recenti sono nell'ordine delle decine. Nel dettaglio, usando MassViews su liste create manualmente, saranno note le visite alle pagine in namespace principale (oltre 3000 a marzo 2019 per il primo lotto) e il numero di visite a tutte le pagine (idem). I conteggi non sono disponibili in TreeViews causa un baco e similmente MassViews non conta i namespace diversi dal principale in Wikisource.

L'obiettivo di raggiungere 1000 visite mensili entro 6 mesi dal caricamento è ampiamente superato.

Il numero di visite alla pagina dell'autore appare invece costante nell'ordine delle 300-400 al mese per i mesi fuori picco, come all'inizio del 2018 prima di questo progetto. Ciò suggerisce che i visitatori arrivano alle pagine dei libri senza passare da quella dell'autore e che le visite aggiuntive alle opere non percolano necessariamente a pagine vicine come quella dell'autore. Del resto non era un nostro obiettivo aumentarle. Nel frattempo le visite alla voce in Wikipedia sembrano scese e in Wikiquote sembrano cresciute, ma c'è una certa volatilità, quindi è difficile dimostrare alcuna causalità o assenza di correlazione.

Alcuni dei volumi sono stati "divorati" durante le iniziative di rilettura (o la rilettura del mese o il compleanno di Wikisource), ma diversi volumi restano disponibili per la rilettura in classe o all'interno di altri progetti scolastici, come ci eravamo prefissi, quindi anche questo scopo va considerato raggiunto.

Passi successivi al progetto

Sarà interessante vedere in futuro l'uso dei libri nelle iniziative di rilettura e scolastiche, come ipotizzato nel piano. L'associazione ha mostrato interesse e la comunità ha inserito alcune delle opere fra le riletture consigliate.