Microgrant/2018/Scansioni da BNCF per rari Salgari/Relazione
Pubblicazione delle scansioni
Per mia fortuna, l'ineffabile Alex Brollo si è buttato a capofitto su questo blocco di Salgari appena viste le immagini. Ha fatto lui tutto il lavoro:
In particolare, Alex
- ha suddiviso le immagini (ogni foto contiene due pagine) e le ha salvate in bianco e nero (con ScanTailor),
- poi le ha unite in PDF con image2pdf per comodità di caricamento in Internet Archive,
- usando IA-upload ha caricato il DjVu in Commons,
- ha eseguito il "match & split" in Wikisource.
La procedura è stata delineata con maggior precisione in s:Utente:Alex brollo/Resoconto di una importazione 2018.
BNCF non ci fornisce i TIFF a questo prezzo, ma riducendo le immagini in bianco e nero l'OCR viene abbastanza bene. Mantenendo i colori, invece, l'OCR non dava quasi nessun risultato, anche per via del rumore di fondo e delle pagine non dritte. È stato considerato anche unpaper, ma alla fine è bastato ScanTailor.
Alex ha poi creato le pagine indice e le pagine in namespace principale e cominciato qualche rilettura. Nel far ciò ha scoperto qualche pagina mancante, che ho potuto chiedere e ottenere prontamente da Gap/BNCF.
Entro gennaio 2019, tutte le scansioni del secondo lotto sono state caricate su IA e su Commons e sono state create su Wikisource le pagine Indice relative. Il processo di proofreading è cominciato (per le opere già presenti come testi senza scansioni, è già stato effettuato il Match and Split).
Le scansioni hanno confermato la veridicità delle schede di catalogo per quanto riguarda le illustrazioni, cioè che erano fuori testo e in fogli a parte (c. di tav. o "carte di tavole" in gergo). È stato quindi possibile "sbiancare" tali pagine in Wikimedia Commons senza ridurre l'integrità delle immagini a fronte.
Per alcuni dettagli tecnici vedi questa pagina su Wikisource.
Opere disponibili
Le opere si trovano nella collezione itwikisource di Internet Archive e si possono rileggere dalle pagine indice:
- s:Indice:Salgari - Il Re dell'Aria.djvu
- s:Indice:Salgari - Nel paese dei ghiacci.djvu
- s:Indice:Salgari - Al polo australe in velocipede.djvu
- s:Indice:Salgari - Il re della prateria.djvu
- s:Indice:Salgari - Il tesoro del presidente del Paraguay.djvu
- s:Indice:Salgari - La Costa d'Avorio.djvu
- s:Indice:Salgari - Un dramma nell'Oceano Pacifico.djvu
- s:Indice:Salgari - Il re della montagna.djvu
Ne è stata data notizia nella lista associazione.
Il 27 dicembre 2018 abbiamo ricevuto le ulteriori scansioni del secondo lotto.
Uso delle scansioni
Come anticipato, non prevediamo di occuparci direttamente dell'uso a posteriori di queste opere. Vedi prossimi passi sotto.
Le statistiche saranno verificate dopo alcuni mesi, come indicato. Sarà possibile avere da TreeViews il numero di visite alle pagine in namespace principale e il numero di visite a tutte le pagine (bachi permettendo).
Prossimi passi
È importante ovviamente usare i libri nelle iniziative di rilettura e scolastiche, come ipotizzato nel piano. L'associazione ha mostrato interesse e la comunità ha inserito alcune delle opere fra le riletture consigliate.