Differenze tra le versioni di "Microgrant/2018/Scansioni da BNCF per rari Salgari/Relazione"

Da Wikimedia Italia.
Jump to navigation Jump to search
(Utente:Alex brollo/Resoconto di una importazione 2018)
Riga 18: Riga 18:
 
== Pubblicizzazione delle opere disponibili==
 
== Pubblicizzazione delle opere disponibili==
  
Ancora da fare nelle liste WMI ecc.
+
Le opere si trovano [https://archive.org/search.php?query=collection%3Aitwikisource%20sponsor%3A%22Wikimedia%20Italia%22 nella collezione itwikisource di Internet Archive] e si possono rileggere dalle pagine indice:
 +
*[[s:Indice:Salgari - Il Re dell'Aria.djvu]]
 +
*[[s:Indice:Salgari - Nel paese dei ghiacci.djvu]]
 +
*[[s:Indice:Salgari - Al polo australe in velocipede.djvu]]
 +
*[[s:Indice:Salgari - Il re della prateria.djvu]]
 +
*[[s:Indice:Salgari - Il tesoro del presidente del Paraguay.djvu]]
 +
*[[s:Indice:Salgari - La Costa d'Avorio.djvu]]
 +
*[[s:Indice:Salgari - Un dramma nell'Oceano Pacifico.djvu]]
 +
*[[s:Indice:Salgari - Il re della montagna.djvu]]
  
 
== Uso delle scansioni ==
 
== Uso delle scansioni ==

Versione delle 14:36, 23 ott 2018

Pubblicazione delle scansioni

Per mia fortuna, l'ineffabile Alex Brollo si è buttato a capofitto su questo blocco di Salgari appena viste le immagini. Ha fatto lui tutto il lavoro:

In particolare, Alex

  1. ha suddiviso le immagini (ogni foto contiene due pagine) e le ha salvate in bianco e nero (con ScanTailor),
  2. poi le ha unite in PDF con image2pdf per comodità di caricamento in Internet Archive,
  3. usando IA-upload ha caricato il DjVu in Commons,
  4. ha eseguito il "match & split" in Wikisource.

La procedura è stata delineata con maggior precisione in s:Utente:Alex brollo/Resoconto di una importazione 2018.

BNCF non ci fornisce i TIFF a questo prezzo, ma riducendo le immagini in bianco e nero l'OCR viene abbastanza bene. Mantenendo i colori, invece, l'OCR non dava quasi nessun risultato, anche per via del rumore di fondo e delle pagine non dritte. È stato considerato anche unpaper, ma alla fine è bastato ScanTailor.

Ha poi creato le pagine indice e le pagine in namespace principale e cominciato qualche rilettura. Nel far ciò ha scoperto qualche pagina mancante, che ho potuto chiedere e ottenere prontamente da Gap/BNCF.

Pubblicizzazione delle opere disponibili

Le opere si trovano nella collezione itwikisource di Internet Archive e si possono rileggere dalle pagine indice:

Uso delle scansioni

Come anticipato, non prevediamo di occuparci direttamente dell'uso a posteriori di queste opere. Vedi prossimi passi sotto.

Le statistiche saranno verificate dopo alcuni mesi, come indicato.

Prossimi passi

Sarebbe opportuno procedere cogli altri libri mancanti di Salgari, visto che il costo è analogo e il processo è ormai oliato, quindi potrebbe ripagare di piú l'investimento di tempo fatto da Alex.

È importante ovviamente usare i libri nelle iniziative di rilettura e scolastiche, come ipotizzato nel piano. Ne discuteremo nelle liste associative come scritto sopra.