Visualizzazioni del patrimonio culturale dei comuni italiani sui progetti Wikimedia

Da Wikimedia Italia.
Jump to navigation Jump to search
Comuni italiani sui progetti Wikimedia
Stato
concluso
Cartella
Cartella su nextcloud Wikimedia Italia
Categoria
Ricerca, WLM
Ruolo di Wikimedia Italia
Committente e finanziatore
Delibere del direttivo
Nell'ambito del progetto Il patrimonio culturale italiano su Wikipedia, i progetti Wikimedia e OpenStreetMap
Inizio
Dicembre 2020
Budget
Nel budget di Il patrimonio culturale italiano su Wikipedia, i progetti Wikimedia e OpenStreetMap + una parte di 11.590 €
Fornitore
Synapta (referente Giorgio Bevilacqua)
Volontari
Iolanda Pensa, ideazione e responsabile all'interno di Il patrimonio culturale italiano su Wikipedia, i progetti Wikimedia e OpenStreetMap
Referente Wikimedia Italia
Marta Arosio, Erica Pedone
Attività correlate
Data-driven community engagement per Wiki Loves Monuments
Nuvola apps xmag.png Per approfondire, vedi anche Data-driven community engagement per Wiki Loves Monuments

Visualizzazioni del patrimonio culturale dei comuni italiani sui progetti Wikimedia sono una serie di visualizzazioni realizzate nel 2020-2021 nell'ambito del progetto Il patrimonio culturale italiano su Wikipedia, i progetti Wikimedia e OpenStreetMap. Le visualizzazioni fotografano la situazione italiana con dati di novembre 2020.

Link agli strumenti e alle visualizzazioni


Visualizzazioni dei comuni italiani

Visualizzazioni dei comuni italiani per regione

Dati sui singoli comuni

Report e documentazione su Wikimedia Commons

Documentazione completa su Wikimedia Commons

Analisi dei Comuni italiani: Report e manuale. Fonti e legenda 13 novembre 2020

Introduzione

Il presente report descrive le attività svolte da Synapta nell’ambito del progetto Patrimonio culturale su Wikipedia per l’analisi delle voci dei comuni italiani (in lingua italiana e in lingua inglese).

Fonti

ISTAT

I dati sono stati corretti per il comune di Pesaro che dal 1 luglio 2020 ha incorporato il comune di Monteciccardo.

Si ha un totale di 7903 comuni.

Wikidata

Selezione dei comuni italiani con estrazione di:

  • Coordinate geografiche
  • Codice ISTAT
  • Voce per wikipedia in lingua italiana
  • Voce per wikipedia in lingua inglese

Nei risultati in lingua italiana è stato necessario correggere il dato da “Roma Capitale” (Q3940419) a “Roma” (Q220).

Nei risultati in lingua inglese è stato necessario correggere il dato da “Municipality of Ventotene” (Q1085906) a “Ventotene” (Q128230), perché semplice reindirizzamento.

Non esiste invece alcuna voce per “Borca di Cadore” (Q40801), perché reindirizzamento a https://en.wikipedia.org/wiki/Province_of_Belluno#Comuni

API di Wikipedia

Per ogni comune sono stati estratti i dati della pagina in formato XML per parse con parametri templates images sections wikitext sia in italiano sia in inglese:

In questo modo si hanno dati già standardizzati per l’esame della pagina.

Sono stati estratti in formato XML anche i dati delle revisioni (action=revisions) per ogni comune, in modo da poterne seguire l’evoluzione nell’ultimo anno.

Dati estratti

Foglio condiviso con i dati https://docs.google.com/spreadsheets/d/1qdWsd563JldXXGLdebBUJHg-UD5XrV5KqwGobABBXjk/

Foglio “ISTAT”

Tabella della ripartizione geografica ricavata da fonte ISTAT.

Foglio “ISTAT popolazione”

Tabella della popolazione per comune al 31 dicembre 2019.

Si è considerato il totale della popolazione.

Foglio “Wikidata”

  • ID

identificativo Wikidata

  • Istat

Codice ISTAT (P635)

  • etichetta

etichetta in lingua italiana

  • lat, lon

coordinate geografiche (P625)

  • it.wiki

voce su it.wikipedia.org

  • en.wiki

voce su en.wikipedia.org

Fogli “it dati” e “en dati”

Le due tabelle hanno lo stesso formato

  • Voce
    • ISTAT: Codice ISTAT (riproposto solo per facilitare collegamenti tra tabelle)
    • Titolo: Titolo della voce
    • pDim: Dimensioni della pagina, calcolata come lunghezza in byte del testo contenuto in <wikitext>
  • Media, dati estratti da <images> suddividendo i dati per le principali estensioni
    • svg, numero di immagini in formato SVG
    • jpg, numero di immagini in formato JPG
    • png, numero di immagini in formato PNG
    • gif, numero di immagini in formato GIF
    • tif, numero di immagini in formato TIF
    • mAltri, numero di immagini o media in altri formati
  • Riferimenti
    • nNum, conteggio di marcatori di note <ref> presenti nel testo
    • bDim, dimensione in byte della sezione Bibliografia della voce
    • bNum, numero di punti elenco presenti nella sezione Bibliografia della voce (numero di occorrenze di un asterisco all’inizio di una riga)
  • Monumenti e luoghi d’interesse, estrazione delle sezioni di primo e di secondo livello che contengono riferimenti utili.
    • In italiano: 'Altri monumenti', 'Architettur', 'Arte', 'Attrattive turistiche', 'Castello', 'Castelli', 'Chies', 'Cultura - Luoghi d', 'Da vedere', 'Da visitare', 'Edifici', 'Frazioni, chiese e palazzi', 'Gli edifici', 'La chiesa ', 'Luoghi d', 'Monumenti', 'Museo', 'Musei', 'Parrocchi', 'Patrimonio artistico', 'Storia e luoghi d', 'Storia ed Architettura', 'Strutture e luoghi d', 'Testimonianze'.
    • In inglese: 'Archaeological', 'Architectural', 'Architecture', 'Attractions', 'Buildings', 'Church', 'Cityscape', 'Landmarks', 'Main attractions', 'Main landmarks', 'Main sights', 'Main sites', 'Monuments', 'Museum', 'Palaces', 'Statues', 'Townscape'
    • mNum, numero di sezioni
    • mSezioni, titoli delle sezioni separati da barra verticale |
    • mDim, dimensione totale in byte delle sezioni
    • mImm, numero delle immagini (SVG, JPG, PNG, GIF e TIF presenti nelle sezioni)
  • Voci di qualità/Voci in vetrina
    • qTipo
      • 1: presenza del template voci di qualità / good article
      • 2: presenza del template voci in vetrina / featured article
  • Avvisi, presenza del template per i seguenti avvisi (italiano / inglese)
    • aNum, numero totale degli avvisi presenti
    • C / Verify source/Verify sources (non c’è esatta traduzione del template)
    • Correggere / Copy edit
    • Curiosità / Trivia
    • D / Split
    • E / Notability
    • F / Unreferenced
    • NN / No footnotes
    • Organizzare / Cleanup
    • P / POV
    • Recentismo / Recentism
    • S / Stub
    • Senza fonte / Citation needed
    • Tmp / Infobox requested
    • W / Wikify

Fogli “it monumenti” e “en monumenti”

Nelle due tabelle è riportata la frequenza dei titoli delle sezioni relative a monumenti e luoghi d’interesse.

Fogli “it dimensioni” e “en dimensioni”

Nelle due tabelle è riportata la dimensione in byte della pagina di ogni comune italiano (rispettivamente in lingua italiana e in lingua inglese) alla fine di ogni mese da ottobre 2019 a ottobre 2020.

La colonna finale var % mostra la variazione percentuale al 31 ottobre 2020 rispetto al valore al 31 ottobre 2019. La variazione percentuale massima (+765,98%) è data dal comune di Garzeno (CO), mentre quella minima (-69,73%) dal comune di Biandrate (NO).

Grafici

Sono stati creati grafici sulla base dei dati estratti https://public.tableau.com/views/Monumenti_16049236443380/ComuniitalianisuWikipedia

Sono state create quattro mappe

  1. Dimensioni pagina e numero immagini [it]
  2. Dimensioni pagina e numero immagini [en]
  3. Dimensioni pagina e sezione monumenti [it]
  4. Dimensioni pagina e sezione monumenti [en]

Le mappe presentano appositi filtri per individuare le caratteristiche dei comuni in rapporto alla popolazione e alla dimensione della pagina.

Tramite grafici a barre si sono individuate inoltre le caratteristiche delle pagine dei comuni suddivise per regione:

  • dimensione media della pagina
  • numero medio di immagini presenti
  • dimensione della sezione monumenti e luoghi d’interesse
  • numero di note e numero di righe della bibliografia

I valori medi maggiori sono dati dalla regione Puglia, seguita da Abruzzo, Emilia-Romagna, Liguria e Sicilia. I più bassi si hanno per il Piemonte. Restringendo l’osservazione ai soli comuni fino a 3000 abitanti, i valori medi maggiori si hanno per Abruzzo, Emilia-Romagna e Puglia.

Sono stati controllati anche gli avvisi presenti nelle pagine, con una preponderanza del template F (“Questa voce o sezione non cita le fonti necessarie o quelle presenti sono insufficienti.”). In questo caso è l’Umbria la regione con la maggior percentuale di voci che presentano avvisi, mentre la Valle d’Aosta presenta quella minore. Considerando i dati ai comuni fino a 3000 abitanti, la Lombardia ha il maggior numero medio di avvisi per pagina, mentre la Campania ha la maggior percentuale di voci con template F.

Infine, sempre su base regionale, è riportata la variazione media per pagina in byte rispetto alle dimensioni presenti alla fine di ottobre 2019 (sia per wikipedia in lingua italiana sia per wikipedia in lingua inglese).

A fine ottobre 2020 la variazione media massima si riscontra per l’Emilia Romagna, mentre Molise e Basilicata mostrano una variazione media nulla. Anche per i soli comuni fino a 3000 abitanti, l’Emilia Romagna ha avuto nettamente la variazione media maggiore.

Documentazione correlata

Cartella su nextcloud con copia di tutta la documentazione

Documenti su google drive