Wikimania 2024/Report/Epìdosis

Da Wikimedia Italia.
Jump to navigation Jump to search

Grazie a una borsa di partecipazione "Alessio Guidetti" ho potuto partecipare a Wikimania 2024 a Katowice. È stata la mia terza Wikimania, dopo Esino Lario 2016 e Stoccolma 2019 (anche a quest’ultima mi recai grazie a una borsa di partecipazione "Alessio Guidetti", cfr. relazione).

Pre-conferenza

Con Anna Clara Maniero Azzolini (anche lei beneficiaria di una borsa di partecipazione "Alessio Guidetti") il 6 agosto abbiamo partecipato a una visita presso il Planetarium di Katowice; la qualità dei video proiettati nel planetario era molto pregevole, purtroppo il primo video era commentato in diretta soltanto in polacco, mentre il secondo video (registrato) poteva essere ascoltato oltre che in polacco anche in inglese e in ucraino. Notevoli l’immenso parco circostante e la funivia che lo attraversa, lunga oltre 2 km.

Conferenza

Mercoledì 7 agosto

Sessione estremamente pregevole: documenta in tutti i dettagli (per quanto possibile nel tempo a disposizione) un esempio, ancora rarissimo, di un corso universitario comprendente una parte su Wikidata, in questo caso di carattere prosopografico (un tema al quale sono personalmente molto interessato). Moltissimi spunti sono davvero pregevoli e ampiamente applicabili anche a progetti non riguardanti Wikidata, in particolare le tre lessons learned citate alla fine: l’importanza di creare collaborazioni con educatori (soprattutto in ambito universitario) sui progetti Wikimedia; i materiali per i corsi che si tengono sui progetti Wikimedia vanno rilasciati in licenza libera per garantirne un ampio riuso; per assicurarsi che tale riuso sia davvero ampio, questi materiali vanno infine condivisi su molteplici canali, in modo da renderli facilmente trovabili dagli interessati (quindi non solo su Commons, ma anche almeno Zenodo – che assegna loro un DOI – e siti esterni di ambito universitario; possibilmente anche descrivere il progetto in una o più pubblicazioni scientifiche).

L’intervento, ben fatto, riassume un recente articolo scientifico dei due relatori (Quantifying Americanization: Coverage of American Topics in Different Wikipedias). L’idea di usare Wikidata per individuare gli elementi relativi in qualche modo agli Stati Uniti d’America e poi vedere quante voci di Wikipedia erano connesse a tali elementi è sicuramente uno studio statistico di grande interesse sociologico, che, come accennavano gli autori, potrebbe essere (mutatis mutandis) applicato anche a molti altri ambiti, per vedere il loro peso relativo nelle varie Wikipedie e quindi nelle comunità linguistiche che esse rappresentano. Ovviamente ci sono alcuni caveat che i relatori hanno sottolineato: molte Wikipedie non sono riconducibili a un preciso stato (es. pl.wikipedia si riconduce in linea di massima alla Polonia, ma es.wikipedia si può ricondurre alla Spagna ma anche a gran parte dell’America centrale e meridionale); l’attività di creazione massiva di voci da parte di bot (es. su ur.wikipedia) può essere la causa di outlier inattesi; inoltre, se si scegliesse di analizzare un argomento meno esteso degli Stati Uniti d’America, sarebbe più facile che i risultati venissero fortemente influenzati anche dall’attività di singoli utenti molto interessati a quel tema (es. – che aggiungo io – l’attività di singoli utenti nello scrivere notevoli quantità di voci sull’antica Grecia in ca.wikipedia, fi.wikipedia e sk.wikipedia; posso infatti dire con una certa sicurezza che l’ampio numero di voci su queste Wikipedie riguardo all’antica Grecia è sicuramente fuori scala rispetto all’interesse del pubblico generale di questi paesi, o anche della comunità accademica di questi paesi, per l’antica Grecia).

Conferenza di estremo interesse: passa in rassegna diverse posizioni filosofiche sulla possibilità, e soprattutto sulla modalità di creazione di una lingua universale, da Raimondo Lullo a oggi; infine mostra come il progetto di Abstract Wikipedia sta cercando di affrontare questa sfida. Tra gli aspetti salienti: la necessità di ridurre la lingua a grammatica + lessico, eliminando le sue altre parti (funzionalmente inutili ai fini della creazione di contenuto enciclopedico); di conseguenza, l’importanza dei lessemi e della possibilità di calcolare meccanicamente da essi le forme (vedasi i dati lessicografici in Wikidata e le funzioni che stanno già venendo create su Wikifunctions per automatizzare la creazione delle forme, finora fatta quasi soltanto manualmente); la rilevanza delle immagini per giungere a una comprensione il più possibile uniforme dei significati legati ai significanti. Rilevante la riflessione lasciata nell’ultima slide: è davvero desiderabile una lingua universale, soprattutto nell’ottica di dare adeguato spazio anche ai punti di vista delle minoranze? (citando: Will the Basque Wikipedia be written by “the wisest man in London”?).

Ottimo tutorial su OpenRefine, Asaf Bartov si conferma un grandissimo divulgatore; essendo tutto fatto in diretta (e ci sono state davvero molte domande dal pubblico), è stato interessante vedere come Asaf abbia gestito anche gli inconvenienti tecnici, o i problemi di data modeling in Wikidata che sono emersi in più momenti, traendone sempre spunti utili per spiegare meglio il funzionamento di OpenRefine stesso e/o di Wikidata. Indubbiamente ha raggiunto il suo scopo: mostrare quanto OpenRefine sia uno strumento potente per lavorare su dataset (di qualità più o meno soddisfacente) da riconciliare con Wikidata e così invogliare il pubblico a usarlo in futuro e a non temerne la complessità, anche perché (come proprio Asaf ha detto) si tratta di uno strumento provvisto di un’ottima documentazione, e che continua a dotarsi di nuove funzionalità. Lo sviluppatore di OpenRefine era presente in sala ed è stato ringraziato di persona per il suo lavoro.

Partecipo su suggerimento di Asaf Bartov incontrato in corridoio e non me ne pento. Le due relatrici espongono i loro sforzi nell’ultimo anno in Romania per coinvolgere più contributori, soprattutto contributrici, nella scrittura di biografie femminili su ro.wikipedia; le biografie mancanti sono state censite utilizzando Wikidata, specificamente Listeria.

Alla fine mi fermo a parlare con una delle relatrici, Claudia Serbanuta, riguardo a possibili strumenti per incrementare la presenza di elementi riguardanti autrici rumene e moldave su Wikidata, dove la loro presenza è attualmente molto ridotta (rispetto es. ad autrici di altri paesi europei, anche est-europei come es. Repubblica Ceca, Slovenia, Polonia) a causa della sostanziale assenza di buoni authority file o siti biografici che possano fungere da base attendibile per creare tali elementi.

Apertura come sempre molto ricca di contenuti (forse un pochino troppo, la lunghezza verso la fine si comincia a sentire). Sempre interessanti, e quest’anno direi anche presentati con una certa brillantezza, i premi per i wikimediani dell’anno; scopro che DerHexer (mio collega nello user group WikiClassics) è anche lo steward attivo da più tempo.

  • 19:30-21:45 festa di apertura

Organizzata nella stessa enorme sala dove si pranza, molto piacevole (anche se non così dissimile dai pranzi, in effetti).

Parlo a lungo con Miguel Mimoso Correia (bibliotecario presso la Biblioteca Nazionale Portoghese) delle sperimentazioni sull’uso di Wikibase per le voci di autorità presso varie biblioteche nazionali europee e in generale dell’interrelazione tra Wikidata e authority file, tema di cui mi sono molto occupato negli ultimi quattro anni e del quale avevo parlato ai Wikidata Days a Lisbona nel novembre 2023.

Giovedì 8 agosto

Lydia Pintscher, portfolio lead per Wikidata presso WMDE, espone in modo molto chiaro i problemi del Wikidata Query Service (WDQS) e come stanno venendo affrontati, in particolare tramite il noto graph split che dovrebbe essere lanciato ufficialmente entro fine agosto e poi dovrebbe diventare definitivo (ossia il grafo unico dovrebbe essere dismesso) a distanza di sei mesi dal lancio. Fondamentali, a mio parere, anche gli sforzi per ridurre le ridondanze all’interno dei dati di Wikidata tramite vari metodi (i due menzionati da Lydia sono i più significativi, e urgenti: il codice linguistico mul per etichette e alias, che sarà ufficialmente rilasciato entro fine agosto dopo moltissimi mesi di lavoro, e le descrizioni automatiche generate coll’aiuto di Wikifunctions, che si spera di attuare durante il 2025).

Parlo poi con Nicolas Vigneron dell’importanza di ridurre i dati ridondanti in Wikidata, intervenendo anche in particolare sulle dichiarazioni che duplicano, in tutto o in parte, le medesime informazioni; scopriamo di aver lavorato entrambi alla riduzione di tali ridondanze nelle ultime settimane.

Il mio primo vero approccio a Wikifunctions, progetto Wikimedia lanciato il 26 luglio 2023. È effettivamente complesso, anche se un po’ meno di quanto mi aspettassi, e ovviamente richiede di saper programmare (al momento in Javascript o Python; altri linguaggi di programmazione potrebbero essere aggiunti in futuro) per scrivere nuove implementazioni di funzioni o migliorare quelle esistenti. Tuttavia mi colpisce soprattutto la potenza dello strumento: raccogliere pezzetti di codice in grado di svolgere funzioni molto precise può essere di straordinario aiuto sia all’interno dei progetti Wikimedia (es. per ottimizzare il funzionamento di template, moduli ecc.) sia all’esterno per aiutare i programmatori. Il principale dubbio che mi resta è stato espresso da una domanda per pubblico: come evitare che la stessa funzione venga duplicata perché scritta in modi molto simili da più utenti che magari potrebbero non accorgersi che esiste già semplicemente con un’etichetta diversa. Moltissimo resta ancora da fare, in particolare: permettere alle funzioni di richiamarsi a vicenda e permettere di utilizzare i dati di Wikidata (sia “normali” sia lessicografici). Riesco a scrivere la mia prima funzione (https://www.wikifunctions.org/view/it/Z18531), da perfezionare comunque come scrivo nella pagina di discussione relativa.

Scrivo a d:User:Mahir256 proponendogli, dopo la discussione con Nicolas Vigneron, di creare un WikiProject in Wikidata per ridurre le ridondanze dei dati, a vari livelli; già dopo poche ore Mahir256 ha creato il progetto (d: Wikidata:WikiProject Redundancy), al quale ho cominciato nei giorni successivi ad aggiungere ulteriore documentazione nei momenti liberi.

Condotto da Lydia Pintscher, occasione di confronto sempre utile, soprattutto per risegnalare alcuni bug spiacevoli e ridomandare alcune nuove funzioni che sarebbero utili; intervengo con cinque domande su Wikidata e Wikibase Cloud (menziono in particolare i seguenti ticket Phabricator: T246731, T312718, T207705; per quest’ultimo concordo colla scelta degli sviluppatori di non implementare l’estensione EDTF in Wikidata, poiché non sarebbe facile gestire la compresenza di due diversi datatype per i dati cronologici). Incontro forse un po’ meno partecipato di quanto mi sarei aspettato.

Venerdì 9 agosto

Il relatore parla della sua esperienza presso l’Università di Rochester e di come secondo lui i club studenteschi potrebbero essere un ottimo strumento per convincere in modo duraturo una percentuale rilevante di studenti universitari a diventare wikipediani. Presentazione molto chiara e ricca di spunti utili, in particolare su come gestire un club studentesco per mantenerlo attivo nel corso del tempo; ovviamente molto radicata nella realtà universitaria statunitense, dove in particolare i club studenteschi hanno un’importanza, anche dovuta al loro riconoscimento ufficiale da parte delle università e ai fondi che da esse ricevono, che in Italia (e credo, più in generale, in molti stati europei) non hanno.

Parla principalmente il programmatore dell’InternetArchiveBot (IABot), che ha svolto un ruolo cruciale negli ultimi quasi dieci anni per mantenere verificabili moltissimi link usati come fonti nelle varie Wikipedie; ricostruisce bene come funziona il bot, come il suo ambito di attività si è gradualmente espanso nel corso degli anni e come pensa di migliorarlo ulteriormente nel futuro prossimo.

Tra i desiderata più importanti (ne discuto poi brevemente con lui alla fine della sessione, in corridoio) c’è l’adattamento dell’IABot ad agire anche su Wikidata (e in generale sulle wiki che usano il software Wikibase), visto che attualmente la sua attività ivi è stata molto limitata e sperimentare, e al tempo stesso un numero sempre maggiore di Wikipedie (tra cui spicca, per sistematicità, Wikipedia in italiano) stanno facendo affidamento sempre maggiore su Wikidata, es. per centralizzare i link ai siti ufficiali (ma si pensi anche a un altro esempio: se un infobox usa dati tratti da Wikidata, e quindi mostra anche i riferimenti che in Wikidata sostengono tali dati, attualmente se un link in tali riferimenti si rompe esso non viene archiviato perché il bot non trova quel link in locale su una Wikipedia …).

Discussione col pubblico sul futuro di Toolforge, abbastanza tecnica; interessante soprattutto che emerga, come sempre, l’importanza di incoraggiare i creatori dei tool a permettere anche ad altri sviluppatori di aiutarli nella manutenzione di tali tool, per migliorare la sostenibilità del sistema ed evitare colli di bottiglia; si tratta, a giudicare dagli interventi in sala, di un problema molto sentito soprattutto per tool molto usati (es. su tutti QuickStatements), i cui malfunzionamenti possono impattare molto negativamente sui workflow di numerosi utenti.

Si parla delle attività di ricerca presso WMF per valutare opportunità e rischi dell’uso dell’AI nei progetti Wikimedia; emergono tante idee diverse, ma al momento ancora poco di concreto.

Discuto poi col socio Alessandro Marchetti e con d:User:DrThneed riguardo ad alcuni punti tuttora oggetto di discussione riguardo a come modellare i dati sui ricercatori in Wikidata; rivedo con Alessandro Marchetti la nostra presentazione del giorno seguente.

Keynote interessante per il modo in cui delinea possibili sviluppi positivi dell’AI per sostenere, anziché danneggiare, la diversità linguistica e culturale.

Sabato 10 agosto

Ottima visione di insieme sul primo anno di vita, sulle condizioni attuali e sugli sviluppi imminenti del progetto Wikifunctions; rafforza ulteriormente l’interesse che mi era stato instillato dal workshop.

Workshop interessante per confrontarsi su come si potrebbe usare l’AI per fornire ai lettori delle rielaborazioni dei contenuti di Wikipedia: riassunti, mappe concettuali o semplici liste di voci correlate, mappe ecc. Si discute della desiderabilità di queste ipotesi e di quanto e come gli utenti di Wikipedia dovrebbero poter materialmente modificare questi contenuti generati dall’AI; ci si divide in gruppi e alla fine ciascun gruppo espone le proprie riflessioni.

La presentazione è tenuta dal socio Alessandro Marchetti (che aveva presentato la submission) e da me; il pubblico sembra interessato.

Interessante come sempre il Coolest Tool Award; molto pregevole l’orchestra dei wikimediani. Segue, nello spazio antistante il centro congressi, la tradizionale foto di gruppo.

  • 19-23 festa conclusiva

Si svolge presso l’Orchestra sinfonica della Radio nazionale polacca, sede molto suggestiva.

Dalle 21:30 alle 23 nello spazio antistante l’edificio parlo di nuovo con d:User:DrThneed, stavolta dell’interconnessione tra authority file e Wikidata e in particolare dei noti problemi di clusterizzazione del VIAF.

Impressioni generali e conclusioni

Partendo dalla logistica: l’International Congress Centre (ICC) di Katowice dove si è svolta Wikimania è stata una sede molto buona, pur con alcuni piccoli difetti dovuti direi più alla gestione dell’evento che all’edificio in sé (aria condizionata un po’ troppo forte; mancanza, al secondo piano – dove si svolgevano quasi tutte le sessioni – di una mappa delle varie stanze che era invece presente ma molto meno utile al piano terra; stanze spesso troppo piccole per il numero di partecipanti alle sessioni, costretti quindi a stare in piedi o a sedersi a terra); ottima l’enorme sala principale dove si svolgevano i pranzi. Cibo a mio parere buono, con una scelta abbastanza ampia anche per i celiaci, sia nei rinfreschi sempre disponibili durante la giornata sia durante i pranzi. I controlli di sicurezza all’ingresso erano molto efficienti.

Sulle sessioni: nel programma quelle riguardanti Wikidata erano un numero inferiore rispetto a Stoccolma 2019, ma è comprensibile visto che in questi anni ci sono stati molti eventi (soprattutto online) appositamente dedicati a Wikidata; la qualità delle sessioni che ho seguito è stata in generale molto buona; sono forse mancati un pochino degli spazi per incontri informali tra utenti, ma si potevano comunque trovare buoni spazi per parlare e discutere negli ampi corridoi dell’edificio.

Ho avuto infine il piacere di ritrovare molti utenti dal resto del mondo che avevo conosciuto a Stoccolma 2019 o in successivi eventi internazionali, e di conoscerne altri con cui non avevo mai parlato. Ho potuto anche passare molto tempo coll’ampio gruppo di utenti italiani presenti, più di venti, discutendo come quanto visto nelle sessioni potrà essere usato nei nostri progetti nel futuro prossimo. Desidero concludere sottolineando come Wikimania sia sempre un evento che, soprattutto grazie ai suoi partecipanti, è capace di trasmettere una straordinaria positiva, mostrando come un ampio numero di persone (quest’anno oltre mille da ben più di cento paesi) molto diverse tra loro possano collaborare per la promozione della conoscenza libera, ottenendo risultati importanti e talvolta difficilmente pronosticabili. Spero di poter far tesoro ancora una volta di questa energia.

Note

  1. 1,0 1,1 1,2 Nota: non avendo trovato posto a sedere, ho avuto alcune difficoltà nel seguire colla massima attenzione.