Wikimania 2023/SPARQL: access and analyze data from Wikidata

Da Wikimedia Italia.
Jump to navigation Jump to search

Cose da sapere per fare query semplici su Wikidata. Per fare una ricerca su Wikidata tramite query si parte dal sito query.wikidata.org (il link si trova anche nella sidebar di Wikidata). Nota: negli esempi, il testo preceduto da # è un commento che non interferisce con il codice della query (si possono inserire commenti anche nel query service).

Innanzitutto bisogna dire al query service cosa vogliamo ottenere come risultato. Lo si può fare inserendo una riga contenente la keyword SELECT seguita dalle variabili di nostro intresse.

Ad esempio, se vogliamo come risultato della nostra query una colonna con gli identificativi wikidata (quelli che iniziano con Q):

SELECT ?item


A questo punto bisogna scegliere quali elementi estrarre dal database di Wikidata e possiamo farlo utilizzando la keyword WHERE e delle semplici parentesi graffe. Ad esempio, se volessi solo ed esclusivamente tutti i gatti domestici presenti su Wikidata dovrei scrivere la riga

?item wdt:P31 wd:Q146.


dove ?item è una variabile, wdt: una proprietà (P31 = istanza di) e wd: uno specifico valore (Q146 = gatto domestico) per la proprietà. Questi tre elementi formano una tripla. È fondamentale il punto alla fine della riga.

Combinata alla riga SELECT vista prima, avremo quindi:

SELECT ?item
WHERE {
?item wdt:P31 wd:Q146.
}

▶️ Prova la query!

A questo punto abbiamo ottenuto un risultato machine readable, ma noi poveri umani vediamo solo un elenco di Q e numeri. Possiamo però chiedere gentilmente di restituire, insieme ai codici identificativi, anche le etichette in una lingua specifica (proviamo con l'italiano e, come alternativa, l'inglese). Bisogna quindi aggiungre un ?itemLabel alla prima riga (quella che inizia con SELECT) e introdurre una nuova riga, all'interno delle parentesi graffe della keyword WHERE, con una nuova keyword: SERVICE seguita da una stringa (che si può non imparare a memoria, basta copiarla dalle query di esempio, come quella dei gatti).

SELECT ?item ?itemLabel
WHERE {
?item wdt:P31 wd:Q146.
SERVICE wikibase:label { bd:serviceParam wikibase:language "it,en". }
}

▶️ Prova la query!

Al posto di it possiamo inserire [AUTO_LANGUAGE] per far sì che di default l'etichetta compaia nella lingua dell'interfaccia dell'utente (se esiste, altrimenti passa alla seconda scelta, in questo caso inglese (en) che può essere sostituta con il codice di qualsiasi lingua. Si possono inserire ulteriori lingue come terza quarta, quinta scelta, separandole sempre con una virgola (I codici lingua utilizzabili sono quelli ISO 639-1 e ISO 639-2). Esempio:

SELECT ?item ?itemLabel
WHERE {
?item wdt:P31 wd:Q146.
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr,de,it". }
}

▶️ Prova la query!


Fin'ora abbiamo visto come estrarre elementi che rispettano una sola condizione (nel caso sopra, tutti i gatti domestici → istanza di = gatto domestico). Ma possiamo ovviamente fare richieste leggermente più complesse.

Per esempio, se volessimo cercare tutti i poeti (occupazione = poeta; P106 = Q49757) di cittadinanza italiana (Paese di cittadinanza = Italia; P27 = Q38), dovremmo inserire due righe diverse nella parentesi graffe del WHERE, anziché una sola:

SELECT ?item ?itemLabel
WHERE {
?item wdt:P106 wd:Q49757. #tutti i poeti
?item wdt:P27 wd:Q38. #tutti i cittadini italiani
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}

▶️ Prova la query!

In questo modo il risultato mostrerà tutti e solo gli elementi che rispettando entrambe le condizioni: poeti E cittadini italiani.


E se invece volessimo cercare elementi che rispettano una condizione OPPURE un'altra? Seguiamo l'esempio dei poeti: non ci interessano più solo i poeti con cittadinanza italiana, ma anche quelli con cittadinanza portoghese. In questo caso, dobbiamo introdurre una nuova keyword: UNION.

SELECT ?item ?itemLabel
WHERE {
?item wdt:P106 wd:Q49757. #tutti i poeti
{ ?item wdt:P27 wd:Q38. } #tutti i cittadini italiani
UNION
{ ?item wdt:P27 wd:Q45. } #tutti i portoghesi
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}

▶️ Prova la query!

Da notare che UNION va inserito tra due righe chiuse in parentesi graffe, sempre all'interno delle graffe del WHERE.