GLAM/Musei/Museo egizio di Torino/Relazione

Da Wikimedia Italia.
Jump to navigation Jump to search

Relazione Progetto Museo Egizio di Torino

Premesse

Il progetto si pone come obiettivo l'upload delle immagini e dei dati dei reperti del Museo Egizio di Torino in Wikimedia Commons e Wikidata. Per agire in maniera massiva, si prevede l'utilizzo di OperRefine e di Pattypan. I lavori saranno divisi in due grandi fasi. Dopo aver preparato i dati del dataset con le informazioni relative agli oggetti museali, si importeranno in Wikidata creando un item per ciascuno di questi. Successivamente, si importeranno le immagini collegandole ai relativi item sfruttando i dati strutturati. Ci si prefigge di importare la quasi totalità di dati forniti dall'istituzione museale e di mantenere il formato delle immagini in alta qualità.

Upload in Wikidata

Dopo aver caricato il db in OR, i dati sono stati elaborati per poter essere riconciliati come valori delle proprietà di WD.

Numero di inventario | Identificativo Museo Egizio di Torino (P11414)

A seguito dei primi tentativi di riconciliazione su OR dei 12 item esistenti su WD con già associato l'id (che sono stati stellinati), ovvero il numero di inventario attribuito, è emersa la difficoltà di matching, motivo per cui, oltre all'analisi dell'identificativo stesso, ci si orienta verso l'adozione integrale del codice alfanumerico identificativo dell'oggetto e non più il semplice numero.

Si propone l'aggiornamento dell'espressione regolare per il formato, al fine di includere tutti gli identificativi degli oggetti museali, che dopo la lettera puntata P o C o S prevedono dai 4 ai 5 numeri a volte seguiti da un ulteriore punto che introducono lettere minuscole o numeri anche separati dal trattino ('-'), da [1-9]\d{1,3} a ([A-Z]{1,4}|[a-z1-9]{1,3}).

Si notano inoltre anomalie nella cui maggioranza dei casi il link è disabilitato:

Doppione: C. 2230.1 DN: 25 elementi segnalati come "numero doppio" nell'URL e nelle schede museali Frammenti papiracei con due o tre (fino a sei) identificativi: futura eliminazione del vincolo del valore singolo? Dubbio: 28 elementi nel cui identificativo è inserita la parola dubbio Identificativo aggiornato: 19 elementi individuabili dalla presenza o di ex o di = che mette in relazione l'id originario con quello nuovo C. 2737 (740) v.n.: 4 elementi seguiti da un numero a tre cifre dopo il v.n. a seguito dell'identificativo Sic: 1 elemento Cod: 1 elemento CGT 5401 G.5 M.11, M.12 S. 1757.4/5 Gelebein X/XI Categoria | Istanza di (P31)

La categoria dell'oggetto corrisponde alla proprietà istanza di. Per 314 tipi di categorie, si effettua la riconciliazione sul tipo 'opera d'arte'. Si procede matchando manualmente l'istanza più idonea all'oggetto. Si semplificano le categorie che riportano la descrizione al tipo di oggetto (eg.: Statua di Ini diventa statua).

Descrizione | Etichette

Si adoperano le descrizioni come etichette, importandole sia in italiano sia in inglese. In questo caso si pone la problematica di come rendere tutte le iniziali minuscole, rispettando gli standard di WD. Infatti in OF, pur esistendo la funzione di trasformazione (tutto minuscolo o tutto minuscolo o tutte le inziali maiuscole) non è prevista una funzione che renda minuscole solo le lettere iniziali, come confermato dalla documentazione di OR. Si propone dunque di separare in colonne diverse le lettere iniziali dal resto del testo, modificare le lettere iniziali massivamente per poi riunire il testo in un'unica colonna.

Materiale e tecnica | Materiale usato (P186)

Al fine di rappresentare al meglio i manufatti polimaterici, sono state generate più colonne con separatore , dopo aver eliminato "Pietra", "Metallo", "Tessuto" quando disponibile il sottotipo più specifico e aver normalizzato i separatori che vedevano l'utilizzo di / per separare la macrotipologia dalla microtipologia materiale, in alcuni casi adottata però per separare materiali di diversa natura. Si nota l'impiego del punto e virgola, oltre che dello /, per separare materiali di sezioni diversi dello stesso manufatto o per separare i materiali dalla tecnica materiale di esecuzione. Si pensa ad una nuova colonna dedicata alla tecnica?

Si lancia la riconciliazione su 'materiale'.

Dimensioni | Altezza (P2048), Spessore (P2610), Larghezza (P2049), Peso (P2067)

Il contenuto della cella è stato trasformato con la seguente espressione value-replace("Dimensioni: ","") per ottenere solo i valori numerici. Successivamente sono state create 3 colonne - altezza, spessore e larghezza - basate sulla colonna Dimensioni con separatore x, è stato eliminato il cm nell'ultima colonna con espressione analoga a quella precedente e trasformata la , in . per rendere il valore numerico idoneo all'importazione in WD. Queste tre nuove colonne vengono poi riconciliate sulla proprietà di Wikidata per grandezze fisiche. Si preserva anche il peso laddove presente.

Periodo | Periodo (P2348) Dinastia | Regno | Dall'anno | Estremo cronologico inferiore (P7103)

Gli estremi cronologici presentano date avanti e dopo Cristo, motivo per cui i valori numerici delle celle sono riconciliati su 'anno a.C.' e 'anno'. Per questioni di praticità, oltre che di maggiore affinità per l'appartenenza ad una collezione, si preferisce questa soluzione alla data di fondazione o creazione (P571) in cui si inserisce il millennio di riferimento, sebbene anche questa presenti l'opportunità di inserire i limiti inferiori (P1319) e superiori (P1326). Inoltre, per maggiori riferimenti cronologici si importano le colonne con il periodo di riferimento, della dinastia e del regno.

Si creano 10 item di anni a.C. non esistenti su WD per l'estremo inferiore e 16 per quello superiore.

Al | Estremo cronologico superiore (P7104)

Vedi sopra.

Provenienza | Luogo di scoperta (P189) Acquisizione | Proprietario (P127) Collocazione | Luogo (P276)

Si rende necessario trasformare il contenuto delle celle creando un'ulteriore colonna in cui inserire la sotto stringa che specifica il numero della sala [value-substring(0,7)], facendo attenzione inoltre ad eliminare lo zero che precede i numeri delle prime nove sale. Segue la riconciliazione complessa sul tipo 'stanza' che abbia il Luogo (ME) corrispondente alla proprietà parte di (P361), essendo state precedentemente create le sale corrispondenti. In attesa di decisione come poter inserire la parete, vetrina, armadio, basamento specifico.

Si individua la "Sala della Vita" in riferimento alla sala di recente apertura "Alla ricerca della vita" sita al primo piano del ME. ITEM DA CREARE

Link MW (da normalizzare) | Descritto nell'URL (P973)

NUOVE COLONNE

Collezione (P195)

Con questa proprietà si sottolinea l'appartenenza degli oggetti museali alla collezione del ME.

Stato del Copyright (P6216)

Tra i vincoli dell'ID, lo status del copyright specifica che i dati inseriti sono rilasciato nel pubblico dominio, compatibilmente con la licenza di WD.

Fonte dell'affermazione

Si inserisce la fonte dell'affermazione per tutte le proprietà.

Upload immagini

A ciascun manufatto museale corrispondono una o più immagini.

Glossario

All'interno della relazione si adoperano i seguenti escamotage abbreviativi:

  • OR = OpenRefine
  • WD = Wikidata
  • ME = Museo Egizio