Differenze tra le versioni di "Microgrant/2019/Individuazione di violazioni della licenza di foto di Commons"

Da Wikimedia Italia.
Jump to navigation Jump to search
(nuova)
 
(estendo)
(24 versioni intermedie di uno stesso utente non sono mostrate)
Riga 1: Riga 1:
 
{{Riquadro microgrant
 
{{Riquadro microgrant
| stato = bozza
+
| stato = discussione
 
| descrizione = <!-- breve descrizione del progetto, un paio di frasi al massimo -->
 
| descrizione = <!-- breve descrizione del progetto, un paio di frasi al massimo -->
| inizio = 2018-12-01
+
| inizio = 2018-04-01
| termine = 2019-03-31
+
| termine = 2019-12-31
 
| proponente = [[Utente:Nemo|Nemo]]
 
| proponente = [[Utente:Nemo|Nemo]]
 
| budget = 500 €
 
| budget = 500 €
Riga 21: Riga 21:
 
# rassicurare i fotografi e autori che il web non è il far west e che le licenze libere non impediscono di difendere i propri diritti, così che continuino sempre più a partecipare nei progetti Wikimedia senza temere di essere solo danneggiati;
 
# rassicurare i fotografi e autori che il web non è il far west e che le licenze libere non impediscono di difendere i propri diritti, così che continuino sempre più a partecipare nei progetti Wikimedia senza temere di essere solo danneggiati;
 
# mostrare che gli utenti Wikimedia sono anch'essi autori, spesso abusati, spesso dagli editori e cartelli vari che si riempiono tanto la bocca col diritto d'autore che in realtà sfruttano solo a proprio vantaggio; rompere anche a livello comunicativo la falsa dicotomia fra autori web e autori "tradizionali", fra "utenti" sfruttatori e "detentori dei diritti" sfruttati.
 
# mostrare che gli utenti Wikimedia sono anch'essi autori, spesso abusati, spesso dagli editori e cartelli vari che si riempiono tanto la bocca col diritto d'autore che in realtà sfruttano solo a proprio vantaggio; rompere anche a livello comunicativo la falsa dicotomia fra autori web e autori "tradizionali", fra "utenti" sfruttatori e "detentori dei diritti" sfruttati.
 +
 +
=== Sistema di rilevamento ===
 +
 +
Il sistema di rilevamento usato da PhotoClaim ([https://infringement.report/ Infringement.Report]) consente di cercare le pagine web su cui è usata l'immagine (analogamente a una ricerca con TinEye o Google Immagini) e poi di organizzarle secondo le azioni necessarie. È possibile ignorare interi domini o modificare in massa i risultati segnandoli come violazioni o meno.
 +
 +
Da una prova su 100 immagini a caso prese dall'elenco di immagini "sensibili", ci si può aspettare che almeno il 20 % corrisponda a delle violazioni del diritto d'autore e che meno dell'1 % degli usi rispetti la licenza, anche una volta scontati i [[w:en:Wikipedia:Mirrors and forks|mirror]] che violano sistematicamente la licenza dei progetti.
 +
 +
Più nel dettaglio, sono state individuate dapprima oltre 700 corrispondenze su oltre 200 domini, poi ridotte a oltre 300 da 140 domini una volta ripulite dai mirror e siti zombie vari. Di queste, meno di 10 erano accettabili, 20 corrispondenze errate o superate, 20 di difficile contestazione (per esempio non-profit e piccoli enti religiosi), 20 perseguibili ma con scarse prospettive, 10 (per 4 foto diverse) erano valevoli di essere perseguite (TV, giornali, aziende o enti di significative dimensioni, negozi online).
 +
 +
Segnare manualmente tutte le immagini richiederebbe probabilmente centinaia di ore di lavoro. Si può però sperare di eliminare in massa i casi meno rilevanti e poi concentrarsi sui siti che compaiono più spesso e/o sono più importanti, approfondendo solo i casi di violazione della licenza degli utenti che ci rispondono.
 +
 +
Una prova su 6640 foto di [[Utente:Sailko|Sailko]] ha però trovato corrispondenze per ben 3099 di esse, per un totale di 115371 pagine su 19604 domini, compresi diversi fra i [https://www.alexa.com/topsites/countries/IT primi 50 della classifica Alexa per l'Italia]. Con volumi simili è poco praticabile una verifica a priori, anche considerando che i risultati vengono cancellati nel giro di alcune settimane, quindi può essere più prudente effettuare il rilevamento solo dopo aver contattato gli utenti, per tutte e sole le foto di chi è interessato.
 +
 +
<gallery>
 +
File:2019-04 Infringement.Report List view.pdf|Elenco dei risultati
 +
File:2019-04 Infringement.Report Image view.pdf|Dettaglio delle corrispondenze, ricerca per immagine singola
 +
File:2019-04 Infringement.Report export.ods|Esportazione dei risultati dopo una prima pulizia e parziale classificazione
 +
</gallery>
  
 
== Organizzazione del progetto ==
 
== Organizzazione del progetto ==
 
=== Attività ===
 
=== Attività ===
  
# Prima settimana: completare l'elenco delle foto e dei fotografi di cui verificare il riuso. Per esempio, la lista di [https://quarry.wmflabs.org/query/27651 fotografi premiati da Commons] individua circa 1500 utenti e 100k loro foto che potrebbero essere appetibili a tale scopo.
+
# Completare l'elenco delle foto e dei fotografi di cui verificare il riuso. La lista di [https://quarry.wmflabs.org/query/27651 fotografi premiati da Commons] individua circa 1500 utenti e 100k loro foto che potrebbero essere appetibili a tale scopo; oppure la lista delle foto da tutti i 4000 utenti "riconosciuti" e delle [https://quarry.wmflabs.org/query/34869 loro foto] (circa 3,2 milioni ad aprile 2019) potrebbe essere incrociata con un elenco di [https://petscan.wmflabs.org/?psid=8604891 alcuni milioni di foto in categorie sensibili], spesso soggette ad abuso da parti degli editori secondo PhotoClaim: un esempio di foto da analizzare è [[commons:User:Nemo_bis/Copyleft_enforcement#Search_sample]] ([https://zenodo.org/record/3355709/files/2019-CommonsClaim.sqlite.xz elenco in formato sqlite] disponibile). {{fatto}}
# Seconda e terza settimana: inviare 100k foto al servizio di monitoraggio e analizzare i risultati (probabilmente bisognerà filtrare gli usi per selezionare quelli "più commerciali", come editori tradizionali e aziende medio-grandi, e poi verificare manualmente se abbiano ).
+
# Inviare un campione di qualche centinaia di foto al [[#Sistema di rilevamento|sistema di rilevamento]] e analizzare i risultati (probabilmente bisognerà filtrare gli usi per selezionare quelli "più commerciali", come editori tradizionali e aziende medio-grandi, e poi verificare manualmente se rappresentino violazioni particolarmente egregie). {{fatto}}: individuate alcune violazioni egregie per 2-3 fotografi di Commons, mandate alcune dozzine di segnalazioni di abusi ad [https://affiliate-program.amazon.com/ Amazon] e Google Ads/Search.
# Quarta settimana: scrivere nella pagina di discussione degli utenti le cui foto sono state ritrovate dal monitoraggio e chiedere se sono interessati a un aiuto professionale/legale nel far valere i propri diritti e spiegare le licenze libere ai riutilizzatori (eventualmente dovremo chiedere aiuto colla verifica del rispetto della licenza caso per caso, perché potrebbe esserci sfuggita l'attribuzione o nei casi al limite l'autore potrebbe ritenersi soddisfatto dall'attribuzione ricevuta ancorché imperfetta).
+
#* Campione esteso (pagato da Nemo) di 59k immagini scelte casualmente dal campione di cui sopra, per cui sono state trovate oltre 200k corrispondenze (e oltre 50 domini da ignorare): https://zenodo.org/record/3355709 {{fatto}}
# Secondo mese: mettere in contatto gli utenti interessati e il servizio legale, far partire i primi contatti bonari.
+
# Lanciare un caso pilota, facendo in modo che almeno un/una fotografo/a sia preso/a in carico da PhotoClaim come loro primo caso di difesa della licenza CC-BY o CC-BY-SA. {{doing}}
# Terzo mese: in collaborazione cogli interessati selezionare i casi da perseguire.
+
# Solo se completato il passaggio precedente, scrivere nella pagina di discussione degli utenti delle foto elencate come sopra e chiedere se sono interessati a dei dati sul loro riuso e a un aiuto professionale/legale nel far valere i propri diritti e spiegare le licenze libere ai riutilizzatori (la prassi di PhotoClaim delega al fotografo la verifica del rispetto della licenza caso per caso, anche perché potrebbe il fotografo potrebbe essere soddisfatto dell'attribuzione esistente o avere concesso una licenza in separata sede). I messaggi massivi potrebbero eventualmente non citare per nome il servizio, in modo da "pubblicizzarlo" solo agli interessati (ed eventualmente in privato), anche se una comunicazione diretta sarebbe più chiara.
# Quarto mese: raccontare in pubblico a che punto siamo e quello che abbiamo scoperto.
+
# Inserire fino a 100k foto degli utenti interessati nel [[#Sistema di rilevamento|sistema di rilevamento]], inviare loro i risultati e metterli in contatto con il servizio legale perché ne chiedano l'intervento sulle foto e gli usi che sono risultati violazioni della licenza.  
 +
# Post progetto: raccontare in pubblico a che punto siamo e quello che abbiamo scoperto.
 
Eventuali azioni legali proseguiranno presumibilmente per mesi o anni dopo questa fase, ma non sarà compito nostro seguirle direttamente. Il nostro scopo è mettere in piedi un meccanismo che poi possa funzionare da sé, dimostrano che le licenze sono sostenibili.
 
Eventuali azioni legali proseguiranno presumibilmente per mesi o anni dopo questa fase, ma non sarà compito nostro seguirle direttamente. Il nostro scopo è mettere in piedi un meccanismo che poi possa funzionare da sé, dimostrano che le licenze sono sostenibili.
  
 
=== Risorse ===
 
=== Risorse ===
  
Costo del servizio esterno: 500 €.
+
Costo del [[#Sistema di rilevamento|sistema di rilevamento]]: 500 € per oltre 100k immagini.
  
Altre risorse associative: una volta ottenuta l'adesione di qualche fotografo e avviate le pratiche relative, bisognerà
+
Altre risorse associative: una volta ottenuta l'adesione di qualche fotografo e avviate le pratiche relative, bisognerà scriverne almeno una volta nel blog di Wikimedia Italia. Sarà utile che Francesca Ussani intervisti qualcuno degli utenti coinvolti, altrimenti vedi sotto per risorse "interne" di comunicazione.
  
Risorse legali: sperabilmente gli autori potranno autofinanziare le azioni legali come descritto sopra, ma lo scopriremo solo quando avremo in mano i casi specifici.
+
Risorse legali: sperabilmente gli autori potranno autofinanziare le azioni legali come descritto sopra; ciò avviene nella stragrande maggioranza dei casi. PhotoClaim si occupa di selezionare i casi perseguibili e di rispondere in modo proporzionato, gradualmente più forte, evitando un processo se possibile. Qualora avessero bisogno di azioni ulteriori o diverse rispetto a quelle offerte da PhotoClaim, i fotografi potranno sempre ritirarsi e agire in proprio o chiedere un finanziamento a Wikimedia Italia in separata sede, ma questo progetto non copre questa parte.
  
 
=== Risultati attesi ===
 
=== Risultati attesi ===
Riga 54: Riga 73:
 
== Persone coinvolte ==
 
== Persone coinvolte ==
  
* Nemo: produzione delle liste, contatti con PhotoClaim
+
* Nemo: produzione delle liste, contatti con PhotoClaim, invio massivo di messaggi
* Qualche utente di Commons: sarebbe utile  
+
* Qualche utente di Commons: sarebbe utile qualcuno che voglia scrivere i messaggi per Commons e/o seguire le discussioni, eventualmente gestire tutta la comunicazione pubblica.
* Eventuali legulei wikimediani: potrebbero tornarci utili in seguito quando si tratta di andare in tribunale, se PhotoClaim riterrà di avvalersi di persone ulteriori o diverse rispetto a quelle di cui già dispone (magari pro bono per un caso sonda).
+
* Eventuali legulei wikimediani: potrebbero tornarci utili in seguito quando si tratta di andare in tribunale, se PhotoClaim riterrà di avvalersi di persone ulteriori o diverse rispetto a quelle di cui già dispone (magari pro bono per un caso sonda), ma a priori non sono necessari.
 +
[[Categoria:License enforcement]]

Versione delle 18:14, 5 ago 2019

statodiscussione

Microgrant

Individuazione di violazioni della licenza di foto di Commons

data d'inizio2018-04-01
data di termine2019-12-31

proponenteNemo

finanziamento richiesto500 €
finanziamento concesso 

relazione finale Relazione finale


Scopo del progetto

Wikimedia Commons si basa sul funzionamento delle licenze libere e consente un largo riuso, ma molte persone ed enti in giro per il web e per il mondo non rispettano minimamente le licenze nemmeno laddove sarebbe molto facile. Questi abusi riducono la fiducia nel funzionamento delle licenze Creative Commons.

Wikimedia non detiene nessun diritto d'autore sulle foto caricate in Commons e quindi non è nella posizione di iniziare alcuna azione legale nemmeno contro gli abusi palesi. Possiamo però aiutare gli utenti a far rispettare i propri diritti per le vie legali. PhotoClaim è un servizio di difesa legale dei fotografi, noto per aver lanciato una petizione in difesa della libertà di panorama nel 2015 e attivo anche nel tribunale di Milano: di solito si occupano solo di fotografi che usano licenze NC, ma sono disposti a collaborare con noi sperimentalmente se portiamo dei casi concreti e dei fotografi interessati a perseguirli.

A questo scopo è necessario inviare una selezione di foto al servizio di monitoraggio cui si affidano, simile a TinEye ma più economico. Poi bisogna assicurarsi di imbastire dei casi solidi cogli autori e i loro legali, casi che possano produrre un buon impatto sia etico-morale (riparazione di un'ingiustizia) sia economico (danni pagati da chi ha violato le licenze, essenziali per coprire i costi delle azioni legali e consentire quindi a PhotoClaim di continuare a sostenerci).

L'obiettivo strategico è duplice:

  1. rassicurare i fotografi e autori che il web non è il far west e che le licenze libere non impediscono di difendere i propri diritti, così che continuino sempre più a partecipare nei progetti Wikimedia senza temere di essere solo danneggiati;
  2. mostrare che gli utenti Wikimedia sono anch'essi autori, spesso abusati, spesso dagli editori e cartelli vari che si riempiono tanto la bocca col diritto d'autore che in realtà sfruttano solo a proprio vantaggio; rompere anche a livello comunicativo la falsa dicotomia fra autori web e autori "tradizionali", fra "utenti" sfruttatori e "detentori dei diritti" sfruttati.

Sistema di rilevamento

Il sistema di rilevamento usato da PhotoClaim (Infringement.Report) consente di cercare le pagine web su cui è usata l'immagine (analogamente a una ricerca con TinEye o Google Immagini) e poi di organizzarle secondo le azioni necessarie. È possibile ignorare interi domini o modificare in massa i risultati segnandoli come violazioni o meno.

Da una prova su 100 immagini a caso prese dall'elenco di immagini "sensibili", ci si può aspettare che almeno il 20 % corrisponda a delle violazioni del diritto d'autore e che meno dell'1 % degli usi rispetti la licenza, anche una volta scontati i mirror che violano sistematicamente la licenza dei progetti.

Più nel dettaglio, sono state individuate dapprima oltre 700 corrispondenze su oltre 200 domini, poi ridotte a oltre 300 da 140 domini una volta ripulite dai mirror e siti zombie vari. Di queste, meno di 10 erano accettabili, 20 corrispondenze errate o superate, 20 di difficile contestazione (per esempio non-profit e piccoli enti religiosi), 20 perseguibili ma con scarse prospettive, 10 (per 4 foto diverse) erano valevoli di essere perseguite (TV, giornali, aziende o enti di significative dimensioni, negozi online).

Segnare manualmente tutte le immagini richiederebbe probabilmente centinaia di ore di lavoro. Si può però sperare di eliminare in massa i casi meno rilevanti e poi concentrarsi sui siti che compaiono più spesso e/o sono più importanti, approfondendo solo i casi di violazione della licenza degli utenti che ci rispondono.

Una prova su 6640 foto di Sailko ha però trovato corrispondenze per ben 3099 di esse, per un totale di 115371 pagine su 19604 domini, compresi diversi fra i primi 50 della classifica Alexa per l'Italia. Con volumi simili è poco praticabile una verifica a priori, anche considerando che i risultati vengono cancellati nel giro di alcune settimane, quindi può essere più prudente effettuare il rilevamento solo dopo aver contattato gli utenti, per tutte e sole le foto di chi è interessato.

Organizzazione del progetto

Attività

  1. Completare l'elenco delle foto e dei fotografi di cui verificare il riuso. La lista di fotografi premiati da Commons individua circa 1500 utenti e 100k loro foto che potrebbero essere appetibili a tale scopo; oppure la lista delle foto da tutti i 4000 utenti "riconosciuti" e delle loro foto (circa 3,2 milioni ad aprile 2019) potrebbe essere incrociata con un elenco di alcuni milioni di foto in categorie sensibili, spesso soggette ad abuso da parti degli editori secondo PhotoClaim: un esempio di foto da analizzare è commons:User:Nemo_bis/Copyleft_enforcement#Search_sample (elenco in formato sqlite disponibile). Yes check.png Fatto
  2. Inviare un campione di qualche centinaia di foto al sistema di rilevamento e analizzare i risultati (probabilmente bisognerà filtrare gli usi per selezionare quelli "più commerciali", come editori tradizionali e aziende medio-grandi, e poi verificare manualmente se rappresentino violazioni particolarmente egregie). Yes check.png Fatto: individuate alcune violazioni egregie per 2-3 fotografi di Commons, mandate alcune dozzine di segnalazioni di abusi ad Amazon e Google Ads/Search.
    • Campione esteso (pagato da Nemo) di 59k immagini scelte casualmente dal campione di cui sopra, per cui sono state trovate oltre 200k corrispondenze (e oltre 50 domini da ignorare): https://zenodo.org/record/3355709 Yes check.png Fatto
  3. Lanciare un caso pilota, facendo in modo che almeno un/una fotografo/a sia preso/a in carico da PhotoClaim come loro primo caso di difesa della licenza CC-BY o CC-BY-SA. In corso In corso...
  4. Solo se completato il passaggio precedente, scrivere nella pagina di discussione degli utenti delle foto elencate come sopra e chiedere se sono interessati a dei dati sul loro riuso e a un aiuto professionale/legale nel far valere i propri diritti e spiegare le licenze libere ai riutilizzatori (la prassi di PhotoClaim delega al fotografo la verifica del rispetto della licenza caso per caso, anche perché potrebbe il fotografo potrebbe essere soddisfatto dell'attribuzione esistente o avere concesso una licenza in separata sede). I messaggi massivi potrebbero eventualmente non citare per nome il servizio, in modo da "pubblicizzarlo" solo agli interessati (ed eventualmente in privato), anche se una comunicazione diretta sarebbe più chiara.
  5. Inserire fino a 100k foto degli utenti interessati nel sistema di rilevamento, inviare loro i risultati e metterli in contatto con il servizio legale perché ne chiedano l'intervento sulle foto e gli usi che sono risultati violazioni della licenza.
  6. Post progetto: raccontare in pubblico a che punto siamo e quello che abbiamo scoperto.

Eventuali azioni legali proseguiranno presumibilmente per mesi o anni dopo questa fase, ma non sarà compito nostro seguirle direttamente. Il nostro scopo è mettere in piedi un meccanismo che poi possa funzionare da sé, dimostrano che le licenze sono sostenibili.

Risorse

Costo del sistema di rilevamento: 500 € per oltre 100k immagini.

Altre risorse associative: una volta ottenuta l'adesione di qualche fotografo e avviate le pratiche relative, bisognerà scriverne almeno una volta nel blog di Wikimedia Italia. Sarà utile che Francesca Ussani intervisti qualcuno degli utenti coinvolti, altrimenti vedi sotto per risorse "interne" di comunicazione.

Risorse legali: sperabilmente gli autori potranno autofinanziare le azioni legali come descritto sopra; ciò avviene nella stragrande maggioranza dei casi. PhotoClaim si occupa di selezionare i casi perseguibili e di rispondere in modo proporzionato, gradualmente più forte, evitando un processo se possibile. Qualora avessero bisogno di azioni ulteriori o diverse rispetto a quelle offerte da PhotoClaim, i fotografi potranno sempre ritirarsi e agire in proprio o chiedere un finanziamento a Wikimedia Italia in separata sede, ma questo progetto non copre questa parte.

Risultati attesi

Il risultato diretto si vedrà man mano ma sarà in buona parte direttamente misurabile:

  1. numero di violazioni o potenziali violazioni individuate;
  2. numero di utenti che ci rispondono e aderiscono all'iniziativa, trovandola utile;
  3. numero di lettere di diffida inviate, altre azioni legali;
  4. danni riscossi, numero di violazioni corrette, sentenze;
  5. introduzione o meno di un servizio permanente di difesa di autori cc-by o cc-by-sa da PhotoClaim con un costo simbolico o fortemente scontato per gli utenti Wikimedia.

Il risultato comunicativo generale, essendo molto largo, non è direttamente misurabile, ma a distanza di mesi o anni potrebbero presentarsi dei sintomi (come stampa, contatti di autori contenti, riattivazione di utenti nei progetti Wikimedia precedentemente disamorati) che però non tracceremo qui.

Persone coinvolte

  • Nemo: produzione delle liste, contatti con PhotoClaim, invio massivo di messaggi
  • Qualche utente di Commons: sarebbe utile qualcuno che voglia scrivere i messaggi per Commons e/o seguire le discussioni, eventualmente gestire tutta la comunicazione pubblica.
  • Eventuali legulei wikimediani: potrebbero tornarci utili in seguito quando si tratta di andare in tribunale, se PhotoClaim riterrà di avvalersi di persone ulteriori o diverse rispetto a quelle di cui già dispone (magari pro bono per un caso sonda), ma a priori non sono necessari.