(This article “AI Creation and Copyright: Unraveling the Debate on Originality and Ownership” was first published in english on Euractiv. A shorter version was published in italian on La Repubblica.
Gesù Cristo possedeva o no gli abiti che indossava? Nel romanzo storico di Umberto Eco “Il nome della rosa”, questa è la questione centrale che viene dibattuta animatamente dalle alte gerarchie del clero, portando a una lotta intestina. La posta in gioco è niente di meno che la legittimità della Chiesa di possedere proprietà private – e per il clero di arricchirsi – dal momento che se Gesù lo ha fatto, allora sarebbe permesso ai suoi fedeli servitori.
Sebbene non riguardi il futuro di un’entità così rilevante come la Chiesa cattolica, una questione altrettanto spinosa sta suscitando oggi un acceso dibattito: Vale a dire, i sistemi di intelligenza artificiale sono in grado di creare un lavoro originale o sono solo dei pappagalli stocastici che ripetono ciò che gli viene detto? Quello che fanno è simile all’intelligenza umana o sono solo un’eco di cose già create da altri?
In questo caso, il dibattito non è tra gli alti prelati, ma tra filosofi, giuristi e informatici (gli scienzati specializzati nel funzionamento del cervello umano sembrano essere praticamente assenti dalla discussione). Invece di minacciare la ricchezza della Chiesa, la risposta alla domanda sull’intelligenza delle macchine solleva questioni che riguardano la proprietà e la ricchezza che scaturisce da tutte le opere umane.
I grandi modelli linguistici (LLM) come Bard e ChatGPT sono costruiti ingerendo da Internet enormi quantità di materiale scritto e distillando connessioni e correlazioni tra le parole e le frasi in quei testi (“apprendendo”). La domanda è: quando un motore di intelligenza artificiale produce qualcosa, sta generando una nuova opera creativa, come farebbe un essere umano, o sta semplicemente generando un’opera derivata?
Se la risposta è che una macchina non “apprende” e quindi si limita a sintetizzare o a riprodurre un lavoro esistente, senza “creare”, allora, ai fini legali e del diritto d’autore, il suo prodotto potrebbe essere considerato, da un punto di visa politico prima ancora che giuridico, un’opera derivata da testi esistenti e quindi non un’opera creativa propria con tutti i diritti che ne deriverebbero.
Nei primi anni del web commerciale, c’è stato un dibattito simile sul fatto che i collegamenti ipertestuali e i brevi estratti di articoli o pagine web dovessero essere considerati opere derivate. Coloro che ritenevano che lo fossero, sostenevano che Google avrebbe dovuto pagare i diritti d’autore su quei link e su quegli estratti quando li includeva nei suoi risultati di ricerca.
La mia posizione all’epoca era che i link con brevi estratti non dovevano essere considerati un’opera derivata, ma piuttosto un nuovo tipo di servizio che contribuiva a portare quelle opere a un pubblico diverso e che quindi non entrava in concorrenza con gli interessi economici degli autori di quelle opere o dei proprietari di quei siti. Non solo i link o gli estratti non hanno causato loro un danno, ma hanno fatto esattamente il contrario.
Questa argomentazione e le sue estensioni hanno costituito la base per la nascita di giganti economici come Google e Facebook, che non sarebbero potuti esistere se avessero dovuto pagare una “tassa sui link” per i contenuti che indicizzavano e a cui rimandavano (anche se leggi recenti in Paesi come l’Australia e il Canada hanno cambiato in parte questa situazione, costringendo Google e Facebook a pagare i giornali per i link ai loro contenuti).
Ma i modelli linguistici di grandi dimensioni non producono solo link o estratti. Nel quasi totalità dei casi, le risposte che forniscono non portano l’utente ai testi o ai siti originali, ma diventano un loro sostituto. Il pubblico è probabilmente lo stesso e quindi c’è indubbiamente una concorrenza economica. Un grande modello linguistico potrebbe diventare l’unica interfaccia per l’accesso e lo sfruttamento economico di queste informazioni.
Sembra ovvio che questo diventerà un problema politico sia negli Stati Uniti che in Europa, anche se la questione della sua legalità potrebbe portare a risposte diverse, dal momento che gli Stati Uniti hanno una tradizione legale di “fair use”, che consente ad aziende come Google di utilizzare il lavoro altrui in vari modi senza doverlo a sua volta concedere in licenza e senza violare il copyright del proprietario. In Europa non esiste una tradizione simile (i Paesi del Commonwealth britannico hanno un concetto simile, chiamato “fair dealing”, ma molto più debole).
Probabilmente non è una coincidenza che le aziende che hanno creato questi motori di intelligenza artificiale siano riluttanti a dire su quali testi o contenuti sono stati costruiti i modelli, poiché la trasparenza potrebbe facilitare eventuali scoperte di violazione del copyright (alcuni autori di spicco stanno attualmente facendo causa a OpenAI, proprietaria di ChatGPT, perché ritengono che il loro lavoro sia stato ingerito dal suo grande modello linguistico senza autorizzazione).
Un problema nel problema è che gli attori che promuovono questi sistemi godono tipicamente di posizioni dominanti nei rispettivi mercati e non sono quindi soggetti a particolari obblighi di apertura o trasparenza. È quello che è successo con il “diritto di linkare” che ha portato i giganti del web a diventare gatekeeper: la libertà di linkare o di scambiare informazioni ha creato un enorme valore che li ha portati a diventare dominanti.
Non è ovvio se la soluzione a questi problemi socialmente desiderabile nel lungo termine sia quella di restringere ulteriormente il diritto d’autore in modo da limitare la creazione di nuovi grandi modelli linguistici. Nel pensare a quali misure applicare e a come far evolvere il diritto d’autore nell’era dell’intelligenza artificiale, forse dovremmo pensare a regole che aiutino anche ad aprire i mercati a valle, e non solo a consolidare il potere di mercato già detenuto dagli attuali gatekeeper.
Quando i creatori dell’intelligenza artificiale parlano di costruire “sistemi più intelligenti degli esseri umani” e difendono i loro modelli come qualcosa di più di semplici “pappagalli stocastici” che ripetono qualsiasi cosa venga loro detta, dobbiamo tenere presente che non si tratta solo di affermazioni puramente filosofiche. Ci sono interessi economici significativi in gioco, tra cui lo sfruttamento futuro della ricchezza di informazioni prodotte fino ad oggi.
Gli interessi in gioco sono ciclopici, ben superiori alla proprietà privata della Chiesa nel 1300 di cui discusse Guglielmo Da Baskerville.