Progetto Gutenberg, come stai?

Aperto nel luglio 1971, il Progetto Gutenberg è la più antica biblioteca digitale al mondo ed è vivente…perlomeno al di fuori del suolo patrio. Con oltre 60.000 ebook distribuiti in primis in formato plain text (specie a partire dagli anni 2000) PB parla sostanzialmente ancora inglese, ma offre anche risorse in cinese e nelle principali lingue europee.

Nato dall’intuizione dell’informatico Michael Hart, il Progetto sorge inizialmente all’interno dell’Università dell’Illinois, dove la sua vicenda si lega a doppio filo agli albori della rete internet. Il nome Gutenberg, cui fa eco l’italiano Progetto Manuzio, è un omaggio al primo stampatore di Magonza e “inventore” del libro moderno. PG si basa ancora per lo più sul lavoro volontario per la revisione dei testi digitalizzati dapprima a mano, e oggi con tecniche OCR affiancate dalla curatela degli editor allo scopo di:

incoraggiare la creazione e distribuzione degli ebook, aiutare ad abbattere la gabbia dell’ignoranza e dell’analfabetismo, distribuendo quanti più ebook a quante più persone possibile

PG, da non confondere con l’omonima pellicola Project Gutenberg del 2018 del regista e sceneggiatore di Hong Kong Felix Chong, da tre anni a questa parte risulta non raggiungibile in Germania (in questo caso solo parzialmente irraggiungibile) ed è attualmente sotto sequestro in Italia, anche in seguito alla denuncia presentata da FIEG e AgCom.

Greg Newby ha preso le redini della fondazione dopo la dipartita di Hart nel 2011, le sue parole illuminano sulle modalità del sequestro preventivo da parte del tribunale di Roma l’11 maggio 2020: la prima volta che ne abbiamo sentito parlare è stata quando qualche utente ci ha chiesto come mai non riuscisse ad accedere dall’Italia. A significare l’accortezza con cui sono stati effettuati i rilievi probatori, anche in seguito PG non è stata contattata da editori o autorità italiane circa il profilo di legalità dei contenuti ospitati dalla (sulla?) piattaforma.

Perché non contestare dunque l’accusa di diffusione illecita di beni tutelati dal diritto d’autore? Il procedimento è contro ignoti e un’istanza di riesame sarebbe passibile forse di autoaccusa? Alle domande poste da Wired nel giugno dello stesso anno, la GdF non ha ritenuto di dover rispondere pubblicamente. Sono una trentina i siti coinvolti nell’operazione che ha oscurato PG, risorse che evidentemente nulla hanno a che spartire col progetto che nell’incipit di ciascuna pubblicazione esplicita all’utente di verificare cosa preveda la legge del paese di appartenenza in fatto di copyright.

Dei 60.000 testi digitalizzati (parliamo di dati risalenti a quattro anni fa) sono 831 quelli in lingua italiana, tendenzialmente testi dell’Ottocento e degli albori del ventesimo secolo, se non precedenti. Considerato che il diritto d’autore USA tutela le opere per 95 anni dalla pubblicazione mentre quello italiano per 70 anni dalla morte dell’autore, traduttore ecc. potrebbero essere ben 29 i testi non in regola! La biblioteca digitale più grande e antica del mondo è sotto sequestro da quattro anni (in Italia) per il mancato approfondimento circa la liceità della pubblicazione in public domain di una trentina di testi editi un secolo fa.

Questo è il punto dell’articolo in cui l’articolista disinibit* chiude in bellezza con un classicissimo “non andrebbe fatto, e io non te lo sto consigliando, ma puoi aggirare il blocco via VPN o TOR”, come a suggerire: 1. Il carattere anche tecnologicamente velleitario del blocco preventivo, 2. l’opportunità di ricorrere a una nemesi tecnica adeguata a riparare il torto e restituire accesso alle risorse, 3. a patto di aderire alla cerchia dell’utenza sgamata e pagante. Il primo punto è certamente vero, il secondo argomento è come minimo spuntato e spoliticizzato, il terzo lambisce una cattura in chiave commerciale e abilista di una sana attitudine libertaria. Qui vorrei proporvi un epilogo diverso, decisamente più sfaccettato e, perché no, a tinte fosche. Perché al di là del bello, che resta tanto in Gutenberg, le cose negli ultimi tre silenziosi anni sono cambiate, e parecchio.


Il combinato disposto di pandemia e intelligenza artificiale ha mutato profondamente l’uso e la proiezione culturale di PG, che prima è stato usato per nutrire ed addestrare l’IA e oggi (in collaborazione con MIT e Microsoft) sta convertendo migliaia di libri in audiolibri letti da voci artificiali, al momento in lingua inglese. Certo l’inflessione, l’emozione, l’intonazione, non hanno (ancora) la qualità necessaria a sostituire il lavoro artigianale che si cela dietro una lettura performata professionalmente.

Il nostro sistema consente agli utenti di personalizzare la velocità e lo stile di conversazione di un audiolibro, l’intonazione emotiva e può persino abbinare la voce desiderata utilizzando una piccola quantità di audio campione.

Dal rapporto di PG “Creazione automatica di audiolibri su larga scala”

L’accelerazione tecnologica, la possibilità di clonare voci reali, quando non di riproporre la stessa voce in più lingue, ci consegna una metamorfosi imminente del panorama del libro parlato. Nelle ultime stagioni alcuni di questi temi sono emersi nelle piattaforme di podcasting (Spotify, Apple) così come in Kindle Direct Pulishing di Amazon, eppure a impressionare oggi sono da una parte i numeri (25.000 le ore di audio già processate) dall’altra il protagonismo di un hub open source e percepito come “etico” quale PG, in terza battuta lo scontro con i sindacati degli artisti tv e radiofonici USA, spaventati dal tasso di espansione delle “repliche digitali” vocali in assenza di consenso.

Se non siete neoluddisti d’accatto tutto ciò non deve spaventare, basterà sottolineare ancora una volta che l’iniziativa mira a democratizzare l’accesso alla letteratura per i non vedenti, gli studenti di lingue, i bambini e gli amanti degli audiolibri. O almeno così dicono.