L'universo (che altri chiama la Biblioteca) si compone d'un numero indefinito, e forse infinito, di gallerie esagonali, con vasti pozzi di ventilazione nel mezzo, bordati di basse ringhiere. Da qualsiasi esagono si vedono i piani superiori e inferiori, interminabilmente. La distribuzione degli oggetti nelle gallerie è invariabile. Venticinque vasti scaffali, in ragione di cinque per lato, coprono tutti i lati meno uno; la loro altezza, che è quella stessa di ciascun piano, non supera di molto quella d'una biblioteca normale.
Dal racconto La biblioteca di Babel, apparso nel 1941 nella raccolta Il giardino dei sentieri che si biforcano. Borges descrive una biblioteca infinita composta di sale esagonali, in cui cinque pareti sono occupate da scaffali. In ogni scaffale vi sono 32 libri da 410 pagine ciascuno. Ogni pagina contiene 40 righe di 80 simboli: 22 lettere dell’alfabeto, più spazio, punto e virgola, per un totale di 25 caratteri tipografici. La biblioteca raccoglie tutti i libri possibili in tutte le combinazioni possibili.
L’abisso combinatorio
Ogni pagina comprende 3.200 caratteri che, moltiplicati per 410 pagine, danno un totale di 1.312.000 posizioni per libro. Ogni libro possiede dunque 1.312.000 caselle da riempire con uno dei 25 caratteri disponibili. Il numero dei libri possibili è 25 elevato a 1.312.000: un 1 seguito da 1.834.097 zeri. Per confronto, il numero di atomi dell’universo osservabile è dell’ordine di 1080. Il cosmo è un’infinitesima parte della Biblioteca di Babele.
Quando si proclamò che la Biblioteca comprendeva tutti i libri, la prima impressione fu di straordinaria felicità. Tutti gli uomini si sentirono padroni di un tesoro intatto e segreto. Non v'era problema personale o mondiale la cui eloquente soluzione non esistesse: in un qualche esagono. L'universo era giustificato, l'universo attingeva bruscamente le dimensioni illimitate della speranza.
Ma la speranza di avere a disposizione la conoscenza universale viene presto delusa dall’abisso combinatorio. Qual è la probabilità di trovare un libro che abbia senso per noi umani? Qual è la probabilità che, ad esempio, emerga dal caos combinatorio una sequenza come «Nel mezzo del cammin di nostra vita»? Facciamo un rapido calcolo: la frase contiene 35 caratteri, spazi inclusi. La probabilità complessiva è (1/25)35, pari a circa 10−49: come indicare a caso un punto della sfera terrestre (che è composta di circa 1050 atomi) e trovare l’atomo cercato al primo tentativo. Eppure, l’incipit della Commedia di Dante esiste nella biblioteca un numero infinito (o quasi) di volte, circondata da versioni leggermente errate come: “Nel mezzo del cammin di nostra dita”, “Nel mezzo del cammin di nostra gita”, e ancora, ancora.
Il vincolo genera informazione
Immaginiamo ora che la Macchina del Linguaggio, MaLin in breve, come mi piace chiamare i sistemi di genAI, disponga di sole 100 parole e componga testi di 10 parole ciascuno. Le combinazioni possibili sono 10010, cioè 1020. Anche con un vocabolario minuscolo, la varietà supera il numero stimato di stelle della nostra galassia (stimato in 1011). La combinatoria produce vertigine.
Se però introduciamo semplici vincoli grammaticali, dividendo le parole in categorie (ad esempio, nomi, verbi, avverbi, preposizioni, ecc.) e imponiamo un repertorio di sequenze predefinite (ad esempio, preposizione + nome + verbo), le combinazioni si riducono drasticamente: siamo in grado di eliminare oltre il 90% delle sequenze insensate. Se aggiungiamo anche vincoli sintattici e logici, il numero di testi diminuisce e contemporaneamente aumenta la probabilità che uno dei rimanenti trasmetta un messaggio comprensibile.
Nella Biblioteca di Babele di Borges, la tragedia è proprio l'assenza di filtri: un libro intellegibile è sepolto sotto una montagna di libri incomprensibili. Insomma, l’informazione nasce dai vincoli che imponiamo alla formazione dei testi. Se tutto è possibile, nulla è distinguibile, e nella nebbia dove tutto è grigio il senso si smarrisce.
Dalla regola al pattern
Le genAI moderne non apprendono regole grammaticali mediante norme esplicite come nella vecchia informatica degli anni Ottanta del Novecento. Non classificano «nome» o «verbo». Apprendono distribuzioni di probabilità e le stabilizzano. La grammatica, la sintassi, la logica e i vari artifici retorici che danno luogo a un testo ‘ben fatto’ non sono programmati: emergono come strutture incorporate nei pattern statistici.
Durante l’addestramento, il modello computazionale impara a prevedere la parola mancante: «Il bambino lancia la _____». Se il sistema produce «palla», il modello statistico di previsione viene rafforzato; se produce «veloce», viene indebolito. Dopo miliardi di esempi, il sistema non conosce la categoria grammaticale, ma ha interiorizzato la probabilità della parola attesa condizionata dalle parole esistenti. Alla fine del processo di apprendimento le parole sono rappresentate in uno spazio a più dimensioni. Termini che co-occorrono frequentemente si collocano in regioni vicine.
Suonare a orecchio
MaLin usa un meccanismo chiamato Attention. Mentre scrive la decima parola di una frase, assegna un valore a tutte le parole precedenti. Se la prima parola era «Le», forma plurale, la macchina accende una luce di allerta: sa che la decima parola dovrà probabilmente finire con una desinenza plurale per mantenere la coerenza. Essa non rispetta le nostre regole di composizione di testi come facciamo noi umani, in base a intenzioni e significazioni, ma sa imitarle così bene da renderle indistinguibili dai nostri testi.
È come un musicista che non sa leggere lo spartito, ma che ha un orecchio talmente assoluto da poter improvvisare una sonata di Mozart senza mai sbagliare una nota: sente a orecchio dove deve andare la frase musicale.
MaLin si comporta come il musicista illetterato o, se volete, come un bibliotecario alieno che non conosce la lingua degli umani, ma che, avendo letto i libri scritti dagli umani, ha imparato che quei segni che noi chiamiamo parole, e che utilizziamo per interagire efficacemente col mondo, mostrano pattern ricorrenti, come i ritmi della buona musica. MaLin non fa altro che riprodurre quei pattern. Insomma, suona a orecchio.
Dove nasce il senso?
La macchina può riprodurre pattern. Può generare coerenza locale. Ma, allora, dove nasce il senso? È sufficiente la sola co-occorrenza statistica?
Per rispondere è necessario far riferimento al concetto di isotopia messo a punto dai semiologi. Per isotopia si intende la ripetizione di elementi con tratti simili, o perché appartengono allo stesso campo semantico (pane, forno, farina), o perché hanno stessa desinenza (andava, suonava, correva), o perché elementi presenti in una stessa situazione (treno, abbracci, tristezza), e altro ancora.
Formulo una ipotesi. Il senso emerge quando le isotopie del testo – cioè le ricorrenze percepibili nel testo – si intrecciano con le isotopie custodite nella memoria e con le proiezioni intenzionali verso il futuro.
Quando leggiamo una frase attiviamo memorie, esperienze, schemi culturali, anticipazioni. Il senso emerge dalla rete di relazioni che coinvolge la nostra identità intessuta nel tempo. È un processo di integrazione dell’esperienza sensibile nella nostra biografia.
La Biblioteca di Borges contiene tutte le frasi possibili, ma non contiene lettori. Senza un soggetto osservante, la differenza tra «Nel mezzo del cammin di nostra vita» e una sua variante errata è puramente combinatoria. È il lettore, con la sua storia, a riconoscere l’isotopia coerente con la propria biografia culturale e a scartare il rumore.
Per ora la genAI resta confinata a produrre una simulazione di senso, perché manca di una biografia, di una traiettoria di vita, non viene da un punto nel passato e si dirige in un altro punto nel futuro. La domanda non è dunque se la macchina comprenda, ma se in futuro possa costituirsi come centro di integrazione temporale dei testi di cui ha esperienza. Per il momento, finché non sviluppa una identità che intrecci memoria, percezione e progetto, produce solo pattern straordinariamente verosimili, come un grande falsario, che dopo aver riprodotto per anni i dipinti di Vermeer, è capace di produrre dipinti originali nello stile di Vermeer, indistinguibili dagli originali.
Il senso è sempre biografico.















