La mattina del 2 giugno 2026, milioni di utenti si sono ritrovati a fissare messaggi di errore. Claude era fuori servizio. Poche ore dopo, è toccato a ChatGPT. I social media si sono riempiti del solito mix di frustrazione, umorismo nero e teorie del complotto: attacchi hacker, sabotaggi coordinati, guerra geopolitica. La verità, a quanto pare, era al tempo stesso più banale e più rivelatrice.
Nessun avversario era responsabile. Le interruzioni erano, con ogni probabilità, il risultato di una domanda ordinaria che aveva sopraffatto risorse fisiche limitate. La pagina di stato di Anthropic ha confermato “tassi di errore elevati su più modelli”. OpenAI ha segnalato una “disponibilità ridotta”. Due incidenti distinti, a poche ore di distanza l’uno dall’altro, causati dalla stessa condizione strutturale: troppi utenti, chip insufficienti.
Il limite non è l’algoritmo. È la fisica del chip.
Questa distinzione è estremamente importante. Ci siamo abituati a pensare all’intelligenza artificiale come a una specie di software — senza peso, infinitamente riproducibile, governata dall’elegante logica della matematica. Le interruzioni del 2 giugno hanno offerto una correzione. I grandi modelli linguistici non sono software nel senso comune del termine. Sono infrastrutture industriali.
Prendiamo in esame l’analogia che meglio illustra la situazione. All’inizio degli anni Novanta, il Progetto Genoma Umano procedeva a un ritmo tale che il completamento della sequenza sembrava ancora lontano decenni. Ciò che cambiò non fu la scienza: la chimica del sequenziamento delle coppie di basi era già ben compresa. Ciò che cambiò fu l’introduzione dei sequenziatori automatici di Applied Biosystems, le macchine sviluppate sotto la guida di Michael Hunkapiller. Un maggior numero di macchine, operanti in parallelo, significava un maggior numero di sequenze al giorno. Il collo di bottiglia è sempre stato la capacità di elaborazione dell'hardware, non l'intuizione intellettuale.
La traiettoria dei grandi modelli linguistici segue una logica analoga. L'architettura Transformer, introdotta nel fondamentale articolo del 2017 “Attention Is All You Need”, ha fornito la svolta concettuale. Ma GPT-3, GPT-4, Claude: questi non sono trionfi di una nuova idea. Sono trionfi di scala. Più parametri, più dati di addestramento, più ore di GPU. L’intelligenza, per così dire, emerge da un calcolo su una scala che era fisicamente impossibile un decennio fa.
Esiste, tuttavia, una differenza fondamentale. Il genoma era un problema risolvibile una volta per tutte. Bastava sequenziare tre miliardi di coppie di basi una volta sola e il lavoro era fatto. L’inferenza dei modelli linguistici è invece un processo perpetuo. Ogni domanda posta a Claude, ogni conversazione avviata con ChatGPT, richiede un nuovo impiego di potenza di calcolo: miliardi di operazioni in virgola mobile, eseguite in millisecondi, su chip che costano decine di migliaia di dollari l’uno e che non possono essere prodotti abbastanza velocemente da soddisfare la domanda. La dipendenza dall'hardware non è transitoria. È costitutiva.
Le implicazioni si ramificano in direzioni che dovrebbero preoccupare chiunque rifletta seriamente sul futuro digitale. Si considerino gli accordi infrastrutturali che nel 2026 hanno silenziosamente rimodellato il panorama dell'IA. Amazon ha stanziato fino a 5 miliardi di dollari in investimenti aggiuntivi in Anthropic, assicurandosi gigawatt di capacità di calcolo. Microsoft detiene un accordo Azure da 0 miliardi con la stessa azienda. Google sta potenziando la capacità delle TPU su scala industriale. Non si tratta di investimenti tecnologici nel senso convenzionale del termine. Sono più simili alla costruzione di centrali elettriche o alla posa di binari ferroviari: quel tipo di infrastrutture ad alta intensità di capitale che, una volta realizzate, determinano le possibilità di tutto ciò che vi si basa.
L’infrastruttura dell’IA sta diventando una catena di approvvigionamento industriale, non solo un acquisto di servizi cloud.
Il filosofo che è in me è colpito da ciò che questo comporta per l’etica dell’era digitale. Abbiamo trascorso anni a discutere dei pregiudizi algoritmici codificati nei dati di addestramento, dell’opacità delle decisioni prese da sistemi a scatola nera, degli enigmi filosofici della coscienza artificiale. Queste rimangono questioni importanti. Ma le interruzioni del 2 giugno mettono in luce una preoccupazione più concreta e, di conseguenza, conferiscono ulteriore peso alle argomentazioni dell’enciclica Magnifica Humanitas di Leone XIV: chi controlla i chip controlla l’intelligenza. E i chip, a quanto pare, sono concentrati nelle mani di pochissimi.
Perplexity è rimasto disponibile per tutta la mattinata. Non perché sia più intelligente o meglio protetto dagli attacchi. Ma perché si avvale di un'infrastruttura diversa, serve un numero minore di utenti e non aveva ancora esaurito la sua quota. La resilienza di un servizio di IA è, in fondo, una funzione della sua posizione nella catena di approvvigionamento globale dei semiconduttori.
Questa è la scomoda verità che il dibattito sull’intelligenza artificiale ha tardato ad assimilare. La rivoluzione dell’intelligenza è anche, e forse soprattutto, una rivoluzione industriale — una rivoluzione che non si misura in idee, ma in gigawatt, nella resa dei chip, nella geopolitica dei minerali delle terre rare e nei programmi di produzione di TSMC. Le interruzioni di servizio di una singola mattina di giugno l’hanno resa visibile, per un breve istante, prima che i server tornassero online e la conversazione passasse ad altro.
Sarebbe un errore lasciar passare la cosa senza commentarla.
Nota: la struttura e alcune formulazioni sono state sviluppate con l'aiuto di un'intelligenza artificiale (Claude), ma i contenuti sono miei.















