The librarian metaphor

“Un bibliotecario coltissimo che sa solo citare ciò che ha letto.”

La parola non significa quello che pensi

«Intelligenza artificiale» suona come una cosa concreta. Non lo è. È un'etichetta mobile che appiccichiamo su tutto ciò che ieri i computer non sapevano fare. Gli scacchi un tempo erano IA. Anche il correttore ortografico lo era. Nel momento in cui un trucco diventa banale, smettiamo di chiamarlo IA e iniziamo a chiamarlo software. La storica Pamela McCorduck ha battezzato questo fenomeno , ed è l'idea più utile per mantenere le idee chiare in questo campo.

Quello che la gente intende *oggi* quando dice IA è quasi sempre una famiglia precisa: grandi modelli statistici addestrati su enormi quantità di testo, immagini o codice, che producono continuazioni plausibili a partire da un input. Tutto il resto di questo corso non fa che scomporre questa singola frase.

L'etichetta «IA» continua a restringersi attorno a ciò che in quel momento è ancora difficile.

Due famiglie di IA molto diverse

Storicamente sono esistite due visioni concorrenti su come costruire macchine intelligenti. La prima (l'IA simbolica) cercava di codificare il mondo sotto forma di regole e logica, come ragiona un giurista. La seconda (l'apprendimento automatico) ha rinunciato alle regole per lasciare che i computer estraessero schemi dai dati, come un bambino impara a riconoscere un cane vedendone tanti.

L'IA simbolica ha dominato fino alla fine degli anni Novanta. È lei che ha battuto Kasparov a scacchi. È anche lei che ha passato quarant'anni a cercare, senza riuscirci, di definire cosa sia «una sedia». L'apprendimento automatico ha vinto nell'era moderna perché il mondo si è rivelato troppo disordinato per le regole. I sistemi che usi oggi (ChatGPT, Claude, Midjourney, Whisper) sono apprendimento automatico puro.

Dove si trova davvero l'«intelligenza»

Quando poni una domanda a un modello, non avviene alcun ragionamento nel senso umano del termine. Il modello è una funzione enorme. Gli dai in pasto una sequenza di numeri (il tuo prompt, codificato) e lui restituisce un'altra sequenza di numeri (la sua risposta). I numeri che stanno nel mezzo (miliardi) sono stati calibrati durante l'addestramento perché la funzione tenda a produrre continuazioni plausibili. È tutto qui il meccanismo.

Parlare di «intelligenza» è corretto solo in un senso limitato. Il modello ha compresso una quantità enorme di scrittura umana in una forma che gli permette di produrne dell'altra. Non ha obiettivi, né memoria di ieri, né un monologo interiore tra un tuo messaggio e l'altro. Ogni chiamata riparte da una lavagna pulita, più il tuo prompt. L'illusione di una mente persistente viene da noi, non dal modello.

Perché proprio ora?

La matematica alla base dei modelli attuali risale in gran parte agli anni Ottanta. Ciò che è cambiato è la scala: abbastanza testo su Internet per addestrarsi, abbastanza GPU per far girare l'addestramento, e un'architettura (il transformer) che scala con eleganza quando le si dà di più. L'articolo del 2017 «Attention is all you need» non ha tanto inventato idee nuove quanto le ha combinate in un modo che finalmente premiava la scala. Incontreremo l'attention nel capitolo 5.

Tre numeri aiutano a tarare le idee. GPT-2 (2019) aveva 1,5 miliardi di parametri e dava l'impressione di un giocattolo. GPT-3 (2020) ne aveva 175 miliardi e dava una sensazione inquietante. I modelli di punta nel 2025 sono stimati nell'ordine dei migliaia di miliardi, addestrati su qualcosa che si avvicina alla parte significativa di tutto ciò che l'umanità ha scritto pubblicamente. Il salto qualitativo tra queste tappe non stava nell'algoritmo. Stava nella scala.

A cosa serve questo corso

Alla fine del capitolo 7 dovresti essere in grado di leggere un annuncio sull'IA, un'offerta di lavoro o il titolo di una ricerca e di farti una tua opinione su cosa stia davvero succedendo sotto il cofano. Non avrai costruito un modello, ma saprai cosa sono un parametro, un token, un embedding e una testa di attention, perché contano, e dove le affermazioni più portanti del campo sono fragili.

Se non hai mai scritto codice: te la caverai bene. Gli approfondimenti sono facoltativi.
Se sei uno studente: gli approfondimenti contengono la matematica e gli articoli originali.
Se sei un professionista: il capitolo 7 è fatto per te, ma guadagnatelo leggendo prima i capitoli da 1 a 6.

Una riga per ciascuno

«IA» è un'etichetta mobile. Ciò che usi oggi appartiene a una famiglia precisa: grandi modelli statistici che producono continuazioni plausibili.
Non ci sono regole all'interno. Ci sono miliardi di numeri calibrati perché l'output sia plausibile.
L'IA moderna funziona grazie alla scala (dati + calcolo) e a un'architettura (il transformer), non a una nuova teoria della mente.
Le capacità sono reali ma limitate. «L'IA può fare X» significa quasi sempre «un modello preciso in una configurazione precisa ha fatto X».

Dove andare ora

Capitolo 2: Come imparano i modelli