Storia dell’IA in 5 minuti: dai pionieri a oggi

Dal Test di Turing di Alan Turing nel 1950 a ChatGPT e i modelli di oggi. La storia dell’Intelligenza Artificiale raccontata in 5 minuti, dagli AI Winter all’esplosione del Deep Learning.
Contenuti dell'articolo

Tutto è iniziato con una domanda fatta da un uomo che probabilmente non immaginava cosa avrebbe scatenato. Siamo nel 1950, e un matematico inglese di nome Alan Turing si chiede: “possono pensare le macchine?”. Non lo fa in un laboratorio segreto, lo fa in un articolo accademico, “Computing Machinery and Intelligence“. Propone un test: se una macchina riesce a sostenere una conversazione al punto che un umano non capisce se sta parlando con una macchina o con una persona, allora quella macchina è intelligente. Oggi lo chiamiamo Test di Turing.

Da lì, una manciata di anni dopo, un gruppo di scienziati si riunisce al Dartmouth College nell’estate del 1956 per quella che viene considerata la data di nascita ufficiale dell’Intelligenza Artificiale come campo di studio. Il nome della conferenza? “Dartmouth Summer Research Project on Artificial Intelligence”. Da lì escono i primi programmi in grado di dimostrare teoremi, giocare a scacchi e risolvere problemi di algebra.

Erano ottimisti, all’epoca. Molto ottimisti. Pensavano che in una ventina d’anni avremmo avuto macchine in grado di fare tutto quello che fa un essere umano. Spoiler: non è andata così.

Timeline della storia dell'Intelligenza Artificiale dal 1950 al 2026: Turing, Dartmouth, Deep Blue, AlexNet, Transformer, ChatGPT.

I primi passi: ottimismo e cadute

Negli anni ’60 e ’70 l’IA fa i primi veri progressi. Nascono programmi come ELIZA (1966), un chatbot terapeutico che simulava uno psicologo rogersiano con un trucco linguisto semplicissimo, eppure la gente ci si affezionava. Scherzando, ma neppure poi tanto, sappiamo quanto accade ancora oggi, no?

Arrivano anche i primi sistemi di visione artificiale e i primi robot. Poi arriva il muro. I sistemi dell’epoca non scalano: funzionano in laboratorio con problemi giocattolo, ma appena si prova a farli lavorare su problemi reali, crollano. I finanziamenti calano. Arriva il primo Inverno dell’IA (AI Winter), tra gli anni ’70 e ’80. I governi e le aziende tagliano i fondi. L’IA diventa una parola quasi sporca nel mondo accademico.

I sistemi esperti e la seconda ondata

Negli anni ’80 l’IA si riprende, ma con un approccio diverso: i sistemi esperti. Invece di provare a fare macchine intelligenti in senso generale, si costruiscono programmi che contengono migliaia di regole scritte a mano da esperti umani. Funzionano, in ambiti stretti: diagnosi mediche, ricerca di minerali, configurazione di computer. Le aziende ci investono, nascono startup, il Giappone lancia il progetto “Computer di quinta generazione”.

Poi, di nuovo, il muro. I sistemi esperti sono fragili: funzionano finché il problema sta dentro le regole scritte, ma non imparano, non si adattano, non generalizzano. La bolla scoppia. Arriva il secondo Inverno dell’IA, fine anni ’80 e primi ’90.

La svolta: dai dati, non dalle regole

A metà degli anni ’90 cambia il paradigma. Invece di scrivere regole a mano, si comincia a far imparare le macchine dai dati. Il Machine Learning esce dalla nicchia accademica e diventa il nuovo centro dell’IA. Nel 1997 il supercomputer Deep Blue di IBM batte il campione mondiale di scacchi Garry Kasparov. È un evento mediatico enorme, ma Deep Blue non “pensa”: calcola 200 milioni di posizioni al secondo e sceglie la migliore. Non impara, calcola.

Negli anni 2000 succedono tre cose che cambieranno tutto: esplodono i dati (Internet), le GPU delle schede grafiche dei videogiochi si scoprono fantastiche per fare calcoli paralleli, e qualcuno comincia a chiamare “Deep Learning” quella roba lì.

L’esplosione del Deep Learning

Il momento spartiacque è il 2012. Un gruppo di ricercatori dell’Università di Toronto, guidati da Geoffrey Hinton, vince la competizione ImageNet (riconoscimento di immagini su larga scala) con una rete neurale profonda chiamata AlexNet. Il margine di vittoria è talmente alto che la comunità scientifica capisce: il deep learning non è una moda, è il futuro.

Da lì, è un’escalation. 2014: Ian Goodfellow inventa le GAN (Generative Adversarial Networks), reti che competono tra loro per generare contenuti. 2017: un paper di Google pubblica “Attention is All You Need“, che introduce i Transformer: non sa nemmeno cosa ha scatenato. Quel paper è la base di tutto quello che usiamo oggi: ChatGPT, Claude, Gemini, tutti i modelli moderni.

I Transformer hanno risolto uno dei principali limiti delle RNN: la difficoltà nel gestire relazioni tra parole molto distanti tra loro.
Invece di elaborare il testo una parola alla volta, mantenendo uno stato interno che deve ricordare il contesto precedente (hidden state), i Transformer elaborano tutte le parole in parallelo e utilizzano un meccanismo chiamato attenzione (attention). Questo permette al modello di valutare direttamente quali parole sono più importanti e come sono collegate tra loro, anche se si trovano molto lontane nel testo.
In modo molto semplificato, è come se invece di leggere una frase parola per parola, guardaste l’intera frase in un colpo solo e individuaste subito le relazioni più importanti tra le parole.

Nelle RNN le informazioni più vecchie tendono a “sbiadire” man mano che il testo diventa lungo. Con l’attenzione dei Transformer si usa molta più memoria, ma in cambio il modello può tornare direttamente alle parti importanti del testo già lette senza doverle ricordare tutte attraverso un unico stato interno.
Questo rende molto più facile mantenere il contesto anche su testi lunghi.

L’era dei modelli grandi

Dal 2018 in avanti è una corsa. BERT di Google, GPT di OpenAI, poi GPT-2, GPT-3 (2020), e lì il mondo cambia. GPT-3 ha 175 miliardi di parametri ed è in grado di scrivere testi, programmare, tradurre, rispondere a domande, tutto con un unico modello. Non è più un sistema specializzato: è un foundation model.

Io fu fortunatissimo a poterlo utilizzare poco prima del lancio di GPT-3.5, era già rivoluzionario!

Poi 2022: OpenAI rilascia ChatGPT (basato su GPT-3.5) e l’IA diventa di uso quotidiano. In due mesi raggiunge 100 milioni di utenti, il prodotto con la crescita più veloce della storia. Nello stesso anno esce Stable Diffusion e DALL-E 2 per la generazione di immagini. L’anno dopo esce GPT-4, poi Claude, Gemini, Llama (open source di Meta), e una valanga di modelli cinesi (Qwen, DeepSeek).

Oggi, nel 2026, siamo al punto in cui i modelli non si limitano più a generare testo. Fanno ragionamento (chain of thought, partendo con modelli come o1 di OpenAI e R1 di DeepSeek), usano strumenti (navigation, calcolo, esecuzione di codice), lavorano come agenti autonomi, generano video (Sora, Veo, Wan), e sempre più spesso sono multimodali: vedono, sentono, parlano, scrivono.

La lezione della storia

Se c’è una cosa che la storia dell’IA insegna, è che le previsioni a lungo termine sono quasi sempre sbagliate. Negli anni ’60 pensavano che in 20 anni avremmo avuto macchine pensanti.
Poi hanno passato 30 anni a disperarsi.
Poi in 10 anni hanno fatto più progressi che in tutti i decenni precedenti messi insieme.

Non sappiamo dove arriveremo. Quello che sappiamo è che siamo in un momento storico in cui le cose cambiano talmente in fretta che quello che era fantascienza 5 anni fa oggi è un prodotto che usiamo tutti i giorni.

E la cosa più bella? È solo l’inizio.

FAQ

Cos’è l’AI Winter?

Periodi in cui i finanziamenti e l’interesse per l’IA crollavano dopo ondate di grandi promesse non mantenute. Il primo fu negli anni ’70, il secondo alla fine degli anni ’80. Ogni volta l’IA “resuscitava” con un approccio diverso.

Cosa c’entrano le GPU dei videogiochi con l’IA?

Le GPU (Graphics Processing Unit) sono progettate per fare tanti calcoli semplici in parallelo e su matrici (calcoli matriciali), ed è esattamente quello di cui hanno bisogno le reti neurali. La stessa scheda grafica che usate per giocare a Call of Duty può addestrare un modello di deep learning, ovviamente su scala molto ridotta rispetto ai data center.

Perché il 2012 è considerato l’anno spartiacque?

Perché AlexNet vinse ImageNet con un margine talmente ampio (errore del 15.3% contro il 26.2% del secondo classificato) da convincere anche gli scettici che il deep learning era la strada giusta. Da lì le pubblicazioni sul deep learning sono esplose: da poche decine di paper all’anno a migliaia.

I Transformer sono solo per il testo?

No, ormai i Transformer vengono usati per immagini (Vision Transformer), video, audio, musica, dati scientifici, e addirittura per la predizione di strutture proteiche (AlphaFold di DeepMind). Il meccanismo di attenzione funziona con qualsiasi dato che possa essere rappresentato come sequenza, non solo parole.

Esistevano chatbot prima di ChatGPT?

Certo. ELIZA (1966), ALICE (1995), Siri (2011), Google Now, Alexa, Cortana, e tanti altri. Ma tutti funzionavano con regole scritte a mano o pattern matching. ChatGPT è stato il primo modello pubblico ad usare un modello linguistico generativo su scala, capace di rispondere a qualsiasi domanda senza dover programmare ogni risposta.

Condividi:

Potrebbero interessarti