Di cosa parleremo..
Cosa trovi qui
L’intelligenza artificiale è piena di parole strane. Token, embedding, RAG, fine-tuning, transformer. Se stai leggendo un articolo tecnico e ogni tre righe trovi un termine che ti sembra arabo, questo glossario è per te.
L’ho organizzato in ordine alfabetico, ogni termine con la sua spiegazione e un esempio concreto. Clicca su quello che ti serve o scorri tutto. I link diretti funzionano: se qualcuno ti manda `miosito.it/glossario#llm`, arrivi dritto lì.
AI (Artificial Intelligence) / IA
Intelligenza Artificiale. Il termine ombrello per tutto ciò che riguarda macchine in grado di svolgere compiti che normalmente richiederebbero intelligenza umana. Riconoscere un gatto in una foto, tradurre una frase, guidare un’auto. AI è il campo, tutto il resto (machine learning, deep learning, LLM) sono sottoinsiemi.
Esempio: Quando ChatGPT ti risponde, stai usando AI. Quando il tuo telefono sblocca col volto, idem.
AGI (Artificial General Intelligence)
La versione “generale” dell’intelligenza artificiale. Un’AGI sarebbe un sistema capace di imparare e ragionare su qualsiasi compito intellettuale, come un essere umano. Oggi non esiste. Tutto quello che usiamo (ChatGPT, Claude, Gemini) è AI “stretta”, specializzata in un dominio.
Esempio: Un’AGI potrebbe imparare a suonare il pianoforte, poi programmare un sito web, poi cucinare una torta, senza dover essere riaddestrata da zero per ogni cosa. Oggi non ci siamo.
AI Agent
Un sistema AI che non si limita a rispondere a comandi, ma agisce in autonomia per raggiungere un obiettivo. Pianifica, usa strumenti, prende decisioni intermedie. Gli agenti AI sono il passo successivo ai chatbot: non aspettano che tu gli dica tutto, ma si muovono da soli.
Esempio: Un agente AI per la ricerca di lavoro potrebbe cercare annunci su LinkedIn, analizzare il CV, scrivere una lettera di presentazione personalizzata e candidarsi, tutto senza che tu clicchi un pulsante per ogni step.
ANI (Artificial Narrow Intelligence)
L’AI “stretta” o specializzata. È quella che esiste oggi. Un sistema ANI fa una cosa sola, ma la fa molto bene. Ogni AI che usi oggi (Google Maps, Spotify, il filtro antispam, Siri) è una Narrow AI.
Esempio: Il sistema che riconosce le tue foto di cani su Google Foto è ANI. Non sa comporre una poesia, ma identifica un golden retriever al 99.9%.
API
Application Programming Interface. Un modo standardizzato per far comunicare due software tra loro. Se vuoi che il tuo programma parli con ChatGPT, non devi smanettare dentro i server di OpenAI: usi la loro API, che è un insieme di regole e funzioni già pronte. Come un cameriere tra la cucina e il tavolo.
Esempio: Un’app meteo non ha un suo radar meteorologico. Chiama l’API di OpenWeather, riceve i dati e te li mostra. L’API è il ponte.
ASI (Artificial Super Intelligence)
Un’ipotetica AI superiore all’intelligenza umana in ogni campo: creatività, problem-solving, relazioni sociali, matematica. Oggi è pura teoria e oggetto di dibattito filosofico. Non esiste, non è dietro l’angolo, e quando qualcuno dice “ma l’ASI arriverà tra 5 anni” molto probabilmente sta vendendo un libro.
Esempio: Immagina qualcuno più intelligente di Einstein in fisica, di Mozart in musica, di Shakespeare in scrittura, di chiunque in qualsiasi altra cosa, tutto contemporaneamente. Ecco, quello sarebbe il livello ASI. Non ci siamo nemmeno lontanamente.
Attention / Self-Attention
Il meccanismo che ha reso possibile tutto il resto. Nel processare una frase, l’Attention permette al modello di “prestare attenzione” a parole diverse con pesi diversi, capendo quali sono rilevanti tra loro. La Self-Attention lo fa all’interno della stessa frase: per capire “lei”, guarda anche “Maria” tre righe sopra.
Esempio: Nella frase “Il gatto che ho visto ieri nel parco era molto più grande del mio”, per capire cosa significa “più grande” il modello deve collegarlo a “gatto” e “mio” (gatto). L’Attention quantifica queste connessioni.
Bias
Distorsione sistematica nei dati o nel modello. Se un modello viene addestrato su dati che contengono pregiudizi umani (razziali, di genere, culturali), li apprende e li riproduce. Non è “cattiveria” dell’AI: è che i dati di partenza erano sporchi. Rilevare e correggere i bias è una delle sfide più grosse del settore.
Esempio: Un modello di recruitment AI addestrato su assunzioni storiche in cui il 90% dei manager erano uomini potrebbe “imparare” che i manager sono quasi sempre uomini, penalizzando le candidate donne.
Catena di Markov
Un modello matematico che predice lo stato futuro basandosi solo sullo stato presente, senza memoria del passato remoto. È una semplificazione, ma potentissima. Le catene di Markov sono state usate per generare testo prima che arrivassero i transformer (e funzionavano sorprendentemente bene per la loro semplicità).
Esempio: Se oggi è soleggiato, una catena di Markov calcola la probabilità che domani sia piovoso basandosi solo sul dato di oggi. È il motivo per cui alcune previsioni meteo “stupide” funzionano comunque.
Chain-of-Thought
Una tecnica di prompting che chiede al modello di ragionare “passo dopo passo” invece di saltare direttamente alla risposta. Invece di “Quanto fa 235*17?”, gli chiedi: “Ragiona passo dopo passo.” E lui ti scrive i calcoli intermedi. Risultato: risposte molto più accurate, specialmente su problemi di logica e matematica.
Esempio: “Se una pizza costa 12 euro e voglio dividerla in 8 fette, quanto costa ogni fetta? Ragiona passo dopo passo.” Il modello scriverà: 12 / 8 = 1,5. Ogni fetta costa 1,50 euro.
Context Window / Finestra di Contesto
La quantità di testo che un modello può “vedere” in una volta sola. È la sua memoria a breve termine: tutto ciò che sta dentro la context window è disponibile per la risposta. Fuori, il modello se lo dimentica. Più grande è, più pagine di documento può analizzare in una volta. I modelli moderni arrivano a 128k, 200k e persino 1 milione di token.
Esempio: Con una context window da 128k token puoi caricare tutto “Il Piccolo Principe” e fargli domande su qualsiasi parte. Con una da 4k, dopo poche pagine il modello si scorda l’inizio.
Deep Learning
Un sottoinsieme del machine learning che usa reti neurali con molti strati (da qui “deep”, profondo). Più strati ci sono, più il modello può imparare astrazioni complesse. È il motore dietro praticamente tutti i risultati impressionanti dell’ultimo decennio: traduzioni, riconoscimento immagini, voce, testo generativo.
Esempio: Per riconoscere un volto, il primo strato vede pixel, il secondo vede bordi, il terzo vede occhi e nasi, gli strati più profondi vedono il volto completo. Ognuno impara astrazioni più complesse del precedente.
Diffusion Model
Il tipo di modello dietro a Midjourney, DALL-E, Stable Diffusion. Funziona partendo da un’immagine completamente casuale (rumore puro) e progressivamente la “ripulisce” fino a ottenere l’immagine richiesta dal prompt. È come se scolpisse: parte da un blocco di marmo informe e toglie via il rumore fino a rivelare la statua.
Esempio: Chiedi “un gatto con gli occhiali da sole in spiaggia”. Il modello parte da un’immagine colorata a caso e in 20-50 passaggi la trasforma nella scena richiesta.
Embedding
Una rappresentazione numerica (un vettore di numeri) che cattura il significato di una parola, frase o documento. Parole simili hanno embedding simili. “Gatto” e “felino” saranno vicini nello spazio vettoriale. “Gatto” e “elettricità” saranno lontani. È il modo in cui l’AI “capisce” le relazioni tra le parole, senza bisogno di un dizionario scritto a mano.
Esempio: Se trasformi “Re” – “Uomo” + “Donna” nel linguaggio degli embedding, ottieni un vettore molto vicino a “Regina”. Funziona davvero. È matematica, non magia.
Fine-Tuning
Il processo di prendere un modello già addestrato (generico) e addestrarlo ulteriormente su un dataset specifico per specializzarlo. Invece di addestrare un modello da zero (costo: milioni di dollari), parti da uno già bravo e lo “ritocchi” per il tuo dominio. Come prendere un medico generico e specializzarlo in cardiologia.
Esempio: Prendi GPT-4 e lo fine-tuni su migliaia di conversazioni di assistenza clienti per la tua azienda. Il risultato: un chatbot che capisce i tuoi prodotti, i tuoi processi, il tuo tono di voce, senza dover spiegare tutto da capo ogni volta.
Generative AI
La branca dell’AI che crea contenuti nuovi invece di limitarsi a classificarli o analizzarli. Testo, immagini, musica, video, codice. Invece di chiedere “questa foto è un gatto o un cane?” (classificazione), generi una foto di un gatto con un cappello da cowboy (generazione).
Esempio: ChatGPT (testo), Midjourney (immagini), Suno (musica), Sora (video). Tutti esempi di Generative AI.
GPT (Generative Pre-trained Transformer)
Il modello creato da OpenAI che ha praticamente aperto la stagione dell’AI generativa per tutti. “Generative” perché genera testo, “Pre-trained” perché è stato addestrato su enormi quantità di dati prima di essere rilasciato, “Transformer” perché usa l’architettura transformer. La serie va da GPT-1 (sperimentale e debole) a GPT-4o (quello che usi oggi).
Esempio: GPT-3.5 è quello usato da ChatGPT gratuito. GPT-4 e GPT-4o sono le versioni a pagamento, più capaci, più veloci e con una finestra di contesto molto più ampia.
Hallucination / Allucinazione
Quando un modello AI produce informazioni false ma le presenta con sicurezza e sembrano plausibili. Non è un bug in senso classico: il modello non “mente”, semplicemente non distingue tra ciò che sa e ciò che sta inventando per riempire un vuoto. È il problema numero uno nell’adozione professionale dell’AI generativa.
Esempio: Chiedi a ChatGPT “Chi ha vinto i campionati italiani di calcio del 1974?” Se il modello non ha quel dato preciso, potrebbe inventare di sana pianta una stagione, nomi, partite, e darti una risposta che sembra vera. Non lo fa per malizia: è il suo modo di completare pattern.
Inference / Inferenza
La fase in cui il modello produce una risposta, dopo che l’addestramento è finito. Se il training è come studiare per un esame, l’inference è l’esame stesso: il modello usa ciò che ha imparato per rispondere in tempo reale. È la fase che vede l’utente finale. Ogni volta che fai una domanda a ChatGPT, stai facendo inference.
Esempio: Scrivere un prompt, premere Invio e vedere la risposta che appare parola dopo parola. Quello è inference. Il modello non sta imparando niente di nuovo: sta solo applicando quello che già sa.
LLM (Large Language Model)
Un modello di AI specializzato nel comprendere e generare linguaggio umano. “Large” perché ha miliardi di parametri, “Language” perché lavora col testo, “Model” perché è una rappresentazione statistica del linguaggio. GPT, Claude, Gemini, Llama sono tutti LLM. Non “capiscono” il testo come lo capiamo noi, ma sono straordinariamente bravi a simulare comprensione.
Esempio: ChatGPT è un LLM. Quando gli scrivi una email e lui ti risponde, sta usando un modello statistico del linguaggio per predire quali parole vengono dopo le tue, in modo coerente e contestualmente appropriato.
Machine Learning
Il ramo dell’AI in cui la macchina impara da dati, invece di essere programmata esplicitamente con regole scritte a mano. Invece di scrivere “se l’oggetto è peloso e ha 4 zampe e miagola, allora è un gatto”, gli mostri 10.000 foto di gatti e lui impara i pattern da solo. È l’approccio che ha reso praticabile l’AI moderna.
Esempio: Un sistema di raccomandazione Netflix non ha regole del tipo “se guardi Breaking Bad, consiglia Better Call Saul”. Impara dai dati di milioni di utenti cosa piace a chi, e lo fa da solo, senza che un programmatore scriva ogni regola a mano.
Modello / Model
Il cuore di un sistema AI. Un modello è il risultato dell’addestramento: un file (enorme, spesso molti GB) che contiene i pesi e i parametri appresi. È la “conoscenza” del sistema. Un modello da solo non fa niente: ha bisogno di qualcuno che lo esegua (inference) e di dati su cui operare.
Esempio: Il file .gguf di Llama 3 che scarichi su Hugging Face è un modello. Da solo sono numeri in un file. Quando lo carichi in un programma che lo esegue, diventa un assistente AI funzionante.
Multimodal / Multimodale
Un modello che lavora con più tipi di dati contemporaneamente: testo, immagini, audio, video. Invece di avere un modello per il testo e uno per le immagini, un modello multimodale li processa tutti insieme, capendo le relazioni tra i diversi formati.
Esempio: Mostri a GPT-4o una foto del tuo frigo e chiedi “cosa posso cucinare con questi ingredienti?” Lui vede l’immagine (modalità visiva) e ti risponde col testo (modalità linguistica). Questo è multimodale.
Neural Network / Rete Neurale
Una struttura matematica ispirata (molto vagamente) al cervello umano. Strati di “neuroni” artificiali connessi tra loro, dove ogni connessione ha un peso. Durante l’addestramento, i pesi vengono aggiustati per minimizzare gli errori. Non è una simulazione del cervello: è matematica ispirata alla biologia, molto più semplice, ma efficace.
Esempio: Immagina una rete di nodi dove ogni nodo riceve input, fa un calcolo (somma pesata + funzione di attivazione) e passa il risultato al nodo successivo. Mettine 100 miliardi in fila ed ecco GPT-4.
Overfitting
Quando un modello impara i dati di addestramento troppo bene, compresi il rumore e le anomalie. Sembra bravissimo sui dati di test, ma fallisce su dati nuovi. Come uno studente che impara le risposte a memoria senza capire il concetto: prende 10 all’esame di ripetizione, ma zero alla prima domanda diversa.
Esempio: Un modello addestrato a riconoscere cavalli guardando solo foto di cavalli su prati verdi. Se gli mostri un cavallo in una stalla, non lo riconosce perché ha “imparato” che cavallo = prato verde.
Parametri
I numeri che definiscono il comportamento di un modello. Ogni connessione tra neuroni ha un peso, e ogni neurone ha un bias. Pesi + bias = parametri. Più parametri ha un modello, più “capacità” ha di memorizzare pattern complessi. Ma non è solo quantità: un modello con 7 miliardi di parametri ben addestrato può batterne uno con 70 miliardi mal addestrato.
Esempio: GPT-3 aveva 175 miliardi di parametri. Llama 3 8B ne ha 8 miliardi. GPT-4 si stima ne abbia oltre 1.000 miliardi (1 trilione). Ogni parametro è un numero a virgola mobile che contribuisce alle predizioni del modello.
Prompt
Il testo che dai a un modello AI per ottenere una risposta. Il prompt è tutto: la qualità della risposta dipende quasi sempre dalla qualità del prompt. Un prompt vago dà risposte vaghe. Un prompt preciso, contestualizzato e ben strutturato dà risposte utili. È il “linguaggio” con cui parli all’AI.
Esempio: “Scrivi una email” è un prompt debole. “Scrivi una email formale di sollecito pagamento per un cliente che deve 2.500 euro, con scadenza superata di 15 giorni, tono cortese ma fermo, includi il numero fattura 2024-389 e l’IBAN” è un prompt forte.
Prompt Engineering
L’arte (e in parte scienza) di scrivere prompt efficaci. Non è magia: ci sono tecniche collaudate (chain-of-thought, role prompting, few-shot, system prompt strutturato) che migliorano drasticamente la qualità delle risposte. Chi sa fare prompt engineering bene produce risultati 10x migliori di chi scrive “fai questo” e basta.
Esempio: Dare al modello un ruolo (“Sei un avvocato specializzato in diritto del lavoro”), un contesto (“Devi rispondere a un cliente preoccupato per un licenziamento”), e istruzioni specifiche di formato (“Rispondi in 3 paragrafi, tono rassicurante ma preciso, cita gli articoli di legge”). Questo è prompt engineering.
RAG (Retrieval-Augmented Generation)
Una tecnica che combina un database di documenti con un LLM. Quando arriva una domanda, il sistema prima cerca nei documenti le informazioni più pertinenti (retrieval), poi passa il tutto al modello che genera la risposta (augmented generation). È il modo più robusto per fare AI su documenti aziendali senza dover riaddestrare il modello.
Esempio: Un chatbot per un’azienda di assicurazioni non deve sapere tutto a memoria. Quando un cliente chiede “come funziona la polizza furto?”, il sistema cerca nei documenti PDF delle polizze il paragrafo giusto, lo passa a GPT, e GPT formula la risposta basata su quei documenti precisi.
Reinforcement Learning / Apprendimento per Rinforzo
Un metodo di addestramento in cui un agente impara provando e sbagliando, ricevendo ricompense (reward) per le azioni giuste e penalità per quelle sbagliate. Come addestrare un cane: quando fa la cosa giusta, premio. Quando sbaglia, niente premio. Con abbastanza iterazioni, l’agente impara il comportamento ottimale.
Esempio: AlphaGo ha imparato a giocare a Go giocando milioni di partite contro se stesso. Ogni vittoria era un “reward”. Ogni mossa che portava alla vittoria veniva rafforzata. Alla fine, ha battuto il campione mondiale.
RLHF (Reinforcement Learning from Human Feedback)
Una tecnica di addestramento che usa il feedback umano per allineare i modelli AI a ciò che gli umani considerano utile e corretto. Dopo l’addestramento iniziale, gli umani valutano le risposte del modello (buona/cattiva, utile/inutile) e il modello viene ulteriormente addestrato usando quei feedback. È il motivo per cui ChatGPT non ti risponde con insulti.
Esempio: Un addestratore umano guarda 100 risposte del modello, dice “questa è utile” e “questa è scortese o errata”. Il modello viene aggiustato per produrre più risposte del primo tipo e meno del secondo. Fatto su milioni di esempi, il modello diventa “allineato” ai valori umani.
Semantic Search
Una ricerca che capisce il significato della query, non solo le parole esatte. Invece di cercare la parola “gatto” in un database, capisce che “felino domestico” e “micio” sono concetti correlati. Usa gli embedding per confrontare il significato della query con quello dei documenti.
Esempio: Cerchi “auto elettriche economiche”. La ricerca semantica ti trova articoli su “veicoli a batteria low-cost” e “mobilità sostenibile accessibile”, anche se nessuno di questi usa le parole esatte della tua query.
Supervised Learning / Apprendimento Supervisionato
Il metodo di addestramento più comune: dai al modello coppie di (input, output desiderato) e lui impara a mappare l’uno all’altro. Come un professore che corregge i compiti: mostra lo sbaglio, mostra la risposta giusta, e lo studente impara a non ripetere l’errore.
Esempio: Gli mostri 50.000 email etichettate come “spam” o “non spam”. Il modello impara i pattern delle email spam. Dopodiché, classificherà automaticamente le nuove email. Questo è supervised learning.
Temperature
Un parametro che controlla quanto un modello è “creativo” nelle risposte. Temperature bassa (vicina a 0): il modello sceglie sempre la parola più probabile, producendo risposte deterministiche e prevedibili. Temperature alta (1 o più): il modello esplora parole meno probabili, producendo risposte più variabili e creative. Non c’è un valore giusto: dipende dal caso d’uso.
Esempio: Temperature 0.1 per scrivere codice (vuoi precisione, non creatività). Temperature 0.9 per scrivere una poesia (vuoi varietà e sorpresa). Temperature 1.5: il modello potrebbe iniziare a produrre nonsenso, perché si spinge troppo in là.
Tensore
Un tensore è una struttura matematica usata per rappresentare dati numerici in una o più dimensioni. In pratica, è una generalizzazione di concetti più semplici come scalari, vettori e matrici.
Uno scalare è un singolo numero, come 5. Un vettore è una lista di numeri, come [1, 2, 3]. Una matrice è una tabella di numeri organizzata in righe e colonne. Un tensore, invece, può avere anche più dimensioni: per esempio, un’immagine a colori può essere rappresentata come un tensore con altezza, larghezza e canali colore.
Nel campo dell’intelligenza artificiale, i tensori sono fondamentali perché permettono ai modelli di lavorare con dati complessi come testi, immagini, audio e video. Le reti neurali trasformano continuamente i dati in tensori, li elaborano attraverso vari livelli e producono nuovi tensori come risultato.
In modo semplice, possiamo dire che un tensore è il formato numerico con cui un modello di AI “vede” e manipola le informazioni.
Token
L’unità base di elaborazione per un LLM. Un token non è una parola: può essere una parola intera, una parte di parola, o anche un singolo carattere. Circa 1 token = 0.75 parole in inglese, qualcosa in meno in italiano. Ogni modello ha un limite massimo di token (la context window), e paghi in base ai token che processi.
Esempio: “Ciao come stai” sono circa 4 token in italiano (“Ciao”, ” come”, ” st”, “ai”). Una pagina A4 standard è circa 500-700 token. GPT-4o supporta fino a 128.000 token, circa 200 pagine di testo.
Training / Addestramento
La fase in cui un modello impara dai dati. Il modello viene esposto a enormi quantità di testo, immagini o altri dati e aggiusta i suoi parametri per minimizzare l’errore nelle predizioni. Il training di modelli grandi costa milioni di dollari in GPU, elettricità e tempo. GPT-4 ha probabilmente richiesto mesi di addestramento continuo su migliaia di GPU.
Esempio: Durante il training, mostri al modello la frase “Il gatto ___ sul divano” e gli fai predire la parola mancante. Se dice “dorme” (corretto), il modello non viene modificato. Se dice “vola” (sbagliato), i parametri vengono leggermente aggiustati per essere più precisi la prossima volta. Fatto miliardi di volte.
Transformer
L’architettura di rete neurale che ha rivoluzionato l’AI. Inventata da Google nel 2017 con il paper “Attention Is All You Need”. Prima dei transformer, l’AI faticava con testo lungo e dipendenze a distanza. Il transformer, grazie al meccanismo di Self-Attention, ha risolto il problema. Ogni LLM moderno è un transformer.
Esempio: Prima dei transformer, tradurre una frase lunga con struttura complessa (“Il libro che Maria, che aveva conosciuto Giovanni l’anno prima, aveva comprato…”) era un incubo. Con i transformer, le connessioni tra parole lontane diventano gestibili. È la differenza tra cercare di capire una frase con un timer di 3 secondi e averla scritta davanti per tutto il tempo che serve.
Unsupervised Learning / Apprendimento Non Supervisionato
Addestramento in cui il modello riceve dati senza etichette e deve trovare pattern da solo. È come dare a qualcuno 10.000 foto senza dirgli cosa rappresentano e chiedergli di raggrupparle per somiglianza. Il modello scopre da solo che esistono gatti, cani, paesaggi, persone.
Esempio: GPT viene addestrato in modo auto-supervisionato (una forma di unsupervised): prende testi da internet, nasconde una parola ogni tanto, e impara a predirla dal contesto. Non c’è un essere umano che gli dice “questa è la parola giusta”. Impara tutto da solo, semplicemente osservando i pattern.
Vector Database / Database Vettoriale
Un database specializzato nella memorizzazione e ricerca di embedding. Invece di cercare per parola chiave esatta come un database tradizionale, cerca per “vicinanza semantica”: dati due embedding, trova quelli più simili. È l’infrastruttura fondamentale per la RAG e la ricerca semantica.
Esempio: Hai 10.000 documenti aziendali. Li trasformi tutti in embedding e li salvi in un vector database. Quando un utente cerca “procedura ferie”, il sistema trasforma la query in embedding e cerca i documenti con embedding più simili, anche se la parola “ferie” non compare mai nei documenti ma compare “assenze” e “congedi”.
Zero-shot / Few-shot
La capacità di un modello di rispondere correttamente a un compito senza aver mai visto esempi simili (zero-shot) o con solo pochi esempi forniti nel prompt (few-shot). Un modello zero-shot generalizza da ciò che ha imparato in fase di training. Il few-shot invece è come fare: “Ecco 3 esempi di come voglio la risposta, ora fallo per questo caso.”
Esempio: Zero-shot: chiedi a GPT “Traduci questa frase in swahili” e lui lo fa, anche se non hai mai menzionato lo swahili prima. Few-shot: “Rispondi in questo formato: Domanda: X, Risposta: Y. Ecco 3 esempi.” Poi fai la quarta domanda e il modello segue lo schema.
Domande frequenti
Nell’AI, cos’è un “parametro” esattamente?
Un numero che rappresenta il peso di una connessione tra due neuroni artificiali. Durante l’addestramento, questi numeri vengono aggiustati per minimizzare gli errori. Pensa a ogni parametro come a una minuscola leva che il modello può spostare per migliorare le sue predizioni. Miliardi di leve insieme creano un sistema capace di linguaggio complesso.
Quanti termini bisogna sapere per usare l’IA seriamente?
Una quindicina bastano per la vita quotidiana: AI, LLM, token, prompt, context window, training, inference, fine-tuning, RAG, hallucination, embedding, modello, parametri, temperature. I restanti sono specializzazioni. Questo glossario li copre tutti proprio perché non devi andare a cercare altrove se ti serve uno in particolare.
Qual è la differenza tra AI, Machine Learning e Deep Learning?
Sono cerchi concentrici. L’AI è il contenitore più grande: tutto ciò che riguarda macchine intelligenti. Il Machine Learning è un sottoinsieme dell’AI in cui la macchina impara dai dati. Il Deep Learning è un sottoinsieme del Machine Learning che usa reti neurali profonde. Quasi tutto quello che senti nominare oggi (ChatGPT, Midjourney, Stable Diffusion) appartiene al Deep Learning.
Cosa significa “temperature” in un modello AI?
Controlla quanto il modello è creativo. Da 0 a 1 (e oltre). Zero: risposte precise, deterministiche, sempre le stesse per lo stesso prompt. 1: più creative, variabili, meno prevedibili. Per scrivere codice si usa temperatura bassa. Per scrivere storie, media. Sopra 1, il modello può allucinare in modo creativo.
Perché l’AI “allucina” e inventa cose false?
Perché i modelli di linguaggio non “sanno” le cose nel senso umano. Sono macchine statistiche che predicono la parola successiva basandosi su pattern visti nei dati di addestramento. Se non hanno il pattern esatto per la tua domanda, ne costruiscono uno plausibile. E può essere sbagliato. Non c’è intenzionalità, non c’è malafede: è semplicemente un limite intrinseco del modo in cui funzionano.

