Di cosa parleremo..
GPT-5.6 Sol presentato — accesso limitato ai partner approvati dalla Casa Bianca
Il 26 giugno OpenAI ha svelato la nuova famiglia di modelli GPT-5.6, composta da tre varianti: Sol, Terra e Luna. Il top di gamma, GPT-5.6 Sol, eccelle in coding, biologia e cybersecurity.
La novità più discussa, però, è stata la decisione di limitare il rilascio iniziale a un ristretto gruppo di partner fidati approvati dall’amministrazione Trump per una valutazione dei rischi informatici. OpenAI ha dichiarato di non ritenere che questo livello di controllo governativo debba diventare la norma, ma lo considera un passo temporaneo verso una distribuzione più ampia.
Jalapeño: il primo chip AI custom di OpenAI con Broadcom
Il 24 giugno OpenAI e Broadcom hanno presentato Jalapeño, il primo chip di inferenza AI progettato su misura da OpenAI. Progettato e portato in produzione in soli nove mesi (accelerato dagli stessi modelli di OpenAI), promette prestazioni per watt significativamente superiori agli attuali state-of-the-art.
La mossa segnala l’ambizione di OpenAI di diventare un operatore full-stack, dal silicio al software, riducendo la dipendenza da NVIDIA per l’inferenza.
Daybreak si espande: Patch the Planet, GPT-5.5-Cyber e partnership IBM
Il 22 giugno OpenAI ha ampliato il programma di cybersecurity Daybreak con l’iniziativa open-source Patch the Planet, che combina ricerca di sicurezza assistita dall’IA con revisione umana per identificare vulnerabilità nel software open-source critico. OpenAI ha anche rilasciato completamente il suo modello difensivo GPT-5.5-Cyber.
IBM ha annunciato la sua adesione al Daybreak Cyber Partner Program, mentre Darktrace ha stretto una partnership per integrare le capacità di OpenAI nei suoi prodotti di cybersecurity.
OpenAI valuta un rinvio dell’IPO al 2027
Secondo report della settimana, OpenAI starebbe valutando di posticipare l’IPO al 2027, invertendo la rotta rispetto a una precedente tempistica che indicava fine 2026.
La decisione sarebbe influenzata da mercati “instabili” e dal turbolento debutto pubblico di SpaceX di Elon Musk.
HP e OpenAI: partnership strategica
Il 28 giugno HP Inc. ha annunciato una partnership strategica con OpenAI, integrando la piattaforma Frontier per migliorare le esperienze cliente e accelerare le operazioni interne.
Apple Vision Pro VP passa a OpenAI
Paul Meade, VP Apple che guidava il team Vision Pro, lascia Apple per unirsi al team hardware di OpenAI. La mossa segue l’acquisizione da parte di OpenAI della startup “io” di Jony Ive, ex chief design officer Apple.
GPT-4.5 ritirato, GPT-5.5 standard dal 26 giugno
OpenAI ha ritirato GPT-4.5 il 26 giugno, migrando le conversazioni esistenti a GPT-5.5. Codex Remote è diventato disponibile su tutti i piani ChatGPT, e le funzionalità di finanza personale sono state estese agli utenti Plus e Android.
Anthropic: USA sbloccano Mythos 5 per 100+ istituzioni
Il 26 giugno il governo USA ha parzialmente revocato il ban di due settimane su Claude Mythos 5, autorizzando Anthropic a rilasciare il modello a oltre 100 istituzioni americane, tra cui grandi aziende e agenzie governative. Il ban era stato imposto per timori di “jailbreaking” e sicurezza nazionale.
Anthropic sta lavorando per ampliare ulteriormente l’accesso. Il modello Fable 5 rimane invece sotto controllo all’esportazione. La mossa segna l’inizio di un nuovo quadro normativo per i modelli frontier.
Anthropic: IPO depositata, Claude Tag e Claude Design aggiornati
Anthropic ha depositato la documentazione confidenziale per l’IPO il 1° giugno, dopo un round Series H da $65 miliardi a una valutazione post-money di $965 miliardi. Claude ha ricevuto aggiornamenti significativi: il 23 giugno è stato introdotto Claude Tag, che permette di taggare Claude in Slack come membro del team (Andrej Karpathy ha sottolineato che il ~65% del codice del team prodotto di Anthropic è generato tramite Claude Tag).
Claude Design ha ricevuto aggiornamenti il 25 giugno, e Trusted Devices per Remote Control Admins è stato introdotto per Team ed Enterprise.
Google: Gemini 3.5 Flash con computer use, ritardo per Gemini 3.5 Pro
Il 24 giugno Google ha introdotto le capacità di computer use per Gemini 3.5 Flash, permettendo al modello di percepire e interagire con schermi, GUI, browser, mobile e desktop. La feature è in public preview e semplifica la creazione di agenti automatici. Gemini 3.5 Flash è ora 4 volte più veloce delle precedenti opzioni top-tier e funge da layer di inferenza predefinito in Google Search e nelle app consumer. Il rilascio di Gemini 3.5 Pro è stato invece rimandato a luglio per raccogliere più feedback. Google DeepMind ha anche aperto un programma di grant per la sicurezza multi-agente da $10 milioni.
Google DeepMind: esodo di talenti — Noam Shazeer a OpenAI, John Jumper ad Anthropic
La settimana ha visto un significativo esodo da Google DeepMind. Noam Shazeer, co-autore del paper Transformer, è passato a OpenAI. John Jumper, premio Nobel per AlphaFold, è andato ad Anthropic. Altri due ricercatori Gemini seguirebbero Jumper. La notizia ha causato un calo del titolo Alphabet.
Microsoft: Copilot Cowork e Scout in GA, agent-first AI, Claude in M365
Microsoft ha dichiarato la disponibilità generale di Copilot Cowork (sistema agentico per task multi-strumento complessi) e ha introdotto Microsoft Scout (agente personale always-on). Entrambi utilizzano un pricing a consumo con Copilot Credits. L’API Work IQ è in GA dalla settimana precedente. Novità interessante: i modelli Anthropic Claude sono ora disponibili come opzione in Microsoft 365 Copilot Chat. Microsoft ha anche ripreso l’installazione automatica dell’app Copilot su PC Windows aziendali (opt-out per gli admin). Nuove funzionalità AI in Education: Copilot Notebooks, Study and Learn Agent, Unit Plans in Teach.
NVIDIA in calo, nuova architettura DSX per data center AI
NVDA ha chiuso la settimana in calo: da $208.65 di lunedì a $192.53 venerdì (-7.7% settimanale). Sul fronte prodotti, NVIDIA ha presentato l’architettura DSX AI Factory, che sostituisce le torri di raffreddamento evaporativo con sistemi a liquido a circuito chiuso, rimuovendo un collo di bottiglia significativo per l’espansione dei data center AI (il raffreddamento conta per circa il 40% del consumo elettrico di un data center). L’acqua calda in uscita (~54°C) potrebbe essere riutilizzata per edifici vicini o processi industriali.
xAI: Grok 4.5 in beta privata a SpaceX e Tesla
Elon Musk ha annunciato che Grok 4.5 è entrato in beta testing privato all’interno di SpaceX e Tesla. Basato sul modello V9 di xAI da 1,5 trilioni di parametri (circa 3x più grande del precedente V8-small), include dati di training supplementari dalla piattaforma di coding Cursor. Musk sostiene che le prestazioni siano paragonabili, se non superiori, a Claude Opus (dichiarazioni non verificate indipendentemente). xAI prevede nuovi modelli “addestrati da zero” ogni mese per il resto dell’anno.
Mistral AI: OCR 4, data center Les Ulis, valutazione da €20 miliardi
Mistral ha lanciato OCR 4 il 23 giugno, un modello avanzato di document intelligence con bounding box, classificazione a blocchi (titoli, tabelle, equazioni, firme) e punteggi di confidenza. Supporta 170 lingue e processa fino a 2.000 pagine al minuto su una singola GPU. Mistral ha annunciato un nuovo data center a Les Ulis (Q3 2026) per capacità di inferenza sicura. Secondo indiscrezioni, Mistral sarebbe in trattative per raccogliere circa 3 miliardi di euro a una valutazione di 20 miliardi di euro. La partnership con BMW Group per la simulazione di crash con AI è operativa.
Meta: AI sostituisce moderator umani, leak dati su Model Capability Initiative
Meta sta accelerando i piani per sostituire migliaia di moderatori umani con IA generativa. L’azienda ha anche messo in pausa il programma interno di training AI “Model Capability Initiative” dopo che un leak ha esposto dati sensibili dei dipendenti.
Un memo interno di Zuckerberg del 12 giugno riconosce errori nella ristrutturazione della forza lavoro (8.000 licenziamenti a maggio, 7.000 trasferiti in ruoli AI).
Gli USA stanno facendo pressione su Meta per sottoporre volontariamente i suoi sistemi AI a revisione federale.
Open Source: DeepSeek Sparse Attention, Krea 2 Turbo, Hugging Face Transformers v5
Settimana ricca per l’open-source AI. DeepSeek-V3.2-Exp introduce DeepSeek Sparse Attention (DSA), un meccanismo di attenzione sparsa addestrabile per migliorare l’efficienza in contesti lunghi. Krea 2 Turbo (22 giugno) è un modello text-to-image da 12 miliardi di parametri con architettura Diffusion Transformer, rilasciato su Hugging Face. NVIDIA GLM-5.2 NVFP4 (25 giugno) è la versione quantizzata del modello GLM-5.2. Hugging Face ha rilasciato Transformers v5 con supporto migliorato per modelli Mixture-of-Experts.
Meta AI: AI ads tools a Cannes Lions 2026
Meta ha presentato nuovi strumenti AI per marketer e creator a Cannes Lions 2026: una soluzione end-to-end per la creazione di annunci AI-enabled e strumenti unificati di partnership creator.
Regolamentazione AI: USA firmano executive order, EU posticipa scadenze
Il 2 giugno il Presidente Trump ha firmato un Executive Order che istituisce un quadro volontario per la condivisione dei modelli frontier con il governo federale fino a 30 giorni prima del rilascio pubblico. Il 4 giugno è stato presentato il “Great American Artificial Intelligence Act of 2026”, il primo tentativo di regolamentazione federale completa dell’AI. In Europa, il Parlamento Europeo ha approvato emendamenti all’AI Act posticipando le principali scadenze di compliance per i sistemi ad alto rischio al 2 dicembre 2027 (dal 2 agosto 2026).
Alibaba/Qwen: nuovi modelli cinesi in arrivo
Alibaba ha annunciato nuovi modelli della serie Qwen in fase di training, confermando la corsa ai modelli frontier anche dal lato cinese, in un contesto di crescenti tensioni geopolitiche sull’accesso ai chip NVIDIA avanzati.
Apple Intelligence svelata al WWDC 2026 — più nel dettaglio
Al WWDC 2026 di inizio giugno Apple ha svelato una Siri AI completamente ricostruita, basata su Apple Foundation Models alimentati da modelli Gemini di Google. Le novità includono AI Extend e Reframe in Foto, Visual Intelligence in Camera, e integrazione Siri in tutte le app di sistema. I developer beta sono disponibili per iOS 27, iPadOS 27 e macOS 27.
Come funziona
Questa settimana parliamo di DeepSeek Sparse Attention (DSA), il meccanismo di attenzione sparsa introdotto in DeepSeek-V3.2-Exp.
L’attenzione tradizionale (full attention) in modelli come GPT-5.5 o Claude Sonnet 4 calcola il peso di ogni parola rispetto a tutte le altre nella sequenza. È un’operazione che scala in modo quadratico: se la sequenza raddoppia, il costo quadruplica. Per modelli come DeepSeek-V3 (671B parametri MoE) che operano su contesti di centinaia di migliaia di token, questo costo diventa proibitivo.
La Sparse Attention rompe questo collo di bottiglia: invece di calcolare l’attenzione su tutti i token, seleziona solo un sottoinsieme rilevante per ogni query, riducendo il costo computazionale in modo drastico (da O(n²) a O(n log n)).
Ciò che rende innovativo il DSA di DeepSeek è che la sparsità non è fissata staticamente (come nei modelli Sparse Transformer di OpenAI del 2019), ma è addestrabile: il modello impara quali connessioni sono più informative durante il training stesso. Inoltre, DSA è fine-grained: invece di bloccare l’attenzione in chunk fissi, permette una selezione a grana fine, preservando dettagli cruciali che altrimenti andrebbero persi.
Il risultato? DeepSeek può gestire contesti lunghissimi (milioni di token teorici) con un costo di inferenza molto più basso rispetto a modelli full-attention comparabili come Qwen 3 o Gemini 2.5 Pro.
È una delle ragioni per cui DeepSeek riesce a offrire prestazioni competitive con un’infrastruttura notevolmente più leggera.
FAQ
GPT-5.6 Sol è disponibile per tutti?
No, al momento solo per un gruppo ristretto di partner approvati dall’amministrazione USA per una valutazione di cybersecurity di 30 giorni. OpenAI prevede di ampliare l’accesso successivamente.
Cosa cambia con il chip Jalapeño di OpenAI?
Jalapeño è il primo chip di inferenza AI custom di OpenAI, sviluppato con Broadcom in soli 9 mesi. Promette prestazioni per watt superiori e segnala la strategia di OpenAI di integrarsi verticalmente, riducendo la dipendenza da NVIDIA per l’inferenza dei modelli.
Cos’è Claude Tag?
Claude Tag è una funzionalità di Anthropic che permette di menzionare Claude nei canali Slack come membro del team, permettendogli di mantenere il contesto, partecipare a discussioni e fornire aggiornamenti proattivi. Secondo Karpathy, il 65% del codice del team prodotto Anthropic è già generato tramite questo strumento.
Perché NVIDIA è scesa questa settimana?
NVDA ha perso circa il 7.7% settimanale, influenzata da: presentazione del chip custom Jalapeño di OpenAI (che ridurrà la dipendenza da NVIDIA), esodo di talenti da Google DeepMind, e un contesto di mercato incerto per i semiconduttori AI dopo il boom iniziale. L’attenzione degli investitori si sta spostando dai chip training a quelli inference, dove la concorrenza si intensifica.
Il Great American AI Act cosa prevede?
È una proposta di legge bipartisan per la prima regolamentazione federale completa dell’AI negli USA. Mira a regolamentare i grandi sviluppatori di modelli frontier (OpenAI, Anthropic, Google, Meta, xAI) con requisiti di trasparenza, whistleblower protection e cybersecurity. Prevede una prelazione triennale sulle leggi statali per lo sviluppo di modelli AI. È ancora un discussion draft in cerca di feedback.

