Google Gemini 3.5 Flash: benchmark, novità e costi API

Al Google I/O debutta Gemini 3.5 Flash: vola nei benchmark, sfida GPT-5.5 e accende il nuovo assistente Spark. Novità e costi API

21 maggio 2026 10:57
Google Gemini 3.5 Flash: benchmark, novità e costi API -
Condividi

Google I/O 2026: Gemini 3.5 Flash è il motore della nuova IA agentica

Il Google I/O 2026 ha sancito il passaggio definitivo dai chatbot testuali alla rivoluzione dell'IA agentica.

Google non presenta più l'intelligenza artificiale solo come un motore generativo, ma come un sistema autonomo capace di pianificare, usare strumenti, lavorare in background e completare compiti complessi. Per guidare questa transizione serviva un modello veloce ed efficace: la risposta è Gemini 3.5 Flash, già disponibile globalmente nell'app Gemini, AI Mode, API, AI Studio, Android Studio, Antigravity ed Enterprise.

La nuova lineup di Big G vedrà presto anche il debutto di Gemini 3.5 Pro, la cui disponibilità è stata indicata genericamente per il mese di giugno. Nel frattempo, la versione Flash si candida a diventare il pilastro dell'ecosistema.

Ecco tutti i dettagli e le novità.

Velocità e benchmark: Gemini 3.5 Flash sfida i top di gamma

A livello di intelligenza pura, Gemini 3.5 Flash si posiziona dalle parti di GPT-5.4 xhigh, un risultato straordinario per un modello ottimizzato per l'uso agentico.

Il dato più rilevante è la velocità di elaborazione dei dati. Durante la demo sul palco del Google I/O, il CEO Sundar Pichai ha mostrato il modello mentre scriveva una versione moderna del celebre gioco Dino di Chrome, raggiungendo l'impressionante velocità di circa 1.500 token al secondo.

I test indipendenti condotti da Artificial Analysis ridimensionano questo picco in condizioni reali, ma confermano un netto vantaggio sui competitor: Gemini 3.5 Flash riesce a macinare circa 4 volte più token al secondo rispetto a Claude Opus 4.7 e GPT-5.5 (xhigh).

Il salto generazionale è evidente anche rispetto al precedente Gemini 3.1 Pro, superato nettamente nei benchmark interni e nei test di settore:

  • TerminalBench 2.1 (coding via Gemini CLI): 76.2% contro il 70.3% di Gemini 3.1 Pro

  • GDPval-AA: 1656 Elo contro 1314

  • MCP Atlas: 83.6% contro 78.2%

  • CharXiv reasoning: 84.2%

Pur non raggiungendo le vette assolute di OpenAI GPT-5.5, questo modello Flash si dimostra competitivo e talvolta superiore ai pesi massimi del settore (inclusi GPT-5.5 e Anthropic Opus 4.7) proprio nei benchmark legati all'uso di tool e all'esecuzione di azioni. Come sottolineato da Pichai, è il primo di una serie di modelli che uniscono l'intelligenza di frontiera all'azione.

Google Omni Flash e i costi delle API per gli sviluppatori

Insieme al modello principale, Google ha svelato anche Gemini Omni Flash, un nuovo modello multimodale progettato per creare qualsiasi cosa partendo da qualunque input.

Tuttavia, le prestazioni e la complessità dell'architettura agentica influiscono sui consumi e sui costi di gestione. Un secondo esame di Artificial Analysis basato sul valore dell'Index Intelligence in rapporto ai token usati rivela che Gemini 3.5 Flash consuma più token rispetto a GPT-5.5 (medium), il quale ottiene anche un punteggio migliore in termini di efficienza.

Questo impatta direttamente sui costi delle API per gli sviluppatori (la variazione non tocca l'utente consumer via app). Se Gemini 3 Flash aveva prezzi di 0,50/3 dollari per milione di token, Gemini 3.5 Flash sale a 1,50/9 dollari per milione di token. Il prezzo triplica, e sebbene non ci sia un incremento prestazionale di tre volte, il modello eccelle rispetto al predecessore in tutti i benchmark, compreso il coding.

Il debutto in Search e l'arrivo dell'assistente Spark

Gemini 3.5 Flash diventa il modello predefinito per l'IA Mode in Search e sarà il motore pulsante di Spark, il nuovo assistente digitale attivo 24 ore su 24, 7 giorni su 7.

Spark non si limiterà a rispondere alle domande dei lettori: prenderà in carico attività complesse, le dividerà in passaggi intermedi, utilizzerà app e documenti autorizzati e continuerà a lavorare in background.

Al momento l'assistente è in distribuzione per un gruppo selezionato di utenti tester, per poi entrare in fase beta negli Stati Uniti. Per vederlo integrato nei dispositivi in Europa, invece, passeranno probabilmente diversi mesi.

Vuoi restare sempre aggiornato sul mondo tech?

👉 Iscriviti al canale WhatsApp di YourLifeUpdated
Ricevi solo le notizie e le guide più importanti, senza spam.

Hai bisogno di aiuto o consigli rapidi?

💬 Supporto diretto: entra nel gruppo Telegram – CLICCA QUI
👥 In alternativa, unisciti al nostro Gruppo Facebook

🔥 Le migliori offerte tech, ogni giorno

💰 Unisciti al gruppo OFFERTE TECH (oltre 16.000 utenti)
Seleziono solo offerte davvero convenienti per farti risparmiare tempo e denaro.

Seguici anche qui:

📰 Google News o Facebook – per non perdere nessuna novità
🎥 YouTube – recensioni oneste, test e guide pratiche

💡 Vuoi risparmiare su Amazon?

🚀 Prova Amazon Prime gratis oppure
🛒 scopri le migliori offerte Amazon di oggi

Le migliori notizie, ogni giorno, via e-mail