
Gemelli 2.5 viene salutato Google DeepMind Come il suo “modello AI più intelligente” fino ad oggi.
Il primo modello di questa ultima generazione è una versione sperimentale di Gemini 2.5 Pro, che secondo DeepMind ha ottenuto risultati all'avanguardia in una vasta gamma di parametri di riferimento.
Secondo Koray Kavukcuoglu, CTO di Google DeepMind, i modelli Gemini 2.5 sono “modelli di pensiero”. Ciò significa la loro capacità di ragionare attraverso i loro pensieri prima di generare una risposta, portando a prestazioni migliorate e una migliore precisione.
La capacità di “ragionamento” si estende oltre la semplice classificazione e previsione, spiega Kavukcuoglu. Comprende la capacità del sistema di analizzare le informazioni, dedurre conclusioni logiche, incorporare il contesto e la sfumatura e, in definitiva, prendere decisioni informate.
DeepMind ha esplorato i metodi per migliorare per qualche tempo le capacità di intelligenza e ragionamento dell'IA, impiegando tecniche come l'apprendimento del rinforzo e la propulsione della catena. Questa base ha portato alla recente introduzione del loro primo modello di pensiero, Gemini 2.0 Flash Thinking.
“Ora, con Gemini 2.5”, afferma Kavukcuoglu, “abbiamo raggiunto un nuovo livello di prestazioni combinando un modello di base significativamente migliorato con un post-formazione migliorato”.
Google prevede di integrare queste capacità di pensiero direttamente in tutti i suoi modelli futuri, abilitandoli per affrontare problemi più complessi e supportare agenti più capaci e consapevoli del contesto.
Gemini 2.5 Pro protegge la classifica Lmarena Top Spot
Gemini 2.5 Pro Experimental è posizionato come modello più avanzato di DeepMind per gestire compiti intricati. Al momento della stesura, si è assicurato il primo posto nella classifica Lmarena-una metrica chiave per valutare le preferenze umane-con un margine significativo, dimostrando un modello altamente capace con uno stile di alta qualità:

Gemini 2.5 è un “professionista” in matematica, scienza, programmazione e ragionamento
Gemini 2.5 Pro ha dimostrato prestazioni all'avanguardia in vari benchmark che richiedono ragionamento avanzato.
In particolare, conduce in benchmark di matematica e scienze-come GPQA e AIME 2025-senza fare affidamento su tecniche di tempo che aumentano i costi, come il voto della maggioranza. Ha anche ottenuto un punteggio all'avanguardia del 18,8% sull'ultimo esame dell'umanità, un set di dati progettato da esperti in materia per valutare la frontiera umana della conoscenza e del ragionamento.
DeepMind ha posto un'enfasi significativa sulle prestazioni di codifica e Gemini 2.5 rappresenta un salto sostanziale in avanti rispetto al suo predecessore, 2.0, con ulteriori miglioramenti nella pipeline. 2.5 Pro eccelle nella creazione di applicazioni Web visivamente convincenti e applicazioni di codice agente, nonché trasformazione e modifica del codice.
Su SWE-Bench Verified, lo standard del settore per le valutazioni del codice agente, Gemini 2.5 Pro ha ottenuto un punteggio del 63,8% utilizzando una configurazione di agenti personalizzati. Le funzionalità di ragionamento del modello le consentono anche di creare un videogioco generando codice eseguibile da un prompt a linea singola.
Costruire sui punti di forza dei suoi predecessori
Gemelli 2.5 si basa su I punti di forza del nucleo di precedenti modelli gemini, tra cui multimodalità nativa e una lunga finestra di contesto. 2.5 Pro lancia con una finestra di contesto di un milione di token, con piani per espanderlo presto a due milioni di token. Ciò consente al modello di comprendere vasti set di dati e gestire problemi complessi da diverse fonti di informazione, che abbracciano testi, audio, immagini, video e persino interi repository di codice.
Gli sviluppatori e le imprese possono ora iniziare a sperimentare Gemini 2.5 Pro in Google AI Studio. Gli utenti avanzati di Gemini possono anche accedervi tramite il menu a discesa del modello su piattaforme desktop e mobili. Il modello verrà lanciato Vertex ai Nelle prossime settimane.
Google DeepMind incoraggia gli utenti a fornire feedback, che verranno utilizzati per migliorare ulteriormente le capacità di Gemini.
(Foto di Anshita Nair)
Vedi anche: DeepSeek V3-0324 TOP Modelli di AI non ragionato in open source prima

Vuoi saperne di più sull'intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L'evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.
Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.
Fonte: www.artificialintelligence-news.com