xAI ha annunciato il rilascio di Grok-2, un importante aggiornamento che vanta funzionalità migliorate in termini di chat, codifica e ragionamento.
Oltre a Grok-2, xAI ha introdotto Grok-2 mini, una versione più piccola ma capace del modello principale. Entrambi sono attualmente in versione beta su X e saranno resi disponibili tramite l'API aziendale di xAI più avanti nel mese.
Una prima versione di Grok-2 è stata testata su LMSYS classifica sotto lo pseudonimo “sus-column-r”.
Al momento dell'annuncio, xAI afferma di avere prestazioni migliori sia di Anthropic Claude 3.5 Sonetto e GPT-4-Turbo di OpenAI. Tuttavia, vale la pena notare che GPT-4o attualmente detiene il primo posto come miglior assistente AI in termini di capacità complessive, seguito da Google Gemelli 1.5.
Il processo di valutazione interna di xAI impiega AI Tutor per valutare i modelli in vari compiti del mondo reale. L'azienda afferma che “Grok-2 ha mostrato miglioramenti significativi nel ragionamento con i contenuti recuperati e nelle sue capacità di utilizzo degli strumenti, come l'identificazione corretta delle informazioni mancanti, il ragionamento attraverso sequenze di eventi e l'eliminazione di post irrilevanti”.
I risultati di benchmark condivisi da xAI indicano che sia Grok-2 che Grok-2 mini dimostrano miglioramenti sostanziali rispetto a Grok-1.5. I modelli mostrano prestazioni competitive in aree quali conoscenze scientifiche a livello di laurea, cultura generale e problemi di competizione matematica. In particolare, Grok-2 eccelle in attività basate sulla vista, offrendo prestazioni all'avanguardia nel ragionamento matematico visivo e nelle risposte alle domande basate su documenti.
La nuova esperienza Grok su X presenta un'interfaccia riprogettata e nuove funzionalità. Gli abbonati Premium e Premium+ avranno accesso sia a Grok-2 che a Grok-2 mini. xAI descrive Grok-2 come “più intuitivo, orientabile e versatile in un'ampia gamma di attività, sia che tu stia cercando risposte, collaborando alla scrittura o risolvendo attività di codifica”.
xAI collabora anche con Laboratori della Foresta Nera per sperimentare il loro modello FLUX.1 per espandere le capacità di Grok su X.
Per gli sviluppatori, xAI lancerà una piattaforma API aziendale entro la fine del mese. L'azienda promette funzionalità di sicurezza avanzate, statistiche di traffico complete e analisi di fatturazione avanzate. Sarà inoltre disponibile un'API di gestione per integrare la gestione di team, utenti e fatturazione in strumenti e servizi esistenti.
Guardando al futuro, xAI prevede di implementare la comprensione multimodale come parte fondamentale dell'esperienza Grok sia su X che sull'API. Il rapido progresso dell'azienda dall'annuncio di Grok-1 nel novembre 2023 è attribuito a “un piccolo team con la più alta densità di talenti”.
L'attenzione di xAI rimane rivolta al miglioramento delle capacità di ragionamento di base con il suo nuovo cluster di elaborazione, in quanto mira a mantenere la sua posizione in prima linea nello sviluppo dell'IA. Tuttavia, l'azienda ha recentemente concordato per interrompere l’uso di alcuni dati dell’UE per addestrare i suoi modelli.
Sebbene il rilascio di Grok-2 rappresenti una pietra miliare significativa per xAI, è chiaro che il panorama dell'IA rimane altamente competitivo. Con ChatGPT-4o e Gemini 1.5 di Google in testa al gruppo, e altri attori importanti come Anthropic che continuano a fare progressi, la corsa per la supremazia dell'IA è tutt'altro che finita.
Vedi anche: SingularityNET punta sulla rete di supercomputer per fornire AGI
Vuoi saperne di più sull'intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera AI e Big Data che si svolge ad Amsterdam, California e Londra. L'evento completo è co-localizzato con altri eventi leader tra cui Conferenza sull'automazione intelligente, BloccoX, Settimana della Trasformazione DigitaleE Fiera della sicurezza informatica e del cloud.
Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.
Fonte: www.artificialintelligence-news.com