Il modello AI di “ricerca della verità” di prossima generazione

 | Intelligenza-Artificiale

XAI ha presentato il suo modello Grok 3 AI lunedì, insieme a nuove funzionalità come l'analisi delle immagini e una risposta raffinata delle domande.

La società ha sfruttato un immenso data center dotato di circa 200.000 GPU per sviluppare Grok 3. Secondo il proprietario di Xai Elon Musk, questo progetto ha utilizzato “10x” più potenza di calcolo rispetto al suo predecessore, Grok 2, con un set di dati ampliato che secondo quanto riferito include le informazioni da legale Dencero dei casi.

Musk ha affermato che Grok 3 è un “AI in cerca di verità al massimo, anche se quella verità è talvolta in contrasto con ciò che è politicamente corretto”.

Il lancio di Grok 3 include una famiglia di modelli progettati per esigenze diverse. Grok 3 Mini, ad esempio, dà la priorità ai tempi di risposta più rapidi rispetto all'accuratezza assoluta. Tuttavia, particolarmente degne di nota sono i nuovi modelli Grok 3 focalizzati sul ragionamento.

Soprannominato ragionamento Grok 3 e ragionamento Mini Grok 3, queste varianti mirano a emulare i processi cognitivi simili a umani ponendo “pensando attraverso” problemi. Paragonabili a modelli come O3-Mini di Openi e R1 di DeepSeek, questi sistemi di ragionamento tentano di verificare le loro risposte, riducendo la probabilità di errori o passi falsi.

Grok 3: i risultati del benchmark

Xai afferma che Grok 3 supera GPT-4O di Openi in alcuni parametri di riferimento, tra cui AIME e GPQA, che valutano la competenza del modello nell'affrontare problemi complessi attraverso la matematica, la fisica, la biologia e la chimica.

La prima versione di Grok 3 è attualmente in corso in Chatbot Arena, una piattaforma di valutazione crowdsourcing in cui gli utenti mettono i modelli AI l'uno contro l'altro e classificano i loro risultati. Il modello è il primo a rompere il punteggio 1400 dell'arena.

Secondo Xai, il ragionamento Grok 3 supera i suoi rivali su una varietà di benchmark di spicco:

I risultati del benchmark di ragionamento del modello Grok 3 AI di XAI rispetto ad altri principali modelli di intelligenza artificiale di Google, DeepSeek e OpenAI.

Questi modelli di ragionamento sono già integrati nelle funzionalità disponibili tramite l'app Grok. Gli utenti possono selezionare comandi come “Think” o attivare la modalità “Big Brain” più intensiva computazionale per affrontare domande particolarmente impegnative.

XAI ha posizionato i modelli di ragionamento come strumenti ideali per applicazioni STEM (scienza, tecnologia, ingegneria e matematica), tra cui sfide matematiche, scienze e codifica.

A guardia della distillazione dell'IA

È interessante notare che non tutti i processi interni di Grok 3 sono messi a nudo per gli utenti. Musk ha spiegato che alcuni “pensieri” dei modelli di ragionamento sono intenzionalmente oscurati per prevenire la distillazione, una pratica controversa in cui gli sviluppatori di intelligenza artificiale in competizione estraggono conoscenza da modelli proprietari.

La pratica è stata messa sotto i riflettori nelle ultime settimane dopo che la ditta dell'IA cinese Deepseek ha affrontato le accuse di distillare i modelli di Openai Per sviluppare il suo ultimo modello, R-1.

I nuovi modelli di ragionamento di Xai fungono da base per una nuova funzione di app Grok chiamata DeepSearch. La funzionalità utilizza i modelli Grok per scansionare la piattaforma social di Internet e Musk, X, per informazioni pertinenti prima di sintetizzare un astratto dettagliato in risposta alle query degli utenti.

Accesso a Grok 3 e impegnarsi in open source

L'accesso all'ultimo modello Grok è attualmente legato ai livelli di abbonamento di X. Gli abbonati Premium+, che pagano $ 50 (~ £ 41) al mese, riceveranno l'accesso prioritario alle ultime funzionalità.

XAI sta inoltre introducendo un piano di abbonamento Supergrok, secondo quanto riferito a $ 30 al mese o $ 300 all'anno. Gli abbonati di Supergrok trarranno beneficio da capacità di ragionamento migliorate, più query DeepSearch e funzionalità di generazione di immagini illimitate.

La società ha anche preso in giro le prossime funzionalità. Nel giro di una settimana, l'app Grok dovrebbe introdurre una modalità vocale, abilitando gli utenti a interagire con l'IA attraverso una voce sintetizzata simile a Gemelli vivono.

Musk ha inoltre rivelato i piani di rilasciare modelli GROK 3 tramite un'API pronta per le imprese nelle prossime settimane, con funzionalità DeepSearch inclusa.

Sebbene Grok 3 sia ancora fresco, Xai intende oppen-source il suo predecessore nei prossimi mesi. Musk afferma che Xai continuerà ad oppen-source l'ultima versione di Grok.

“Quando Grok 3 è maturo e stabile, che è probabilmente entro pochi mesi, allora openeremo Grok 2”, spiega Musk.

Il modello AI “anti-woke”

Grok è stato a lungo commercializzato come non filtrato, audace e disposto a impegnarsi con domande che i concorrenti potrebbero evitare. Musk aveva precedentemente descritto l'IA come “Anti-Woke”, presentandolo come un modello senza paura di toccare argomenti controversi.

Fedele alla sua promessa, i primi modelli come Grok e Grok 2 hanno abbracciato le domande politicamente cariche, persino vibrando in un linguaggio colorato quando spinto. Tuttavia, queste versioni hanno anche rivelato alcuni pregiudizi quando si sono approfonditi nel discorso politico.

“Stiamo lavorando per spostare Grok più vicino al neutro politicamente”, ha detto Musk.

Tuttavia, se Grok 3 raggiunge questo obiettivo resta da vedere. Con tali cambiamenti in gioco, gli analisti stanno già evidenziando il potenziale Impatti sociali di introdurre sistemi di intelligenza artificiale sempre più “in cerca di verità” ma politicamente sensibili.

Con Grok 3, Musk e Xai hanno fatto una dichiarazione audace, spingendo la loro tecnologia mentre potenzialmente alimentando i dibattiti attorno a pregiudizi, trasparenza e L'etica della distribuzione dell'IA.

Poiché i concorrenti come Openai, Google e DeepSeek perfezionano le loro offerte, il successo di Grok 3 dipenderà dalla sua capacità di bilanciare l'accuratezza, la domanda degli utenti e la responsabilità sociale.

Vedi anche: AI nel 2025: modelli guidati dallo scopo, integrazione umana e altro ancora

Vuoi saperne di più sull'intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L'evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber ​​Security & Cloud Expo.

Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *