L'ultimo modello di intelligenza artificiale di Anthropic batte i rivali e raggiunge il primo posto nel settore | Intelligenza-Artificiale

L'ultimo modello linguistico all'avanguardia di Anthropic, Claudio 3ha superato concorrenti come ChatGPT e Gemini di Google per stabilire nuovi standard di settore in termini di prestazioni e capacità.

Secondo Anthropic, Claude 3 non solo ha superato i suoi predecessori, ma ha anche raggiunto competenze “quasi umane” in vari compiti. L'azienda attribuisce questo successo a test e sviluppo rigorosi, culminati in tre distinte varianti di chatbot: Haiku, Sonnet e Opus.

Sonnet, il motore dietro il chatbot Claude.ai, offre prestazioni senza precedenti ed è disponibile gratuitamente con una semplice iscrizione via e-mail. Opus, il modello di punta, vanta funzionalità multimodali, integrando perfettamente input di testo e immagini. Con un servizio in abbonamento chiamato “Claude Pro”, Opus promette maggiore efficienza e precisione per soddisfare un'ampia gamma di esigenze dei clienti.

Tra le rivelazioni degne di nota riguardanti l'uscita di Claude 3 c'è una divulgazione di Alex Albert su X (ex Twitter). Albert ha dettagliato un'osservazione unica nel settore durante la fase di test di Claude 3 Opus, la variante LLM più potente di Anthropic, in cui il modello ha mostrato segni di consapevolezza che era in fase di valutazione.

Durante il processo di valutazione, i ricercatori miravano a valutare la capacità di Opus di individuare informazioni specifiche all'interno di un vasto set di dati fornito dagli utenti e di richiamarle in seguito. In uno scenario di test noto come valutazione “dell’ago nel pagliaio”, Opus è stato incaricato di rispondere a una domanda sui condimenti per la pizza sulla base di un’unica frase pertinente sepolta tra dati non correlati. Sorprendentemente, Opus non solo ha individuato la frase corretta, ma ha anche espresso il sospetto che fosse sottoposta a un test.

La risposta di Opus ha rivelato di aver compreso l'incongruenza delle informazioni inserite nel dataset, suggerendo ai ricercatori che lo scenario potrebbe essere stato ideato per valutare le sue capacità di attenzione:

Storia divertente dai nostri test interni su Claude 3 Opus. Ha fatto qualcosa che non avevo mai visto prima da un LLM mentre stavamo eseguendo la valutazione dell'ago nel pagliaio.

Per lo sfondo, questo testa la capacità di richiamo di un modello inserendo una frase target (l'”ago”) in un corpus di… pic.twitter.com/m7wWhhu6Fg

— Alex (@alexalbert__) 4 marzo 2024

Anthropic ha evidenziato le capacità in tempo reale di Claude 3, sottolineando la sua capacità di potenziare le interazioni in tempo reale con i clienti e semplificare le attività di estrazione dei dati. Questi progressi non solo garantiscono risposte quasi istantanee, ma consentono anche al modello di gestire istruzioni complesse con precisione e velocità.

Nei test benchmark, Opus è emerso come un favorito, superando GPT-4 nel ragionamento di livello universitario ed eccellendo in compiti che coinvolgono matematica, programmazione e recupero della conoscenza. Inoltre, Sonnet ha mostrato notevole velocità e intelligenza, superando i suoi predecessori con un margine considerevole:

Haiku, l'iterazione compatta di Claude 3, si distingue come il modello più veloce ed economico disponibile, in grado di elaborare documenti di ricerca densi in pochi secondi.

In particolare, le capacità avanzate di elaborazione visiva di Claude 3 segnano un progresso significativo, consentendo al modello di interpretare un'ampia gamma di formati visivi, dalle foto ai diagrammi tecnici. Questa funzionalità ampliata non solo migliora la produttività, ma garantisce anche una comprensione approfondita delle richieste degli utenti, riducendo al minimo il rischio di trascurare contenuti innocui e rimanendo vigili contro potenziali danni.

Anthropic ha inoltre sottolineato il proprio impegno per l’equità, delineando dieci pilastri fondamentali che guidano lo sviluppo di Claude AI. Inoltre, le partnership strategiche dell'azienda con i giganti della tecnologia come Google significare un significativo voto di fiducia nelle capacità di Claude.

Con Opus e Sonnet già disponibili tramite l'API di Anthropic e Haiku pronto a seguirne l'esempio, l'era di Claude 3 rappresenta una pietra miliare nell'innovazione dell'intelligenza artificiale.

(Credito immagine: Antropico)

Guarda anche: Le IA in India avranno bisogno dell’autorizzazione del governo prima del lancio

Vuoi saperne di più sull'intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell'intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L'evento completo è collocato in contemporanea con altri eventi importanti, tra cui BlockX, Settimana della trasformazione digitaleE Fiera sulla sicurezza informatica e sul cloud.

Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.

Tag: ai, antropico, intelligenza artificiale, segno di riferimento, Claudio 3, haiku, modello linguistico di grandi dimensioni, llm, opus, sonetto

Fonte: www.artificialintelligence-news.com

Categorie

Lascia un commento Annulla risposta

Articoli Correlati

Ultimi post

Fondo sovrano britannico per l’intelligenza artificiale per costruire infrastrutture informatiche nazionali | Intelligenza-Artificiale

Perché la sottoscrizione di assicurazioni basate sull’intelligenza artificiale sta finalmente attirando capitale istituzionale | Intelligenza-Artificiale

City Union Bank lancia un centro AI per supportare le operazioni bancarie | Intelligenza-Artificiale

Scalare l’automazione intelligente senza interrompere i flussi di lavoro in tempo reale | Intelligenza-Artificiale

Informazioni

Seguici

Lascia un commento Annulla risposta

Articoli Correlati