Anthropic rilascia Claude Opus 4.8 | Intelligenza-Artificiale

Anthropic ha rilasciato Claude Opus 4.8, un aggiornamento a Claude Opus 4.7 che, secondo l’azienda, apporta risultati migliori per la codifica, il lavoro degli agenti, il ragionamento e il lavoro di conoscenza. La piattaforma può essere utilizzata tramite claude.ai, Claude Code e Claude API, con il nome API claude-opus-4-8.

L’azienda ha anche modificato alcuni dettagli della sua linea di prodotti. Gli utenti di claude.ai e Cowork possono impostare la quantità di sforzo che Claude applica a una risposta, in sostanza, influenzando il numero di token che il modello brucerà. Claude Code dispone anche di flussi di lavoro dinamici, una funzionalità che pianifica il lavoro, esegue agenti secondari paralleli, verifica gli output e riporta all’utente. Infine, l’API Messaggi accetta modifiche in tempo reale all’array dei messaggi, che secondo Anthropic consente agli sviluppatori di aggiornare le istruzioni durante un’attività senza interrompere l’utilizzo della cache dei prompt o richiedere un turno separato da parte dell’utente.

Anthropic ha affermato che il prezzo per l’utilizzo di Claude Opus 4.8 quando non è in modalità “veloce” rimarrà pari a 5 dollari per milione di input e 25 dollari per milione di token di output, mentre la modalità veloce costa 10 dollari per milione di token di input e 50 dollari per milione di output. La modalità veloce per Opus 4.8 funziona a 2,5x, afferma il post di annuncio dell’azienda.

L’azienda ha posizionato Opus 4.8 come progettato per la codifica e flussi di lavoro agenti nella codifica, in cui il modello può utilizzare strumenti all’interno di un contesto e verificare il proprio lavoro. Dice che Opus 4.8 migliora rispetto a Opus 4.7 i parametri di riferimento per la codifica, le capacità degli agenti, il ragionamento e il lavoro d’ufficio. C’è un Scheda di sistema che può essere esaminato per ulteriori dettagli soggettivi.

L’annuncio di Anthropic cita diverse aziende che hanno testato la piattaforma prima del suo rilascio più ampio, comprese quelle che operano nello sviluppo di software, nel diritto, nella finanza e nella ricerca. Diversi tester hanno commentato i flussi di lavoro agentici della piattaforma, uno dei quali ha notato una parità di costi con GPT-5.5 durante l’esecuzione dei test di benchmark interni. Un commento di CursorBench afferma che Opus 4.8 ha utilizzato meno passaggi dello strumento per ottenere lo stesso livello di output.

Anthropic afferma che Opus 4.8 ha meno probabilità rispetto al suo predecessore 4.7 di trasmettere codice difettoso senza commenti, il che viene descritto quattro volte meno probabile. Si afferma che la piattaforma ha mostrato tassi di inganno o tendenza ad abusi inferiori rispetto a Opus 4.7 ed è paragonabile a questo riguardo a quelli mostrati da Claude Mythos Preview.

Il controllo dello sforzo aiuta gli utenti a gestire qualsiasi compromesso tra qualità, velocità e velocità di consumo dei token. Per impostazione predefinita, Opus 4.8 richiede uno sforzo elevato, ma per quanto riguarda le attività di codifica, la società ha affermato che il valore predefinito più elevato utilizza solo il tipo di numeri di token di Opus 4.7, ma offre prestazioni migliori. Gli utenti possono optare per “xhigh” per lavori che richiedono più calcoli. Anthropic ha affermato di aver aumentato i limiti di velocità del codice Claude per supportare il conseguente maggiore utilizzo dei token.

I flussi di lavoro dinamici in Claude Code sono progettati per basi di codice di grandi dimensioni e possono migrare basi di codice di centinaia di migliaia di righe. Queste funzionalità sono attualmente in anteprima di ricerca e sono disponibili sui piani Enterprise, Team e Max.

L’API Messaggi aggiorna le istruzioni durante l’esecuzione di un agente, con le modifiche all’interno dell’array dei messaggi utilizzate, ad esempio, per aggiornare le autorizzazioni, modificare i budget dei token o il contesto mentre gli agenti continuano il loro lavoro.

Anthropic ha inoltre utilizzato il comunicato per suggerire che sta sviluppando modelli che forniscano gli attuali livelli di abilità a un costo inferiore per l’utente e rilascerà una classe di modelli migliore dell’attuale piattaforma Opus. La sua tabella di marcia include il progetto Glasswing, in base al quale un gruppo di organizzazioni utilizza Claude Mythos Preview per la scansione della sicurezza informatica. Anthropic ha affermato che i modelli a quel livello di capacità richiedono garanzie più forti prima del rilascio a tutti i clienti. Si prevede di offrire ai clienti modelli di “classe Mythos” nelle prossime settimane.

I controlli aggiuntivi nella versione 4.8 esporranno agli utenti i compromessi in termini di costi e impegno man mano che l’azienda passa alla fatturazione basata su token dai livelli di abbonamento.

(Fonte immagine: Pixabay, sotto licenza.)

Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L’evento completo è parte di TechEx e co-localizzato con altri importanti eventi tecnologici. Clic Qui per ulteriori informazioni

AI News è alimentato da Media TechForge. Esplora altri prossimi eventi e webinar sulla tecnologia aziendale Qui.

Fonte: www.artificialintelligence-news.com