OpenAI ha annunciato che il suo potente modello GPT-4 Turbo con Vision è ora generalmente disponibile attraverso l'API dell'azienda, aprendo nuove opportunità per aziende e sviluppatori di integrare funzionalità avanzate di linguaggio e visione nelle loro applicazioni.
Il lancio di GPT-4 Turbo con Vision sull'API segue il rilascio iniziale delle funzionalità di visione e caricamento audio di GPT-4 lo scorso settembre e la presentazione del modello GPT-4 Turbo turbo alla conferenza degli sviluppatori di OpenAI a novembre.
GPT-4 Turbo promette miglioramenti significativi della velocità, finestre di contesto di input più ampie fino a 128.000 token (equivalenti a circa 300 pagine) e una maggiore convenienza per gli sviluppatori.
Un miglioramento chiave è la capacità delle richieste API di utilizzare le capacità di riconoscimento e analisi della visione del modello tramite il formato testo JSON e la chiamata di funzioni. Ciò consente agli sviluppatori di generare snippet di codice JSON in grado di automatizzare le azioni all'interno delle app connesse, come l'invio di e-mail, l'effettuazione di acquisti o la pubblicazione online. Tuttavia, OpenAI consiglia vivamente di creare flussi di conferma degli utenti prima di intraprendere azioni che abbiano un impatto sul mondo reale.
Diverse startup stanno già sfruttando GPT-4 Turbo con Vision, incluso Cognizioneil cui agente di codifica AI Devin si affida al modello per generare automaticamente il codice completo:
Devin, costruito da @cognition_labsè un assistente di ingegneria del software AI basato su GPT-4 Turbo che utilizza la visione per una varietà di attività di codifica. pic.twitter.com/E1Svxe5fBu
— Sviluppatori OpenAI (@OpenAIDevs) 9 aprile 2024
Sanificareun'app per salute e fitness, utilizza il modello per fornire analisi nutrizionali e consigli basati sulle foto dei pasti:
IL @healthifyme Il team ha creato Snap utilizzando GPT-4 Turbo con Vision per fornire agli utenti informazioni nutrizionali attraverso il riconoscimento fotografico di alimenti provenienti da tutto il mondo. pic.twitter.com/jWFLuBgEoA
— Sviluppatori OpenAI (@OpenAIDevs) 9 aprile 2024
TLDrawuna startup con sede nel Regno Unito, utilizza GPT-4 Turbo con Vision per potenziare la sua lavagna virtuale e convertire i disegni degli utenti in siti Web funzionali:
Rendi reale, costruito da @tldrawconsente agli utenti di disegnare l'interfaccia utente su una lavagna e utilizza GPT-4 Turbo con Vision per generare un sito Web funzionante basato su codice reale. pic.twitter.com/RYlbmfeNRZ
— Sviluppatori OpenAI (@OpenAIDevs) 9 aprile 2024
Nonostante la forte concorrenza di modelli più recenti come Claude 3 Opus di Anthropic e Gemini Advanced di Google, il lancio dell'API dovrebbe aiutare a consolidare la posizione di OpenAI nel mercato aziendale mentre gli sviluppatori attendono il prossimo grande modello linguistico dell'azienda.
(Fotografato da v2osk)
Guarda anche: Stability AI presenta il modello Stable LM 2 con parametri 12B e la variante 1.6B aggiornata
Vuoi saperne di più sull'intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell'intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L'evento completo è collocato in contemporanea con altri eventi importanti, tra cui BlockX, Settimana della trasformazione digitaleE Fiera sulla sicurezza informatica e sul cloud.
Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.
Fonte: www.artificialintelligence-news.com