Openi sta rilasciando una potente capacità agente che consente a Chatgpt di condurre attività di ricerca complesse e in più fasi online. La caratteristica, chiamata Reep Research, secondo quanto riferito, raggiunge decine di minuti ciò che potrebbe richiedere l'orario di ricercatore umano o addirittura giorni.
Openi descrive una ricerca profonda come una pietra miliare significativa nel suo viaggio verso l'intelligenza generale artificiale (AGI).
“La capacità di sintetizzare la conoscenza è un prerequisito per la creazione di nuove conoscenze”, afferma Openi. “Per questo motivo, la ricerca profonda segna un passo significativo verso il nostro obiettivo più ampio di sviluppare AGI”.
L'intelligenza artificiale agente consente a Chatgpt di aiutare con ricerche complesse
La ricerca profonda consente a CHATGPT di trovare, analizzare e sintetizzare le informazioni da centinaia di fonti online autonomamente. Con solo un prompt dell'utente, lo strumento può fornire un rapporto completo, paragonabile all'output di un analista di ricerca, secondo OpenAI.
Disegno di capacità da una variante del prossimo modello “O3” di Openi, l'obiettivo è quello di liberare gli utenti da una raccolta di informazioni che richiede tempo. Che si tratti di un'analisi competitiva di piattaforme di streaming, di una revisione politica informata o di anche raccomandazioni personalizzate per una nuova bici da pendolare, una ricerca profonda promette risultati precisi e affidabili.
È importante sottolineare che ogni output include citazioni complete e documentazione trasparente, che consente agli utenti di verificare facilmente i risultati.
Lo strumento appare particolarmente abile nello scoprire intuizioni di nicchia o non intuitive, rendendolo una risorsa inestimabile in settori come finanza, scienza, politica e ingegneria. Ma Openi prevede inoltre che una ricerca approfondita sia utile per l'utente medio, come gli acquirenti che cercano raccomandazioni iper-personali o un prodotto specifico.
Quest'ultima capacità agente opera attraverso l'interfaccia utente di CHATGPT; Gli utenti selezionano semplicemente l'opzione “Ricerca profonda” nel compositore dei messaggi e digita la loro query. I file di supporto o fogli di calcolo possono anche essere caricati per un contesto aggiuntivo.
Una volta iniziata, l'IA intraprende un rigoroso processo in più fasi, che può richiedere 5-30 minuti per essere completato. Una barra laterale fornisce aggiornamenti sulle azioni intraprese e sulle fonti consultate. Gli utenti possono continuare con altre attività e verranno avvisati quando il rapporto finale è pronto.
I risultati sono presentati nella chat come report dettagliati e ben documentati. Nelle prossime settimane, Openi prevede di migliorare ulteriormente questi output incorporando immagini, visualizzazioni di dati e grafici per fornire chiarezza e contesto ancora maggiori.
A differenza di GPT-4O-che eccelle in conversazioni multimodali in tempo reale-la ricerca profonda dà la priorità alla profondità e ai dettagli. La sua capacità di citare rigorosamente fonti e fornire analisi complete si distingue: spostando l'attenzione da risposte rapide e sintetizzate a approfondimenti ben documentati e di livello di ricerca.
Costruito per sfide del mondo reale
La rsearch profonda sfrutta sofisticate metodologie di addestramento, radicate su compiti di navigazione e ragionamento del mondo reale in diversi settori. Il suo modello è stato addestrato tramite l'apprendimento del rinforzo per pianificare ed eseguire autonomamente processi di ricerca in più fasi, incluso il backtracking e la perfezionamento in modo adattivo del proprio approccio man mano che diventano disponibili nuove informazioni.
Lo strumento può sfogliare i file con caricamento dell'utente, generare e iterare su grafici usando Python, incorporare supporti come immagini generate e pagine Web in risposte e citare frasi o passaggi esatti dalle sue fonti. Il risultato di questa vasta formazione è un agente altamente capace per affrontare complessi problemi del mondo reale.
Openai ha valutato una ricerca approfondita attraverso un'ampia serie di esami a livello di esperti noti come “ultimo esame dell'umanità”. Gli esami – che comprendono oltre 3.000 domande che coprono argomenti della scienza missilistica e della linguistica all'ecologia e ai classici – testano la competenza di un'intelligenza artificiale nella risoluzione di problemi sfaccettati.
I risultati sono stati impressionanti, con il modello che ha raggiunto una precisione del 26,6% da record in questi domini:
- GPT-4O: 3,3%
- Grok-2: 3,8%
- Sonetto Claude 3.5: 4,3%
- Openai O1: 9,1%
- DeepSeek-R1: 9,4%
- Ricerca profonda: 26,6% (con navigazione + strumenti Python)
Una ricerca profonda ha anche raggiunto una nuova performance all'avanguardia sul benchmark Gaia, che valuta i modelli di intelligenza artificiale su domande del mondo reale che richiedono ragionamento, fluidità multimodale e competenza per l'uso degli strumenti. La ricerca profonda ha superato il classifica con un punteggio del 72,57%.
Limitazioni e sfide
Mentre la profonda capacità di AI agente di ricerca in CHATGPT significa un audace passo avanti, Openai riconosce che la tecnologia è ancora nelle sue prime fasi e presenta limiti.
Il sistema occasionalmente “allucina” i fatti o offre inferenze errate, sebbene a un tasso notevolmente ridotto rispetto ai modelli GPT esistenti, secondo OpenAI. Affronta anche le sfide nel differenziarsi tra fonti autorevoli e contenuti speculativi e lotta per calibrare i suoi livelli di fiducia, spesso mostrando un'indebita certezza per risultati potenzialmente incerti.
Gli errori di formattazione minori nei rapporti e nelle citazioni, nonché ritardi nell'avvio di compiti, potrebbero anche frustrare gli utenti iniziali. Openai afferma che questi problemi dovrebbero migliorare nel tempo con ulteriori perfezionamenti di utilizzo e iterativi.
Openi sta lanciando gradualmente la capacità, a partire da utenti professionisti, che avranno accesso a un massimo di 100 domande al mese. Plus e i livelli di squadra seguiranno l'esempio, con l'accesso aziendale in arrivo.
I residenti nel Regno Unito, svizzeri ed europei non sono ancora in grado di accedere alla funzione, ma Openai afferma che sta lavorando per espandere il suo lancio in queste regioni.
Nelle settimane a venire, Openai amplierà la funzione alle piattaforme mobili e desktop di CHATGPT. La visione a lungo termine include le connessioni abilitanti a fonti di dati basate su abbonamento o proprietarie, migliorando ulteriormente la robustezza e la personalizzazione dei suoi output.
Guardando più avanti, Openi prevede l'integrazione di ricerche profonde con “Operatore,” una capacità di chatbot esistente che intraprende azioni del mondo reale. Questa integrazione consentirebbe a CHATGPT di gestire perfettamente le attività che richiedono sia la ricerca online asincrona che l'esecuzione del mondo reale.
(Foto di John Schnobrich)
Vedi anche: Microsoft e Openi Sonda presunta furto di dati da parte di DeepSeek
Vuoi saperne di più sull'intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L'evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.
Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.
Fonte: www.artificialintelligence-news.com