GPT 5 vs GPT 4O: quale è meglio?

 | Intelligenza-Artificiale

L'ultima versione di GPT-5 ha preso d'assalto il mondo. Il più recente modello di punta di Openai ha ricevuto recensioni contrastanti – mentre alcuni lodano le sue capacità, altri mettono in evidenza le sue carenze. Questo mi ha fatto meravigliare: GPT-5 è davvero superiore al favorito originale, GPT-4O?

Personalmente, GPT-4O è stato il mio LLM preferito per tutto, dal riepilogo del testo alla generazione di immagini e all'analisi dei dati. Ora che Openi lo ha sostituito con GPT-5, ho deciso di mettere in prova entrambi i modelli. Questo aggiornamento è sinceramente evolutivo o una mossa affrettata che potrebbe diminuire l'appello di Chatgpt?

Lascia che inizi la battaglia dei GPT!

GPT 5 e GPT 4O: un rapido promemoria

Ci immerciamo rapidamente nei dettagli sui due modelli Chatgpt che testeremo in questo blog: GPT-5 e GPT 4O

GPT-5

Rilasciato la scorsa settimana, GPT-5 ora è il modello più avanzato di Chatgpt. L'ultimo LLM multimodale di Openi introduce capacità agenti e un “sistema unificato” per la valutazione delle attività. Questo sistema determina automaticamente se una query richiede un ragionamento profondo o un'elaborazione di base. A differenza dei modelli precedenti, GPT-5 segue un approccio “Learn-by-Doing”. Mostra una maggiore empatia pur essendo meno gradevole dei suoi predecessori. Insieme a questo GPT-5 viene fornito con poteri di codifica, scrittura e vibecodifica avanzati

Trova di più nel mio precedente articolo su GPT-5.

GPT-4O

Rilasciato l'anno scorso, GPT-4O (dove “O” significa “Omni”) era il modello unico nel suo genere. Questo multimodale ha cambiato il modo in cui le persone hanno usato Chatgpt. Il modello è dotato di funzionalità di codifica e analisi visiva migliorate. GPT-4O è arrivato anche con il riconoscimento vocale e le funzionalità di analisi del parlato. Il modello è arrivato con una maggiore velocità di elaborazione e una ridotta latenza di risposta. GPT-4O di Opens ha generato risposte più naturali e sensate ed è stato in grado di accedere agli strumenti e fornire informazioni in tempo reale.

Per saperne di più, controlla questo articolo su GPT 4O.

GPT 5 vs GPT 4O: confronto delle caratteristiche

Caratteristica GPT-4O GPT-5
Data di rilascio Maggio 2024 Agosto 2025
Modalità Testo, immagine, audio Testo, immagine, audio, video
Finestra di contesto (chatgpt) ~ 128k token 256K token
Finestra di contesto (API) ~ 128k token Token da 400k
Modalità di ragionamento Modello singolo Doppia modalità: rapido + ragionamento profondo
Tasso di allucinazione Basso Il più basso ma tra i modelli Openai
Personalizzazione Nessuno Preset della personalità + Controllo del tono
Integrazione degli strumenti Limitato Gmail, calendario, strumenti di codice, altro
Completamenti sicuri NO Sì – Risposte limitate, utili
SWE-Bench verificato Precisione del 30,8% Precisione del 74,9%
Mi piace 2025 (matematica) 71% 94,6% (senza strumenti)
Videommmu 58,8% 81,1%
Healthbench 31,6% 46,2%
Casi d'uso target Interazione in tempo reale, compiti creativi Ragionamento complesso, flussi di lavoro aziendale

GPT 5 vs GPT 4O: confronto delle attività

Ora, mettiamo al test entrambi i modelli valutando le loro prestazioni sui seguenti compiti:

  1. Creazione di contenuti
  2. Generazione di immagini
  3. Coding
  4. Analisi delle immagini
  5. Ragionamento

Lascia che inizi la battaglia GPT-5 vs GPT-4O!

Attività 1: creazione di contenuti

Leggi l'articolo a https://www.analyticsvidhya.com/blog/2024/07/building-agentic-rag-systems-with-langgraph/ Comprendere il processo di creazione di un database vettoriale per i dati di Wikipedia. Quindi, fornire un riassunto conciso dei passaggi chiave. “

Risposta GPT-5:

Risposta GPT 5 sull'attività di creazione di contenuti

Risposta GPT-4O:

GPT 4O Output - Riassunto dell'articolo

Osservazione:

La risposta generata da GPT-5 è il riassunto conciso che una persona informata sull'argomento vorrebbe. I passaggi sono tutti elencati nell'ordine corretto e vengono forniti con un contesto sufficiente. D'altra parte, la risposta di GPT-4o è un riepilogo di tutti i passaggi menzionati nel blog. Elenca tutti i passaggi che sono stati trattati nel blog nello stesso modo discusso lì. La differenza nell'approccio dei due modelli è: GPT-5 unisce i punti per generare un riepilogo conciso dell'intero processo, mentre GPT-4O crea un riassunto conciso di tutti i passaggi trattati nel blog.

Attività 2: generazione di immagini

L'immagine è di funzionamento di un agente vocale. Ha 3 parti principali
Speech-to-text (STT): cattura e converte le tue parole pronunciate in testo.
Logica agente: questo è il tuo codice (o il tuo agente), che scopre la risposta appropriata
Testo-to-speech (TTS): converte la risposta di testo dell'agente in audio che viene parlato ad alta voce.
Converti questa immagine di base in immagine vibrante.

Risposta GPT-5:

Risposta GPT-5 sull'attività di generazione di immagini

Risposta GPT-4O:

Attività di generazione di immagini GPT 4O

Osservazione:

L'attività era semplice ed entrambi i modelli lo eseguivano abbastanza bene. A partire da GPT-5, ha creato un'immagine vibrante con colori scoppiati. L'immagine che ha generato aveva testo e icone; Tuttavia, si è verificato un errore minore: una piccola freccia che collega l'icona del microfono con la casella TTS. Per quanto riguarda l'immagine generata da GPT-4O, ha usato colori solidi, rendendola meno vibrante. I punti di forza dell'immagine di GPT-4O erano le fonti di input e uscita audio che includeva.

Attività 3: codifica

Codice HTML di base per un sito Web di conteggio delle parole.

Risposta GPT-5:

Risposta GPT-5 sulla codifica

Risposta GPT-4O:

HTML-Website-GPT-4O

Osservazione:

GPT-5 ha impiegato del tempo per generare il codice per questa query, in particolare per il sito Web Word Counter. Tuttavia, l'output finale è stato piuttosto impressionante. L'interfaccia utente/UX e le funzionalità si sono riunite per creare una pagina web di conteggio delle parole completamente funzionale. D'altra parte, l'output di GPT-4o sembrava poco brillante in confronto. L'interfaccia utente/ux era di base, offrendo solo la funzione principale di conteggio delle parole senza ulteriori perfezionamenti. Anche il suo design è apparso in qualche modo obsoleto

Attività 4: analisi delle immagini

Calcola l'uscita di questo diagramma del circuito.

Risposta GPT-5:

GPT 5 Output sull'analisi dell'immagine

Risposta GPT-4O:

Risposta GPT 4O per l'analisi delle immagini

Osservazione:

GPT-5 ha risposto rapidamente a questa domanda, analizzando sia l'immagine che i suoi componenti in modo efficiente. Ha identificato correttamente il raddrizzatore a mezza onda, leggi i valori contrassegnati sul diagramma e ha applicato la logica corretta per calcolare la corrente di uscita e i valori di tensione. Al contrario, GPT-4O ha lottato con questo compito. Mentre ha riconosciuto la forma d'onda di output, non è riuscito a elaborare altri fattori critici. In particolare, GPT-4O non ha potuto estrarre i valori necessari dall'immagine per eseguire calcoli.

Attività 5: ragionamento

Risolvi il seguente Sudoku e dai la soluzione finale come immagine.

Problema di ragionamento

Risposta GPT-5:

Risposta GPT-5 sull'attività di ragionamento

Risposta GPT-4O:

Risposta GPT-4O sull'attività di ragionamento

Osservazione:

GPT-5 inizialmente ha lottato con l'interpretazione dell'immagine, prendendo oltre tre minuti per elaborare l'input. Invece di risolvere il puzzle in modo indipendente, ha richiesto la conferma di più valori all'interno dell'immagine. Dopo aver fornito manualmente tutti i valori delle righe, il modello ha elaborato e risolto correttamente il puzzle, producendo una soluzione corretta, sebbene richiedesse assistenza utente significativa.

GPT-4O, al contrario, non è riuscito a risolvere completamente il puzzle. Ha semplicemente popolato tutti i valori mancanti con zeri e lo ha presentato come soluzione di output.

GPT-5 vs GPT-4O: verdetto finale

Selezionare un chiaro vincitore non è mai stato più impegnativo. Ecco come i due LLM hanno eseguito su diversi compiti:

Compito GPT-5 GPT-4O
Creazione di contenuti Più conciso Meglio riassunto
Generazione di immagini Più vibrante Più creativo
Coding Grande Capacità limitata
Analisi delle immagini Media Media
Ragionamento Eccellente Capacità di base

C'è un chiaro vincitore tra i due? La risposta è no. Le prestazioni variano significativamente in base al compito:

  • Domina GPT-5 nella codifica e nel ragionamento
  • GPT-4o è il suo nella creazione di contenuti e nella generazione/analisi delle immagini
  • Velocità vs. profondità: GPT-4O offre risposte più veloci, mentre GPT-5 a volte esita tra analisi approfondite e generazione rapida

Il contesto conta: Ricorda che GPT-4o ha un anno più vecchio. Mentre GPT-5 beneficia di dati di allenamento più recenti e ottimizzazioni agenti, è davvero innovativo rispetto al suo predecessore? Non esattamente.

Conclusione

Mentre il mondo richiede il ritorno di GPT-4o, sono con tutto il cuore d'accordo.

Mentre GPT-5 è migliorato dal primo giorno (ora supera i risultati del 3 ° giorno), il suo lancio affrettato ha lasciato gli utenti che lottano per adattarsi. La verità è che GPT-5 supera marginalmente GPT-4O su compiti specifici, rendendo dolorosamente difficile abbandonare il nostro amato GPT-4o per qualcosa che sembra semplicemente “Un po 'meglio.” Forse Openai aveva bisogno di test più rigorosi prima del rilascio. Ma ora che è dal vivo, possiamo solo vederne l'evoluzione.

Oggi? Firmeri qualsiasi petizione per riportare GPT-4o. Chatgpt è cambiato e non in meglio. Fammi sapere i tuoi pensieri nella sezione commenti.

PS: ho preso i risultati GPT 4O dai nostri blog precedenti:

Anu Madan è un esperto di progettazione didattica, scrittura di contenuti e marketing B2B, con un talento per trasformare idee complesse in narrazioni di impatto. Con la sua attenzione all'intelligenza artificiale generativa, crea contenuti approfonditi e innovativi che educa, ispira e guida un coinvolgimento significativo.

Accedi per continuare a leggere e godere di contenuti curati da esperti.

Fonte: www.analyticsvidhya.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *