
L'ultima versione di GPT-5 ha preso d'assalto il mondo. Il più recente modello di punta di Openai ha ricevuto recensioni contrastanti – mentre alcuni lodano le sue capacità, altri mettono in evidenza le sue carenze. Questo mi ha fatto meravigliare: GPT-5 è davvero superiore al favorito originale, GPT-4O?
Personalmente, GPT-4O è stato il mio LLM preferito per tutto, dal riepilogo del testo alla generazione di immagini e all'analisi dei dati. Ora che Openi lo ha sostituito con GPT-5, ho deciso di mettere in prova entrambi i modelli. Questo aggiornamento è sinceramente evolutivo o una mossa affrettata che potrebbe diminuire l'appello di Chatgpt?
Lascia che inizi la battaglia dei GPT!
GPT 5 e GPT 4O: un rapido promemoria
Ci immerciamo rapidamente nei dettagli sui due modelli Chatgpt che testeremo in questo blog: GPT-5 e GPT 4O
GPT-5
Rilasciato la scorsa settimana, GPT-5 ora è il modello più avanzato di Chatgpt. L'ultimo LLM multimodale di Openi introduce capacità agenti e un “sistema unificato” per la valutazione delle attività. Questo sistema determina automaticamente se una query richiede un ragionamento profondo o un'elaborazione di base. A differenza dei modelli precedenti, GPT-5 segue un approccio “Learn-by-Doing”. Mostra una maggiore empatia pur essendo meno gradevole dei suoi predecessori. Insieme a questo GPT-5 viene fornito con poteri di codifica, scrittura e vibecodifica avanzati
Trova di più nel mio precedente articolo su GPT-5.
GPT-4O
Rilasciato l'anno scorso, GPT-4O (dove “O” significa “Omni”) era il modello unico nel suo genere. Questo multimodale ha cambiato il modo in cui le persone hanno usato Chatgpt. Il modello è dotato di funzionalità di codifica e analisi visiva migliorate. GPT-4O è arrivato anche con il riconoscimento vocale e le funzionalità di analisi del parlato. Il modello è arrivato con una maggiore velocità di elaborazione e una ridotta latenza di risposta. GPT-4O di Opens ha generato risposte più naturali e sensate ed è stato in grado di accedere agli strumenti e fornire informazioni in tempo reale.
Per saperne di più, controlla questo articolo su GPT 4O.
GPT 5 vs GPT 4O: confronto delle caratteristiche
Caratteristica | GPT-4O | GPT-5 |
Data di rilascio | Maggio 2024 | Agosto 2025 |
Modalità | Testo, immagine, audio | Testo, immagine, audio, video |
Finestra di contesto (chatgpt) | ~ 128k token | 256K token |
Finestra di contesto (API) | ~ 128k token | Token da 400k |
Modalità di ragionamento | Modello singolo | Doppia modalità: rapido + ragionamento profondo |
Tasso di allucinazione | Basso | Il più basso ma tra i modelli Openai |
Personalizzazione | Nessuno | Preset della personalità + Controllo del tono |
Integrazione degli strumenti | Limitato | Gmail, calendario, strumenti di codice, altro |
Completamenti sicuri | NO | Sì – Risposte limitate, utili |
SWE-Bench verificato | Precisione del 30,8% | Precisione del 74,9% |
Mi piace 2025 (matematica) | 71% | 94,6% (senza strumenti) |
Videommmu | 58,8% | 81,1% |
Healthbench | 31,6% | 46,2% |
Casi d'uso target | Interazione in tempo reale, compiti creativi | Ragionamento complesso, flussi di lavoro aziendale |
GPT 5 vs GPT 4O: confronto delle attività
Ora, mettiamo al test entrambi i modelli valutando le loro prestazioni sui seguenti compiti:
- Creazione di contenuti
- Generazione di immagini
- Coding
- Analisi delle immagini
- Ragionamento
Lascia che inizi la battaglia GPT-5 vs GPT-4O!
Attività 1: creazione di contenuti
Leggi l'articolo a https://www.analyticsvidhya.com/blog/2024/07/building-agentic-rag-systems-with-langgraph/ Comprendere il processo di creazione di un database vettoriale per i dati di Wikipedia. Quindi, fornire un riassunto conciso dei passaggi chiave. “
Risposta GPT-5:

Risposta GPT-4O:

Osservazione:
La risposta generata da GPT-5 è il riassunto conciso che una persona informata sull'argomento vorrebbe. I passaggi sono tutti elencati nell'ordine corretto e vengono forniti con un contesto sufficiente. D'altra parte, la risposta di GPT-4o è un riepilogo di tutti i passaggi menzionati nel blog. Elenca tutti i passaggi che sono stati trattati nel blog nello stesso modo discusso lì. La differenza nell'approccio dei due modelli è: GPT-5 unisce i punti per generare un riepilogo conciso dell'intero processo, mentre GPT-4O crea un riassunto conciso di tutti i passaggi trattati nel blog.
Attività 2: generazione di immagini
L'immagine è di funzionamento di un agente vocale. Ha 3 parti principali
Speech-to-text (STT): cattura e converte le tue parole pronunciate in testo.
Logica agente: questo è il tuo codice (o il tuo agente), che scopre la risposta appropriata
Testo-to-speech (TTS): converte la risposta di testo dell'agente in audio che viene parlato ad alta voce.
Converti questa immagine di base in immagine vibrante.
Risposta GPT-5:

Risposta GPT-4O:

Osservazione:
L'attività era semplice ed entrambi i modelli lo eseguivano abbastanza bene. A partire da GPT-5, ha creato un'immagine vibrante con colori scoppiati. L'immagine che ha generato aveva testo e icone; Tuttavia, si è verificato un errore minore: una piccola freccia che collega l'icona del microfono con la casella TTS. Per quanto riguarda l'immagine generata da GPT-4O, ha usato colori solidi, rendendola meno vibrante. I punti di forza dell'immagine di GPT-4O erano le fonti di input e uscita audio che includeva.
Attività 3: codifica
Codice HTML di base per un sito Web di conteggio delle parole.
Risposta GPT-5:

Risposta GPT-4O:

Osservazione:
GPT-5 ha impiegato del tempo per generare il codice per questa query, in particolare per il sito Web Word Counter. Tuttavia, l'output finale è stato piuttosto impressionante. L'interfaccia utente/UX e le funzionalità si sono riunite per creare una pagina web di conteggio delle parole completamente funzionale. D'altra parte, l'output di GPT-4o sembrava poco brillante in confronto. L'interfaccia utente/ux era di base, offrendo solo la funzione principale di conteggio delle parole senza ulteriori perfezionamenti. Anche il suo design è apparso in qualche modo obsoleto
Attività 4: analisi delle immagini
Calcola l'uscita di questo diagramma del circuito.
Risposta GPT-5:

Risposta GPT-4O:

Osservazione:
GPT-5 ha risposto rapidamente a questa domanda, analizzando sia l'immagine che i suoi componenti in modo efficiente. Ha identificato correttamente il raddrizzatore a mezza onda, leggi i valori contrassegnati sul diagramma e ha applicato la logica corretta per calcolare la corrente di uscita e i valori di tensione. Al contrario, GPT-4O ha lottato con questo compito. Mentre ha riconosciuto la forma d'onda di output, non è riuscito a elaborare altri fattori critici. In particolare, GPT-4O non ha potuto estrarre i valori necessari dall'immagine per eseguire calcoli.
Attività 5: ragionamento
Risolvi il seguente Sudoku e dai la soluzione finale come immagine.

Risposta GPT-5:

Risposta GPT-4O:

Osservazione:
GPT-5 inizialmente ha lottato con l'interpretazione dell'immagine, prendendo oltre tre minuti per elaborare l'input. Invece di risolvere il puzzle in modo indipendente, ha richiesto la conferma di più valori all'interno dell'immagine. Dopo aver fornito manualmente tutti i valori delle righe, il modello ha elaborato e risolto correttamente il puzzle, producendo una soluzione corretta, sebbene richiedesse assistenza utente significativa.
GPT-4O, al contrario, non è riuscito a risolvere completamente il puzzle. Ha semplicemente popolato tutti i valori mancanti con zeri e lo ha presentato come soluzione di output.
GPT-5 vs GPT-4O: verdetto finale
Selezionare un chiaro vincitore non è mai stato più impegnativo. Ecco come i due LLM hanno eseguito su diversi compiti:
Compito | GPT-5 | GPT-4O |
---|---|---|
Creazione di contenuti | Più conciso | Meglio riassunto |
Generazione di immagini | Più vibrante | Più creativo |
Coding | Grande | Capacità limitata |
Analisi delle immagini | Media | Media |
Ragionamento | Eccellente | Capacità di base |
C'è un chiaro vincitore tra i due? La risposta è no. Le prestazioni variano significativamente in base al compito:
- Domina GPT-5 nella codifica e nel ragionamento
- GPT-4o è il suo nella creazione di contenuti e nella generazione/analisi delle immagini
- Velocità vs. profondità: GPT-4O offre risposte più veloci, mentre GPT-5 a volte esita tra analisi approfondite e generazione rapida
Il contesto conta: Ricorda che GPT-4o ha un anno più vecchio. Mentre GPT-5 beneficia di dati di allenamento più recenti e ottimizzazioni agenti, è davvero innovativo rispetto al suo predecessore? Non esattamente.
Conclusione
Mentre il mondo richiede il ritorno di GPT-4o, sono con tutto il cuore d'accordo.
Mentre GPT-5 è migliorato dal primo giorno (ora supera i risultati del 3 ° giorno), il suo lancio affrettato ha lasciato gli utenti che lottano per adattarsi. La verità è che GPT-5 supera marginalmente GPT-4O su compiti specifici, rendendo dolorosamente difficile abbandonare il nostro amato GPT-4o per qualcosa che sembra semplicemente “Un po 'meglio.” Forse Openai aveva bisogno di test più rigorosi prima del rilascio. Ma ora che è dal vivo, possiamo solo vederne l'evoluzione.
Oggi? Firmeri qualsiasi petizione per riportare GPT-4o. Chatgpt è cambiato e non in meglio. Fammi sapere i tuoi pensieri nella sezione commenti.
PS: ho preso i risultati GPT 4O dai nostri blog precedenti:
Accedi per continuare a leggere e godere di contenuti curati da esperti.
Fonte: www.analyticsvidhya.com