Questo modello di intelligenza artificiale di nuova generazione ha sovraperformato ChatGPT su quasi tutti i benchmark accademici.
Quando OpenAI ha rilasciato ChatGPT lo scorso novembre, c’era una domanda pressante nella mente di tutti: cosa stanno facendo i giganti della tecnologia?
Quando risponderanno aziende come Google a questo sviluppo?
Ora abbiamo la nostra risposta.
Il 6 dicembre 2023, Google ha annunciato il suo ultimo modello di intelligenza artificiale: Gemini.
Secondo il CEO dell’azienda, Sundar Pichai, questa tecnologia rappresenta un enorme passo avanti nel campo dell’intelligenza artificiale e influenzerà praticamente tutti i prodotti Google.
La versione attuale del modello si chiama Gemini 1.0. Può funzionare con testo, immagini, video e audio ed è disponibile in 3 diverse dimensioni.
Gemelli Nano è una versione piccola ed efficiente che può essere eseguita in modo nativo e su dispositivi Android.
Gemelli Prola versione di livello intermedio, trova un equilibrio tra capacità ed efficienza. Questo modello offre prestazioni significativamente migliori rispetto al precedente modello di punta di Google, PaLM-2. Attualmente alimenta il chatbot Bard.
Finalmente, Gemelli Ultra è il modello più potente della serie. Eccelle nel ragionamento complesso e ha sovraperformato il modello GPT-4 di OpenAI su vari benchmark.
Gemini Ultra non è stato ancora reso disponibile al pubblico. Google ha annunciato che il modello sarà lanciato all’inizio del prossimo anno, anche se non è stata fornita alcuna tempistica specifica.
ChatGPT di OpenAI è attualmente alimentato da 2 modelli AI: GPT-3.5 per la versione gratuita e GPT-4 per la versione a pagamento.
Alcuni mesi fa, OpenAI annunciò che GPT-4 aveva capacità multimodali (cioè era in grado di elaborare testo, audio e immagini).
Tuttavia, sebbene sia in grado di elaborare vari tipi di dati, l’attenzione si concentra sulla progettazione e sulla funzionalità principali del modello input e output basati su testo.
Ciò significa che GPT-4 è un framework basato su testo e visione e…
Fonte: towardsdatascience.com