questo articolo è stato originariamente pubblicato su Intelligenza dei pesci artistici
Cosa significa essere per un’intelligenza artificiale creativo?
L’anno scorso ho scritto un articolo sulla misurazione della creatività nei Large Language Models (LLM) utilizzando diversi test di creatività basati su parole.
Da allora, l’intelligenza artificiale si è sviluppata rapidamente ed è in grado di elaborare e creare entrambi i testi E Immagine. Questi modelli, a volte indicati come “Multimodal Large Language Models” (MLLM), sono estremamente potenti e hanno capacità avanzate di comprendere input testuali e visivi complessi.
In questo articolo, esploro un modo per misurare la creatività in due popolari MLLM: OpenAI Visione GPT-4 E Gemini ProVision di Google. Utilizzo i puzzle rebus, che sono puzzle di parole che richiedono la combinazione di segnali visivi e linguistici per essere risolti.
La creatività è estremamente sfaccettata e difficile da definire come un unico tratto. Pertanto, in questo articolo, non mi propongo di misurare la creatività in generale, ma di valutare un aspetto molto specifico della creatività.
Nota (modificato dal mio precedente articoloe): questi esperimenti non mirano a misurare quanto siano creativi i modelli di intelligenza artificiale, ma piuttosto a misurare il livello del processo creativo presente nelle generazioni dei loro modelli. Non sto sostenendo che i modelli di intelligenza artificiale possiedano un pensiero creativo allo stesso modo degli esseri umani. Il mio obiettivo è piuttosto mostrare come i modelli rispondono a particolari misure dei processi creativi.
UN puzzle di rebus è una rappresentazione grafica di parole o frasi comuni. Spesso implicano una combinazione di segnali visivi e spaziali. Ad esempio, di seguito sono riportati sei esempi di puzzle rebus (le risposte sono alla fine dell’articolo).
Fonte: towardsdatascience.com