Gli ultimi mesi hanno visto una drastica riduzione della dimensione dei parametri dei vari modelli generativi, come il nuovo modello di Mistral AI appena uscito. La riduzione delle dimensioni apre la porta all’abilitazione del tuo assistente personale AI che può essere collegato a te tramite il tuo computer locale. Questo tipo di inferenza locale è molto allettante per garantire un calcolo riservato sui tuoi dati. Con tutti questi nuovi sviluppi, l’implementazione e la gestione di un carico di lavoro AI appaiono diverse rispetto a 6 mesi fa ed è in continua evoluzione. Come utilizzare uno di questi modelli per giocarci o addirittura per ospitarlo sull’infrastruttura della tua azienda?
Penso che prima di utilizzare qualsiasi tipo di modello API che sarà ospitato da qualcun altro, sia una buona cosa sperimentare diversi tipi di modelli per avere un’idea di come si comportano queste diverse famiglie di modelli. Supponiamo quindi che tu non stia utilizzando subito un modello API. Come si smonta un modello e lo si usa?
Per questo esistono due tipi di modelli: modelli proprietari e ad accesso aperto. I modelli proprietari saranno OpenAI, Cohere e così via e avranno tutti la propria API. Quelli ad accesso aperto possono essere modelli completamente aperti o parzialmente limitati a causa della loro licenza, ad esempio commerciale, non commerciale, solo per scopi di ricerca…
Il posto migliore per trovare questi modelli è su Abbracciare il viso. Nella pagina dei modelli, puoi vedere che sono disponibili oltre 350.000 modelli per una serie di attività molto diversificata. Quindi ne hai alcuni tra cui scegliere!
Qualcosa da tenere a mente è che non tutti questi modelli vengono/saranno utilizzati. Alcuni di loro potrebbero semplicemente essere qualcuno che prova qualcosa durante un pomeriggio e poi non lo aggiorna mai più. Uno dei parametri chiave per trovare i modelli più utili è vedere quante persone hanno scaricato il modello e gli è piaciuto. Ad esempio, filtri in base al tipo di attività che stai cercando, come Classificazione del testo, e da lì puoi vedere quali sono i modelli più scaricati e di tendenza filtrati per…
Fonte: towardsdatascience.com