Garantire l’uso corretto dei trasformatori nelle pipeline Scikit-learn |  di Peng Qian |  Dicembre 2023

 | Intelligenza-Artificiale

Elaborazione efficace dei dati in progetti di machine learning

Garantire l'uso corretto dei trasformatori nella pipeline Scikit-learn.
Garantire l’uso corretto dei trasformatori nella pipeline Scikit-learn. Immagine dell’autore

Questo articolo spiegherà come utilizzare Tubatura E Trasformatori correttamente nei progetti Scikit-Learn (sklearn) per accelerare e riutilizzare il nostro processo di formazione del modello.

Questo pezzo integra e chiarisce la documentazione ufficiale sugli esempi di pipeline e su alcuni malintesi comuni.

Spero che dopo aver letto questo, sarai in grado di utilizzare Pipeline, un design eccellente, per completare meglio le tue attività di machine learning.

C’è un piatto famoso nei ristoranti cinesi di tutto il mondo chiamato “Pollo del Generale Tso” e mi chiedo se l’hai provato.

Pollo del Generale Tso.Un modello per standardizzare il processo di cottura.
Pollo del Generale Tso. Un modello per standardizzare il processo di cottura. Credito fotografico: creato dall’autore, Tela.

Una caratteristica del “Pollo del Generale Tso” è che ogni pezzo di pollo viene lavorato dallo chef affinché abbia le stesse dimensioni. Ciò garantisce che:

  1. Tutti i pezzi vengono marinati per lo stesso tempo.
  2. Durante la cottura ogni pezzo di pollo raggiunge lo stesso livello di cottura.
  3. Quando si utilizzano le bacchette, la dimensione uniforme facilita la raccolta dei pezzi.

Questa preelaborazione include il lavaggio, il taglio e la marinatura degli ingredienti. Se i pezzi di pollo vengono tagliati più grandi del solito, il sapore può cambiare notevolmente anche se saltati in padella per lo stesso tempo.

Quindi, quando ci prepariamo ad aprire un ristorante, dobbiamo considerare la standardizzazione di questi processi e ricette per garantire che ogni piatto di “Pollo del Generale Tso” abbia un gusto e una consistenza coerenti. Ecco come prosperano i ristoranti.

Tornando al mondo dell’apprendimento automatico, Scikit-Learn fornisce anche processi standardizzati chiamati Pipeline. Consolidano la preelaborazione dei dati e il processo di formazione del modello in un flusso di lavoro standardizzato, semplificando la manutenzione e il riutilizzo dei progetti di machine learning.

In questo articolo esploreremo come utilizzare correttamente Transformers all’interno della pipeline di Scikit-Learn, assicurandoci che i nostri dati siano perfettamente preparati come gli ingredienti per un buon pasto.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *