Scopri come applicare in modo efficiente metodi di riduzione della dimensionalità all’avanguardia e potenziare i tuoi modelli di machine learning.

Fonte immagine: unsplash.com.

Quando ti avvicini a un’attività di Machine Learning, ti sei mai sentito sbalordito dal numero enorme di funzionalità?

La maggior parte dei data scientist affronta questa sfida travolgente quotidianamente. Sebbene l’aggiunta di funzionalità arricchisca i dati, spesso rallenta il processo di formazione e lo rende più difficile rilevare modelli nascostirisultando nel (in)famoso Maledizione della dimensionalità.

Inoltre, in spazi ad alta dimensione fenomeni sorprendenti accadere. Per rappresentare questo concetto con un’analogia, pensa al romanzo Flatlandia, dove i personaggi che vivono in un mondo piatto (bidimensionale) si ritrovano sbalorditi quando incontrano un essere tridimensionale. Allo stesso modo, facciamo fatica a comprendere che, negli spazi ad alta dimensione, la maggior parte dei punti sono valori anomaliE le distanze tra i punti sono Generalmente più grandi del previsto. Tutti questi fenomeni, se non trattati correttamente, possono avere implicazioni disastrose per i nostri modelli di Machine Learning.

Immagine dell’autore.

In questo post spiegherò alcune tecniche avanzate di riduzione della dimensionalità utilizzate per mitigare questo problema.

Nel mio post precedente, ho introdotto la rilevanza di Riduzione della dimensionalità nei problemi di Machine Learning e come domare il Maledizione della dimensionalitàe ho spiegato sia la teoria che l’implementazione di Scikit-Learn Analisi del componente principale algoritmo.

In questo follow-up, mi immergerò ulteriormente Algoritmi di riduzione della dimensionalità, Piace kPCA O LLEche superano i limiti della PCA.

Non preoccuparti se non hai ancora letto la mia introduzione alla Riduzione della Dimensionalità. Questo post è un guida autonoma poiché descriverò in dettaglio ogni concetto in termini semplici. Tuttavia, se preferisci saperne di più sulla PCA, sono sicuro che questa guida servirà al tuo obiettivo:

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *