![Supporta Vector Machine con Scikit-Learn: un’introduzione amichevole | di Riccardo Andreoni | Ottobre 2023
| Intelligenza-Artificiale Supporta Vector Machine con Scikit-Learn: un’introduzione amichevole | di Riccardo Andreoni | Ottobre 2023
| Intelligenza-Artificiale](https://intelligenza-artificiale.eu/wp-content/uploads/2023/10/Supporta-Vector-Machine-con-Scikit-Learn-unintroduzione-amichevole-di-Riccardo.jpeg)
Ogni data scientist dovrebbe avere SVM nella propria cassetta degli attrezzi. Scopri come padroneggiare questo modello versatile con un’introduzione pratica.
Tra i modelli di Machine Learning disponibili, ne esiste uno la cui versatilità lo rende uno strumento indispensabile tutti gli strumenti dei data scientist: Supporta la macchina vettoriale (SVM).
SVM è un algoritmo potente e versatile che, nella sua essenza, può delineare iperpiani ottimali in uno spazio ad alta dimensione, in modo efficace separando le diverse classi di un set di dati. Ma non finisce qui! La sua efficacia non si limita a classificazione compiti: SVM è adatto anche per regressione E rilevamento di valori anomali compiti.
Una caratteristica rende l’approccio SVM particolarmente efficace. Invece di elaborare l’intero set di dati, come KNN lo faSVM si concentra strategicamente solo sul sottoinsieme di punti dati situati vicino ai confini della decisione. Questi punti sono chiamati vettori di supportoe la matematica dietro questa idea unica sarà spiegata semplicemente nelle prossime sezioni.
In questo modo, Support Vector Machine è computazionalmente conservativo e ideale per attività che coinvolgono set di dati medi o anche medio-grandi.
Come faccio in tutti i miei articoli, non mi limiterò a spiegare i concetti teorici, ma ve li fornirò anche esempi di codifica per familiarizzare con il Scikit-Impara (imparare) Pitone biblioteca.
Fondamentalmente, la classificazione SVM ricorda l’elegante semplicità dell’algebra lineare. Immagina un set di dati in uno spazio bidimensionale, con due classi distinte da separare. SVM lineare cerca di separare le due classi con la migliore linea retta possibile.
Cosa significa “migliore” in questo contesto? SVM ricerca la linea di separazione ottimale: una linea che non solo separi le classi, ma lo faccia con la massima distanza possibile dalle istanze formative più vicine di ciascuna classe. Quella distanza si chiama margine. I punti dati che si trovano sul bordo del margine sono…
Fonte: towardsdatascience.com