Lo scenario: una linea di produzione ad alta velocità produce migliaia di prodotti. Sono installate due telecamere per controllare continuamente la qualità di ciascun prodotto.
L’obiettivo: sviluppare un algoritmo in grado di controllare ogni prodotto il più velocemente possibile.
Il vincolo: hai un dispositivo edge con risorse limitate.
In questo post del blog lo faremo dividere e conquistare il problema. Innanzitutto estraendo caratteristiche significative dalle immagini e poi utilizzando modelli di rilevamento delle anomalie per rilevare valori anomali da tali caratteristiche.
L’idea chiave è apprendere una rappresentazione dimensionale inferiore dell’input visivo e utilizzare questa rappresentazione per addestrare un classificatore in grado di distinguere tra input normali e anomali.
Esploreremo alcuni metodi interessanti per l’estrazione di caratteristiche, inclusi gli istogrammi dei gradienti orientati (HOG), il rilevamento dei bordi delle wavelet e le reti neurali convoluzionali (CNN).
Infine, tratteremo due librerie che ho trovato particolarmente utili per confrontare e implementare algoritmi nello streaming di dati:PyOD E PisaD.
Esistono molti modi per estrarre funzionalità dalle immagini. Non li tratteremo tutti in questo post, ma ci concentreremo su tre metodi che ho trovato particolarmente interessanti:
- istogramma dei gradienti orientati (HOG),
- rilevamento dei bordi wavelet e
- reti neurali convoluzionali.
Istogramma dei gradienti orientati
L’istogramma dei gradienti orientati è una tecnica popolare nell’elaborazione delle immagini e nella visione artificiale. Il descrittore HOG può catturare la forma e l’aspetto di un oggetto in un’immagine.
In poche parole il descrittore HOG è un vettore di istogrammi così costruito:
- L’immagine è divisa in celle, ad esempio…
Fonte: towardsdatascience.com