Nel mio articolo precedente, abbiamo introdotto l’elemento chiave dietro le reti neurali convoluzionali (CNN), lo strato convoluzionale.
Gli strati convoluzionali consentono alla rete neurale di apprendere i migliori kernel per decifrare o classificare la nostra immagine di input.
Se non hai familiarità, un kernel è una piccola matrice che scorre sull’immagine di input e ad ogni passaggio applichiamo l’operazione di convoluzione. A seconda della struttura del kernel, avrà un effetto diverso sull’immagine di input. Può sfocare, rendere più nitido o persino rilevare i bordi (Operatore Sobel).
Nelle CNN l’output di un’operazione di convoluzione viene definito mappa delle caratteristiche.
Di seguito è riportato un diagramma di esempio di una convoluzione in cui si sfoca l’immagine risultante:
Se desideri un’analisi completa di come funziona la convoluzione, consulta il mio post precedente al riguardo qui:
Negli strati convoluzionali abbiamo diversi kernel che la CNN cerca di ottimizzare per l’utilizzo propagazione all’indietro. I neuroni negli strati convoluzionali successivi sono collegati a una manciata di neuroni nello strato precedente. Ciò consente ai primi livelli di riconoscere le caratteristiche di basso livello e di aumentare la complessità mentre ci propaghiamo attraverso la CNN.
Gli strati convoluzionali sono la parte fondamentale di una CNN, ma lo è la seconda parte fondamentale strati di raggruppamentoche è ciò di cui parleremo in questo articolo.
Se ti è piaciuto questo articolo, assicurati di iscriverti al mio canale YouTube!
Fonte: towardsdatascience.com