Benvenuti nella seconda parte della serie Deep Learning Illustrated. Nel articolo precedente (leggilo sicuramente prima!), abbiamo spiegato come funziona una rete neurale e come a allenato la rete neurale fa previsioni.
In questo articolo approfondiremo il formazione elaborare ed esplorare il modo in cui una rete neurale apprende.
📣 Se non hai letto i miei articoli precedenti, ti consiglio vivamente di iniziare con la mia serie di articoli che trattano il nozioni di base dell’apprendimento automaticoin particolare quello su Discesa gradiente perché scoprirai che gran parte del materiale trattato è rilevante qui.
Pacchetto iniziale per l’apprendimento automatico
Supponiamo di voler creare una rete neurale che preveda le entrate giornaliere delle vendite di gelato utilizzando le caratteristiche della temperatura e del giorno della settimana.
Questo è il set di dati di training (sintetico) che stiamo utilizzando:
Per costruire una rete neurale, come abbiamo appreso nell’articolo precedente, dobbiamo prima decidere la sua architettura. Ciò include la determinazione del numero di strati nascosti, del numero di neuroni in ciascuno strato e della funzione di attivazione di ciascun neurone.
Diciamo che abbiamo deciso che la nostra architettura è: 1 strato nascosto con 2 neuroni e 1 neurone di uscita, tutti utilizzando la funzione di attivazione del raddrizzatore.
Segue la terminologia: nell’articolo precedente abbiamo appreso come utilizzare i pedici per distinguere tra pesi diversi. Qui atteniamo la stessa convenzione e inoltre utilizzeremo apici A…
Fonte: towardsdatascience.com