ML probabilistico con corrispondenza quantile: un esempio con Python |  di Davide Burba |  Settembre 2023

 | Intelligenza-Artificiale

Una tecnica poco conosciuta per trasformare le previsioni di regressione quantilica in una distribuzione di probabilità.

“Corrispondenza quantile”, di Giulia Roggia. Utilizzato con permesso.

Quando addestriamo modelli regressivi, otteniamo previsioni puntuali. Tuttavia, nella pratica siamo spesso interessati a stimare l’incertezza associata a ciascuna previsione. Per raggiungere questo obiettivo, assumiamo che il valore che stiamo cercando di prevedere sia una variabile casuale e l’obiettivo è stimarne la distribuzione.

Sono disponibili molti metodi per stimare l’incertezza dalle previsioni, ad esempio stima della varianza, Metodi bayesiani, previsioni conformiecc. La regressione quantilica è uno di questi metodi ben noti.

La regressione quantilica consiste nello stimare un modello per ciascun quantile che ti interessa. Ciò può essere ottenuto utilizzando una funzione di perdita asimmetrica, nota come perdita del flipper. La regressione quantilica è semplice, facile da comprendere e facilmente disponibile in librerie ad alte prestazioni come LightGBM. Tuttavia, la regressione quantile presenta alcuni problemi:

  • Non vi è alcuna garanzia che l’ordine dei quantili sia corretto. Ad esempio, la tua previsione per il quantile del 50% potrebbe essere maggiore di quella ottenuta per il quantile del 60%, il che è assurdo.
  • Per ottenere una stima dell’intera distribuzione è necessario addestrare molti modelli. Ad esempio, se hai bisogno di una stima per ogni quantile percentuale, devi addestrare 99 modelli.

Ecco come corrispondenza quantilica può aiutare.

L’obiettivo dell’abbinamento dei quantili è quello di adattare una funzione di distribuzione dato un campione di stime dei quantili. Possiamo inquadrarlo come un problema di regressione, quindi la curva non deve adattarsi perfettamente ai quantili. Dovrebbe invece essere “il più vicino possibile”, pur mantenendo le proprietà che ne fanno una funzione distributiva.

Nello specifico, siamo interessati a stimare la funzione di distribuzione cumulativa inversa: dato un…

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *