Errori standard clusterizzati nei test AB |  di Matteo Courthoud |  Marzo 2024

 | Intelligenza-Artificiale

Cosa fare quando l'unità di osservazione differisce dall'unità di randomizzazione

Copertina, immagine dell'Autore

I test A/B sono lo standard d'oro dell'inferenza causale perché ci consentono di fare affermazioni causali valide con presupposti minimi, grazie a randomizzazione. Infatti, assegnando casualmente a trattamento (un farmaco, una pubblicità, un prodotto, …), siamo in grado di confrontare i risultato di interesse (una malattia, i ricavi dell’azienda, la soddisfazione del cliente, …) in tutto soggetti (pazienti, utenti, clienti, …) e attribuiscono la differenza media nei risultati all’effetto causale del trattamento.

A volte capita che il l’unità di assegnazione del trattamento differisce dall’unità di osservazione. In altre parole, non decidiamo se trattare ogni singola osservazione in modo indipendente, ma piuttosto in gruppo. Ad esempio, potremmo decidere di trattare tutti i clienti in una determinata regione osservando i risultati a livello di cliente, oppure di trattare tutti gli articoli di una determinata marca osservando i risultati a livello di articolo. Di solito ciò accade a causa di vincoli pratici. Nel primo esempio, il cosiddetto geo-esperimentiaccade perché non siamo in grado di tracciare gli utenti a causa della deprecazione dei cookie.

Quando ciò accade, gli effetti del trattamento lo sono non indipendente attraverso le osservazioni. Infatti, se viene curato un cliente di una regione, verranno trattati anche gli altri clienti della stessa regione. Se un articolo di una marca non viene trattato, anche gli altri articoli della stessa marca non verranno trattati. Quando facciamo l'inferenza, dobbiamo tenere conto di questa dipendenza: errori standard, intervalli di confidenza e valori p dovrebbero essere adeguati. In questo articolo esploreremo come farlo utilizzando errori standard robusti al cluster.

Immagina di essere una piattaforma online e di essere interessato ad aumentare le vendite. Hai appena avuto una grande idea: mostrare a carosello di articoli correlati alla cassa per incentivare i clienti ad aggiungere altri articoli al carrello. Per capire se il carosello aumenta le vendite, decidi di sottoporlo a un AB test. In linea di principio potresti decidere per ogni ordine se visualizzare o meno il carosello, in modo casuale. Ciò, tuttavia, darebbe…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *