La riqualificazione dei modelli di abbandono presenta sfide uniche che richiedono particolare attenzione
La riqualificazione dei modelli di machine learning, in particolare quelli incentrati sulla previsione del tasso di abbandono dei clienti, è un passaggio essenziale per garantirne la pertinenza e l’accuratezza nel tempo. Tuttavia, la riqualificazione dei modelli di abbandono presenta sfide uniche che richiedono particolare attenzione. Tra i più notevoli c’è la distinzione tra gli effetti causali degli interventi: identificare i clienti che sono rimasti grazie al programma di fidelizzazione proattivo per indirizzarli esclusivamente a loro.
Consideriamo la seguente sequenza di eventi:
- Formazione iniziale del modello: Un modello viene addestrato utilizzando i dati storici dei clienti.
- Inferenza del modello: Alcuni clienti vengono contrassegnati come propensi all’abbandono.
- Intervento delle imprese: Interagire con questi clienti per convincerli a restare o utilizzare misure come promozioni e offerte personalizzate per incoraggiare la fidelizzazione.
- Riqualificazione con nuovi dati: Quando le prestazioni del modello peggiorano, è probabilmente il momento di riqualificarlo: il modello viene aggiornato con dati più recenti, che includono i risultati di questi interventi.
Immagina uno scenario: si prevede che un cliente abbandoni, viene trattato da un rappresentante della fidelizzazione e poi rimane. La sfida sorge quando si cerca di spiegare il motivo dietro la loro decisione: l’intervento ha fatto cambiare loro idea o in primo luogo sono stati classificati erroneamente dal modello?
Quando si riqualifica il modello su dati così ambigui, c’è il rischio di distorcere le previsioni future del modello: etichettare il cliente di cui sopra come “rimasto” potrebbe essere fuorviante, poiché avrebbe potuto andarsene se non lo avessimo convinto a restare.
Così come per le etichette di abbandono: un intervento potrebbe essere l’unico fattore scatenante dell’abbandono, rendendo alcune etichette di abbandono inaffidabili.
- Gruppi di controllo e dati sintetici: Creare un sottoinsieme di clienti con “probabilità di abbandono” ai quali non vengono applicati interventi. Confrontando i risultati tra questo gruppo di controllo e il gruppo intervenuto, si può dire il vero impatto degli interventi: se un certo segmento di clienti rifiuta di più quando viene trattato, dovrebbe essere esaminata la sua esclusione dall’intervento.
Quando è il momento di riqualificarsi, è possibile utilizzare i dati del gruppo di controllo ed escludere i dati del gruppo intervenuto, garantendo che il modello si basi su etichette di abbandono affidabili.
Lo svantaggio di questo metodo è la perdita di dati critici, quindi per compensare l’esclusione dei clienti intervenuti, provare a generare campioni sintetici del gruppo di controllo per rappresentare tali clienti. Questo può essere fatto da SMOTE tra le altre strategie di sovracampionamento. - Sondaggi di feedback: Coinvolgere direttamente i clienti dopo l’intervento per comprendere le ragioni della loro permanenza/abbandono. Le informazioni raccolte possono fornire chiarezza sull’efficacia degli interventi e aiutare a distinguere tra coloro che restano realmente e coloro che sono influenzati dagli sforzi.
- Unisci modelli: Prova a combinare il modello di formazione iniziale con quello nuovo. La media delle previsioni o l’utilizzo di metodi di insieme può ridurre il rischio che i pregiudizi di ogni singolo modello dominino la previsione complessiva.
Si noti che con il passare del tempo, i dati di addestramento iniziali potrebbero essere meno rilevanti.
A differenza dei tradizionali modelli di abbandono che prevedono chi potrebbe andarsene, Modellazione di sollevamento identificare i clienti il cui comportamento cambia direttamente a causa di un intervento.
Confrontando il gruppo trattato con il gruppo di controllo, questi modelli prevedono quali clienti restano a causa dell’intervento e quali invece abbandonano a causa dell’intervento.
Questo approccio mirato aiuta le aziende a ottimizzare le risorse e a massimizzare il valore del cliente.
I clienti possono essere suddivisi in quattro categorie teoriche dato che sono stati trattati/non trattati per gli sforzi di fidelizzazione:
Cose certe: Clienti che non si arrenderanno. Prenderli di mira non offre rendimenti aggiuntivi ma aggiunge costi, come sforzi di comunicazione e potenziali incentivi finanziari.
Cause perdute: Clienti che abbandoneranno indipendentemente dagli interventi. Non aggiungono entrate e possono comportare costi ridotti rispetto a Sure Things, poiché non sfruttano gli incentivi offerti.
Persuadibili: Clienti che rimangono solo dopo lo sforzo di fidelizzazione. Contribuiscono a entrate aggiuntive.
Non disturbare: Clienti che abbandonano solo se presi di mira. Lasciarli indisturbati è vantaggioso, mentre prenderli di mira aggiunge costi significativi senza guadagni in termini di entrate, rendendoli “cani dormienti”.
L’obiettivo del modello uplift è quello di prendere di mira esclusivamente i persuadibili.
La sfida è che non possiamo determinare in quale categoria rientrano gli individui. Non possiamo trattarli e averli contemporaneamente nel gruppo di controllo. Quindi, come potremmo identificarli? come potremmo sapere se erano convinti o non intendevano ribattere in primo luogo? È qui che entra in gioco la modellazione del sollevamento.
Esistono diversi approcci di miglioramento per questa sfida, daremo un’occhiata al metodo “Risultato trasformato”. questo metodo richiede dati sia dal gruppo di controllo che da quello di trattamento e sposta la nostra attenzione da un compito di classificazione a uno di regressione.
Le etichette vengono assegnate in base a a formula specificae per un’assegnazione di trattamento casuale in cui la propensione al trattamento è pari a 0,5, la variabile target si traduce in questi valori:
Possiamo utilizzare una funzione di perdita come l’errore quadratico medio (MSE) come metrica per risolvere questo problema di regressione:
Per Persuadables, il controllo è etichettato 0 e trattato è 2. Il MSE più basso tra loro sarà quello in cui il punteggio è 1, che rappresenta l’aumento dei Persuadables.
Per Non-Disturbare, il controllo è -2 e il trattamento è 0, con la previsione ottimale che è -1, a indicare il miglioramento.
Sia per le cause perse che per i casi sicuri, la previsione migliore è 0.
idealmente, si dovrebbero puntare ai punteggi più alti per cercare di trattenere i Persuadibili ed evitare il più possibile i Non Disturbare e altri.
Come abbiamo esplorato, il panorama della previsione del tasso di abbandono, con la sua complessità di interventi e dati in evoluzione, pone sfide alle aziende.
I modelli di riqualificazione non sono semplicemente un esercizio tecnico ma una parte della comprensione del comportamento dei clienti e del senso di una vera fidelizzazione. Sfruttare strumenti come gruppi di controllo, meccanismi di feedback e modelli di miglioramento.
Ma forse la cosa più importante è riconoscere che i dati non sono statici. La nostra comprensione del comportamento dei clienti deve adattarsi. Abbracciare questa situazione dinamica, perfezionare continuamente i modelli e rimanere in sintonia con i modelli di cambiamento sarà la chiave per prevedere e gestire con successo il tasso di abbandono in futuro.
Fonte: towardsdatascience.com