
Senza dubbio, fidelizzazione degli utenti è una metrica di prestazione cruciale per molte aziende e app online. Discuteremo di come utilizzare le funzionalità di machine learning integrate nel data warehouse per eseguire modelli di propensione sui dati comportamentali degli utenti per determinare la probabilità di abbandono dell’utente. In questa storia vorrei concentrarmi sulla preparazione del set di dati e sull’addestramento del modello utilizzando SQL standard. I moderni data warehouse lo consentono. In effetti, la fidelizzazione è un importante parametro aziendale che aiuta a comprendere i meccanismi del comportamento degli utenti. Fornisce una panoramica di alto livello del successo della nostra Applicazione in termini di fidelizzazione degli utenti rispondendo a una semplice domanda: la nostra App è abbastanza buona da fidelizzare gli utenti? È risaputo che è più economico mantenere un utente esistente che acquisirne uno nuovo.
In uno dei miei articoli precedenti ho scritto del moderno data warehousing (1).
Il DWH moderno ha molte caratteristiche e componenti utili che lo differenziano da altri tipi di piattaforme dati (2).
Il supporto del modello ML sembra essere il componente DWH fondamentale quando si ha a che fare con i big data.
In questa storia, userò Regressione logistica binariauno dei modelli più veloci da addestrare. Dimostrerò come possiamo utilizzarlo per prevedere la propensione degli utenti all’abbandono. In effetti, non è necessario conoscere ogni modello di apprendimento automatico.
Non possiamo competere con fornitori di servizi cloud come Amazon e Google nell’apprendimento automatico e nella scienza dei dati, ma dobbiamo sapere come utilizzarlo.
Ne ho già parlato nel mio articolo qui (3):
In questo tutorial impareremo come trasformare i dati grezzi degli eventi per creare un set di dati di addestramento per il nostro ML…
Fonte: towardsdatascience.com