Quale misura di correlazione dovresti utilizzare per il tuo compito? Scopri tutto quello che devi sapere sulle correlazioni Pearson e Spearman
Consideriamo a Orchestra Sinfonica accordare i propri strumenti prima di un’esibizione. Ogni musicista regola le proprie note per armonizzarle con gli altri, garantendo a esperienza musicale senza soluzione di continuità. In Scienza dei datile variabili in un set di dati possono essere confrontate con musicisti dell’orchestra: comprendere l’armonia o le dissonanze tra loro è fondamentale.
Correlazione è una misura statistica che agisce come il direttore d’orchestra, guidando la comprensione del relazioni complesse all’interno dei nostri dati. Qui ci concentreremo su due tipi di correlazioni: Pearson E Lanciere.
Se i nostri dati sono una composizione, Pearson e Spearman sono i nostri direttori d’orchestra: hanno uno stile singolare di interpretare la sinfonia, ciascuno con punti di forza e sottigliezze peculiari. Comprendere queste due diverse metodologie ti consentirà di farlo estrarre approfondimenti E capire le connessioni tra variabili.
IL Coefficiente di correlazione di Pearsonindicato come Rquantifica la forza e la direzione di a relazione lineare tra due variabili continue (1). Si calcola dividendo la covarianza delle due variabili per il prodotto delle loro deviazioni standard.
Qui X E Y sono due variabili diverse, e X_i E Sì_i rappresentano singoli punti dati. \bar{X} E \bar{Y} denotano i valori medi delle rispettive variabili.
L’interpretazione di R fa affidamento sul suo valore, compreso tra -1 e 1. Un valore pari a -1 implica una perfetta correlazione negativa, indicando che all’aumentare di una variabile, l’altra diminuisce linearmente (2). Al contrario, un valore pari a 1 indica una perfetta correlazione positiva, illustrando un aumento lineare in entrambe le variabili. Un valore pari a 0 implica alcuna correlazione lineare.
La correlazione di Pearson è particolarmente efficace nel catturare le relazioni lineari tra le variabili. La sua sensibilità ai modelli lineari lo rende uno strumento potente per indagare le relazioni governate da una tendenza lineare coerente. Inoltre, la natura standardizzata del…
Fonte: towardsdatascience.com