In statistica, una correlazione viene utilizzata per valutare la relazione tra due variabili.
In un post precedente, abbiamo mostrato come farlo calcolare una correlazione ed eseguire un test di correlazione in R. In questo post, illustriamo come calcolare manualmente i coefficienti di correlazione di Pearson, Spearman e Kendall e in due scenari diversi (ovvero con e senza legami).
Per illustrare i metodi con e senza legami, consideriamo due diversi set di dati, uno con legami e un altro senza legami.
Per illustrare gli scenari con parità, supponiamo di avere il seguente campione di dimensione 5:
Come possiamo vedere, ci sono dei legami poiché ci sono due osservazioni identiche nella variabile x.
Per gli scenari che non richiedono vincoli, considereremo il seguente campione di dimensione 3:
I tre metodi di correlazione più comuni sono:1
- Pearson, usato per due quantitativo continuo variabili che hanno una relazione lineare
- Spearman, utilizzato per due variabili quantitative se il legame è parzialmente lineare, oppure per una ordinale qualitativo variabile e una variabile quantitativa
- Kendall, spesso utilizzato per due variabili ordinali qualitative