Un recente titolo del New Yorker recita: “Hanno studiato la disonestà. Il loro lavoro era una bugia?. Qual è la storia dietro? L’economista comportamentale Dan Ariely e la scienziata comportamentale Francesca Gino, entrambi acclamati nei loro campi, sono sotto esame per presunta cattiva condotta nella ricerca. Per dirla senza mezzi termini, sono accusati di falsificare i dati per ottenere risultati statisticamente significativi.
Purtroppo, tali casi non sono rari. La ricerca scientifica ha visto la sua quota di frodi. La pratica del p-hacking – ad esempio manipolare i dati, interrompere gli esperimenti una volta raggiunto un valore p significativo o riportare solo risultati significativi – è stata a lungo motivo di preoccupazione. In questo articolo rifletteremo sul motivo per cui alcuni ricercatori potrebbero essere tentati di modificare le loro scoperte. Mostreremo le conseguenze e spiegheremo cosa puoi fare per prevenire il p-hacking nei tuoi esperimenti.
Ma prima di addentrarci negli scandali e nei segreti, iniziamo dalle basi: un corso accelerato sul test delle ipotesi 101. Questa conoscenza sarà utile mentre esploriamo il mondo del p-hacking.
Ricapitoliamo i concetti chiave che devi conoscere per cogliere appieno il post. Se hai familiarità con la verifica delle ipotesi, incluso il valore p, gli errori di tipo I/II e il livello di significatività, puoi saltare questa parte.
La migliore prova della pizza
Andiamo a Napoli, la famosa città italiana conosciuta per la sua pizza. Due pizzerie, Port’Alba e Michele’s, affermano di fare la migliore pizza del mondo. Sei un critico gastronomico curioso, determinato a scoprire quale pizzeria merita davvero questo titolo. Per scoprirlo, decidi di ospitare “The Best Pizza Test” (che essenzialmente è solo un prova di ipotesi).
La tua indagine inizia con due ipotesi:
- Ipotesi nulla (H0): Non c’è differenza nel gusto delle pizze di Port’Alba e di Michele; qualsiasi differenza osservata è dovuta al caso.
- Ipotesi alternativa (H1): C’è una differenza significativa nel gusto delle pizze di Port’Alba e di Michele, indicando che una è migliore dell’altra.
Fonte: towardsdatascience.com