Paradossi statistici e falsi miti
5 min readL’avvento di modelli scientifici sempre più sofisticati, come la meccanica quantistica o quelli della psicologia sociale, ha fatto evaporare la tensione prometeica alla conoscenza inesauribile ed infallibile. Ci ha sprofondati in una dimensione dominata dall’incertezza e nella quale molte dinamiche esulano dalla nostra volontà e si sottraggono alla nostra comprensione. L’angoscia interiore che ne deriva è stata proiettata e sublimata nelle arti figurative, alimentando, tra gli altri, i capolavori dell’esistenzialismo e dell’assurdismo.
Quando si ha a che fare con popolazioni molto numerose (di particelle o di persone, ad esempio), è impossibile formulare teorie deterministiche soddisfacenti, ossia che non coinvolgano variabili aleatorie. Il singolo elemento sfugge ad una caratterizzazione univoca e talora assume statuto ontologico soltanto in funzione della sua interazione con gli altri. Come ci insegna il ben noto principio di indeterminazione di Heisenberg, il semplice atto di misurare una proprietà tenderà ad alterarla. Analogamente, per predire ed interpretare il comportamento di un individuo occorre inquadrarlo in una società plasmata da una molteplicità disorientante di fattori storici, culturali ed economici, tra gli altri.
Ed ecco che la teoria della probabilità e l’indagine statistica spuntano immancabilmente a sostegno di tutte le discipline. Se da una parte ci hanno consentito di progredire vertiginosamente nella nostra comprensione del reale, dall’altra, a ben vedere, celano delle insidie da non sottovalutare.
Immaginate di essere golosi di dolciumi (non dovrebbe richiedervi uno sforzo eccessivo…) ma di essere allergici alla frutta secca, e di avere un amico che trae compiacimento dal torturarvi per questa ragione. Vi pone davanti due scatole: una bianca che contiene una settantina di caramelle assortite ed una decina di mandorle, ed una nera con ben duecento cioccolatini ed una sessantina di arachidi. Magari supponiamo pure che questo amico sia pasticciere, altrimenti non si spiega dove si sia procurato tutto. Ad ogni modo, vi è consentito di pescare da una scatola un solo oggetto (senza guardarvi dentro, naturalmente) a condizione di dover mangiare qualsiasi cosa vi capiti. Dopo un rapido calcolo, decidete di pescare dalla scatola bianca perché è quella che vi garantisce maggiore probabilità di pescare un dolcetto (87.5% contro 77%, circa). Beccate una caramella, e la inghiottite di gusto.
Ma non vi accontentate: desiderate ardentemente un altro dolcetto, e chiedete al vostro carnefice di ripetere il gioco. Per rendere più frizzante il tutto, nella scatola bianca vi sono ora un centinaio di caramelle, a fronte di cinquecento mandorle; nella nera una ventina di cioccolatini ma duecento arachidi. Di nuovo decidete di pescare dalla scatola bianca (16.6% contro 9%) e, con la complicità della sorte, pescate un dolcetto per coccolare il vostro palato.
Proprio perché è il vostro giorno fortunato ed il vostro appetito è insaziabile, vi sottoponete un’ultima volta alla scommessa. Il vostro amico, irritato, mescola i contenuti delle due scatole bianche in un’unica scatola bianca e quelli delle due nere in un’unica nera. Vi precipitate a frugare nella scatola bianca, convinti che sia l’opzione migliore in termini probabilistici, poiché somma dei due casi migliori. Ma vi sbagliate di grosso! Ora è la scatola nera a rappresentare l’alternativa più ragionevole, e non di poco (46% contro il 25%). Siete incappati nel cosiddetto paradosso di Simpson, per il quale la somma di due casi favorevoli può generarne uno sfavorevole (o viceversa).
E’ relativamente semplice comprendere che cosa sia accaduto, noto che la probabilità è definita come rapporto tra il numero di casi favorevoli e quelli totali. Ciononostante, è altrettanto semplice farsi indurre in inganno, trattandosi di un qualcosa di controintuitivo.
Un altro paradosso alquanto diffuso in statistica è quello di Will Rogers, che si verifica quando, muovendo un elemento da un insieme ad un altro, la media di entrambi aumenta. Il suo nome è dovuto al comico Will Rogers ed ad una sua battuta al confine col politicamente scorretto: “Quando gli Okies lasciarono l’Oklahoma per trasferirsi in California, l’intelligenza media è aumentata in entrambi gli Stati”. Anche in questo caso la soluzione è semplice: se l’elemento che si sposta è sotto la media nel suo attuale insieme di appartenenza ma sopra in quello di destinazione, per definizione di media incrementeranno entrambe.
Un fenomeno relativamente frequente nelle indagini condotte con scarsa competenza è la confusione tra correlazione tra variabili e rapporto di causalità. Prescindendo da una trattazione esauriente, che esigerebbe definire tutta una serie di nozioni teoriche formali, si ricordi che il verificarsi simultaneo di due eventi non ci autorizza a concludere che uno dei due sia la causa dell’altro, quand’anche possa apparire ragionevole. Ad esempio, in assenza di un esperimento opportunamente concepito (ed ulteriore alla semplice indagine statistica!), non si può inferire che spendere molte ore davanti al computer causi un aumento della pressione arteriosa solo perché i dati di un campione lo suggeriscono. Esistono difatti delle variabili, dette latenti (lurking variables), non contemplate nello studio, che sono in grado di influenzare e determinare entrambi gli eventi. Nel caso di specie si tratta dell’attività fisica: le persone che ne eseguono di meno in media spendono più tempo davanti al computer ed hanno una pressione più alta.
Il problema sorge quando indagini statistiche di un certo impatto vengono viziate da questi errori procedurali, per la negligenza o per le intenzioni poco ortodosse di chi le ha condotte. Ad esempio, riprendendo la logica delle scatole di dolciumi, può capitare, nelle indagini cliniche, che un farmaco che risulta efficace per il trattamento di una patologia sia in un gruppo di anziani che di giovani, appaia poi come inefficace o persino dannoso se si cumulano i dati in un unico insieme.
In altri casi non vi sono veri e propri errori nell’indagine, ma i risultati vengono espressi in maniera tale da amplificarne subdolamente l’impatto emotivo su chi li legge e di conseguenza la risonanza mediatica. In uno studio condotto in Australia è emerso un incremento di circa il 18% nella probabilità di contrarre il cancro al colon a fronte di una alimentazione ricca in bacon. Quello che non si esplicita è che l’incremento è relativo, ossia 9 individui su 100 hanno contratto il cancro, contro gli 8 su 100 che statisticamente lo contraggono pur senza mangiare i 50 grammi giornalieri di carne processata. Ed ancora: chi si abbronza con le lampade artificiali (abusandone, peraltro) ha il 50% di probabilità in più di contrarre cancro alla pelle. 50% in più rispetto al rischio valutato per la normale esposizione solare, che ammonta a circa 0.2%. In altri termini, il rischio assoluto è salito solo allo 0.3%.
Per concludere, nell’augurio che vi suscitino una riflessione autonoma, un paio di citazioni.
“La vera difficoltà sta nel capire se gli eventi da analizzare sono completamente indipendenti o lo sono in parte”. George Yule
“La logica è legata a questa condizione: supporre disperatamente che si diano dei casi identici, perché senza costanti l’uomo non potrebbe sopravvivere”. Friedrich Nietzsche
Ho conseguito la maturità classica nel 2015, la laurea di primo livello in Ingegneria Chimica presso il Politecnico di Milano nel 2019 e la laurea magistrale nel 2021 in Chemical Product Engineering con particolare enfasi per i bioprocessi industriali e le tecnologie di formulazione farmaceutica e cosmetica. Traggo la mia linfa vitale da interessi poliedrici, tra cui la filosofia e l’antropologia, e da una inclinazione naturale alla speculazione teorica al servizio di risvolti concreti nella quotidianità.
1 thought on “Paradossi statistici e falsi miti”