Privacy Policy Paradossi statistici e falsi miti - Antropia
Paradossi statistici e falsi miti

Paradossi statistici e falsi miti

L’indagine statistica è uno degli strumenti d’elezione per affrontare la complessità di fenomeni fisici, chimici e socio-antropologici. A volte, però, nasconde insidie contro le quali non è semplice cautelarsi e che potrebbero avere delle ripercussioni notevoli.

L’avvento di modelli scientifici sempre più sofisticati, come la meccanica quantistica o quelli della psicologia sociale, ha fatto evaporare la tensione prometeica alla conoscenza inesauribile ed infallibile. Ci ha sprofondati in una dimensione dominata dall’incertezza e nella quale molte dinamiche esulano dalla nostra volontà e si sottraggono alla nostra comprensione. L’angoscia interiore che ne deriva è stata proiettata e sublimata nelle arti figurative, alimentando, tra gli altri, i capolavori dell’esistenzialismo e dell’assurdismo.

Quando si ha a che fare con popolazioni molto numerose (di particelle o di persone, ad esempio), è impossibile formulare teorie deterministiche soddisfacenti, ossia che non coinvolgano variabili aleatorie. Il singolo elemento sfugge ad una caratterizzazione univoca e talora assume statuto ontologico soltanto in funzione della sua interazione con gli altri. Come ci insegna il ben noto principio di indeterminazione di Heisenberg, il semplice atto di misurare una proprietà tenderà ad alterarla. Analogamente, per predire ed interpretare il comportamento di un individuo occorre inquadrarlo in una società plasmata da una molteplicità disorientante di fattori storici, culturali ed economici, tra gli altri.

Ed ecco che la teoria della probabilità e l’indagine statistica spuntano immancabilmente a sostegno di tutte le discipline. Se da una parte ci hanno consentito di progredire vertiginosamente nella nostra comprensione del reale, dall’altra, a ben vedere, celano delle insidie da non sottovalutare.

Immaginate di essere golosi di dolciumi (non dovrebbe richiedervi uno sforzo eccessivo…) ma di essere allergici alla frutta secca, e di avere un amico che trae compiacimento dal torturarvi per questa ragione. Vi pone davanti due scatole: una bianca che contiene una settantina di caramelle assortite ed una decina di mandorle, ed una nera con ben duecento cioccolatini ed una sessantina di arachidi. Magari supponiamo pure che questo amico sia pasticciere, altrimenti non si spiega dove si sia procurato tutto. Ad ogni modo, vi è consentito di pescare da una scatola un solo oggetto (senza guardarvi dentro, naturalmente) a condizione di dover mangiare qualsiasi cosa vi capiti. Dopo un rapido calcolo, decidete di pescare dalla scatola bianca perché è quella che vi garantisce maggiore probabilità di pescare un dolcetto (87.5% contro 77%, circa). Beccate una caramella, e la inghiottite di gusto.

Ma non vi accontentate: desiderate ardentemente un altro dolcetto, e chiedete al vostro carnefice di ripetere il gioco. Per rendere più frizzante il tutto, nella scatola bianca vi sono ora un centinaio di caramelle, a fronte di cinquecento mandorle; nella nera una ventina di cioccolatini ma duecento arachidi. Di nuovo decidete di pescare dalla scatola bianca (16.6% contro 9%) e, con la complicità della sorte, pescate un dolcetto per coccolare il vostro palato.

Proprio perché è il vostro giorno fortunato ed il vostro appetito è insaziabile, vi sottoponete un’ultima volta alla scommessa. Il vostro amico, irritato, mescola i contenuti delle due scatole bianche in un’unica scatola bianca e quelli delle due nere in un’unica nera. Vi precipitate a frugare nella scatola bianca, convinti che sia l’opzione migliore in termini probabilistici, poiché somma dei due casi migliori. Ma vi sbagliate di grosso! Ora è la scatola nera a rappresentare l’alternativa più ragionevole, e non di poco (46% contro il 25%). Siete incappati nel cosiddetto paradosso di Simpson, per il quale la somma di due casi favorevoli può generarne uno sfavorevole (o viceversa).

E’ relativamente semplice comprendere che cosa sia accaduto, noto che la probabilità è definita come rapporto tra il numero di casi favorevoli e quelli totali. Ciononostante, è altrettanto semplice farsi indurre in inganno, trattandosi di un qualcosa di controintuitivo.

Un altro paradosso alquanto diffuso in statistica è quello di Will Rogers, che si verifica quando, muovendo un elemento da un insieme ad un altro, la media di entrambi aumenta. Il suo nome è dovuto al comico Will Rogers ed ad una sua battuta al confine col politicamente scorretto: “Quando gli Okies lasciarono l’Oklahoma per trasferirsi in California, l’intelligenza media è aumentata in entrambi gli Stati”. Anche in questo caso la soluzione è semplice: se l’elemento che si sposta è sotto la media nel suo attuale insieme di appartenenza ma sopra in quello di destinazione, per definizione di media incrementeranno entrambe.

Un fenomeno relativamente frequente nelle indagini condotte con scarsa competenza è la confusione tra correlazione tra variabili e rapporto di causalità. Prescindendo da una trattazione esauriente, che esigerebbe definire tutta una serie di nozioni teoriche formali, si ricordi che il verificarsi simultaneo di due eventi non ci autorizza a concludere che uno dei due sia la causa dell’altro, quand’anche possa apparire ragionevole. Ad esempio, in assenza di un esperimento opportunamente concepito (ed ulteriore alla semplice indagine statistica!), non si può inferire che spendere molte ore davanti al computer causi un aumento della pressione arteriosa solo perché i dati di un campione lo suggeriscono. Esistono difatti delle variabili, dette latenti (lurking variables), non contemplate nello studio, che sono in grado di influenzare e determinare entrambi gli eventi. Nel caso di specie si tratta dell’attività fisica: le persone che ne eseguono di meno in media spendono più tempo davanti al computer ed hanno una pressione più alta.

Il problema sorge quando indagini statistiche di un certo impatto vengono viziate da questi errori procedurali, per la negligenza o per le intenzioni poco ortodosse di chi le ha condotte. Ad esempio, riprendendo la logica delle scatole di dolciumi, può capitare, nelle indagini cliniche, che un farmaco che risulta efficace per il trattamento di una patologia sia in un gruppo di anziani che di giovani, appaia poi come inefficace o persino dannoso se si cumulano i dati in un unico insieme.

In altri casi non vi sono veri e propri errori nell’indagine, ma i risultati vengono espressi in maniera tale da amplificarne subdolamente l’impatto emotivo su chi li legge e di conseguenza la risonanza mediatica. In uno studio condotto in Australia è emerso un incremento di circa il 18% nella probabilità di contrarre il cancro al colon a fronte di una alimentazione ricca in bacon. Quello che non si esplicita è che l’incremento è relativo, ossia 9 individui su 100 hanno contratto il cancro, contro gli 8 su 100 che statisticamente lo contraggono pur senza mangiare i 50 grammi giornalieri di carne processata.  Ed ancora: chi si abbronza con le lampade artificiali (abusandone, peraltro) ha il 50% di probabilità in più di contrarre cancro alla pelle. 50% in più rispetto al rischio valutato per la normale esposizione solare, che ammonta a circa 0.2%. In altri termini, il rischio assoluto è salito solo allo 0.3%.

Ma cambiamo settore. Nel 1973 l’università di Berkeley fu uno dei primi atenei ad essere denunciato per discriminazione di genere. Senza addentrarci troppo nei dettagli la sostanza è che, depurando l’analisi dai paradossi di Simpson e di Will-Rogers, non solo non si riscontrava discriminazione nei confronti delle ragazze, ma in alcuni casi si sarebbe potuto persino argomentare su una eventuale discriminazione ai danni dei maschi (il condizionale è d’obbligo, considerando che esaminare il semplice rapporto candidati/ammessi è un’analisi talmente superficiale da squalificarla in partenza, indipendentemente dall’esito).

Le indagini a sostegno dell’esistenza di un gender pay gap (il divario nella retribuzione tra lavoratori maschi e femmine) spesso trascurano fattori che ribalterebbero gli esiti se fossero valutati o che, laddove un divario effettivamente esista, permetterebbero di razionalizzarlo senza che ciò implichi discriminazione di genere attiva. Se proprio si volesse dare credito a questi dati, bisognerebbe avere l’onestà intellettuale di accettare anche che gli uomini lavorano in media più delle donne, sono più propensi agli straordinari, hanno uno spettro di soft-skills più appetibile agli occhi degli imprenditori in alcuni settori e costituiscono la frazione maggioritaria delle persone che vantano un quoziente intellettivo geniale.

La letteratura psicometrica concorda inoltre nel ritenere che uomini e donne, quando si trovano in situazioni di stress o pericolo (reale o percepito), perpetrano livelli paragonabili di aggressioni fisiche e psicologiche (in ambiente domestico e non), sfatando la narrativa mistificante che dipinge l’uomo come l’unico sesso violento e prevaricatore.  Si riscontrano naturalmente differenze di qualche punto percentuale (non oltre il 5%, di solito) nelle modalità e negli esiti con cui tali aggressioni avvengono: le donne sono lievemente più propense a ricorrere a forme di aggressione verbali e psicologiche ed aggrediscono fisicamente quando percepiscono che la loro incolumità è messa a repentaglio. Peraltro sarebbe da considerarsi prodigioso che le differenze siano così contenute, considerando i profili ormonali profondamente differenti che ribollono nei corpi di uomini e donne. Ed ancora: considerato che le donne vittime di “femminicidio” nell’ultimo decennio ammontano a circa una cinquantina all’anno (lo 0,0000015% della popolazione femminile), dovrebbe essere lampante agli occhi di tutti di come si tratti di un fenomeno non rilevante statisticamente su scala sociale, con buona pace di quanti s’affannano ad addebitarlo ad una cultura o agli ideali di uno schieramento politico.

Per concludere, nell’augurio che vi suscitino una riflessione autonoma, un paio di citazioni.

“La vera difficoltà sta nel capire se gli eventi da analizzare sono completamente indipendenti o lo sono in parte”. George Yule

“La logica è legata a questa condizione: supporre disperatamente che si diano dei casi identici, perché senza costanti l’uomo non potrebbe sopravvivere”. Friedrich Nietzsche

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *