Le statistiche fuorvianti possono essere pericolose (alcuni esempi)
Pubblicato: 2022-12-06Le persone si affidano alle statistiche per ottenere informazioni importanti. Nel mondo degli affari, le statistiche possono essere utili per tenere traccia delle tendenze e massimizzare la produttività. Ma a volte le statistiche possono essere presentate in modo fuorviante . Ad esempio, nel 2007 l'Advertising Standards Authority (ADA) nel Regno Unito ha ricevuto un reclamo per un annuncio Colgate.
L'annuncio afferma notoriamente che l'80% dei dentisti consiglia di utilizzare il dentifricio Colgate. La denuncia ricevuta dall'ADA sosteneva che si trattava di una violazione delle regole sulla pubblicità nel Regno Unito. Dopo aver esaminato la questione, l'ADA ha scoperto che l'annuncio utilizzava statistiche fuorvianti.
È vero che molti dentisti raccomandano il dentifricio Colgate. Ma non tutti hanno citato Colgate come raccomandazione numero uno. La maggior parte dei dentisti consigliava anche altri tipi di dentifricio e Colgate di solito si presentava a un certo punto in seguito.
Questo è solo un esempio di come vengono utilizzate statistiche fuorvianti. Le persone si imbattono in esempi statistici fuorvianti in molti settori diversi della vita. Puoi trovare esempi nelle notizie, nella pubblicità, nella politica e persino nella scienza.
Questo post ti aiuterà a imparare a riconoscere statistiche fuorvianti e altri dati fuorvianti . Discuterà di come questi dati fuorviano le persone. Imparerai anche quando e come utilizzare i dati quando prendi decisioni critiche.
Quali sono le statistiche fuorvianti?
Le statistiche sono il risultato della raccolta di dati numerici, analizzandoli attentamente e quindi interpretandoli . È particolarmente utile disporre di statistiche se si ha a che fare con una grande quantità di dati, ma tutto ciò che può essere misurato può diventare una statistica. Le statistiche spesso rivelano molto sul mondo e su come funziona.
Tuttavia, quando tali informazioni vengono utilizzate in modo improprio, anche per caso, diventano una statistica fuorviante. Le statistiche fuorvianti danno alle persone false informazioni che le ingannano invece di informarle .
Quando le persone prendono una statistica fuori contesto, perde il suo valore e può indurre le persone a trarre conclusioni errate. Il termine "statistiche fuorvianti" descrive qualsiasi metodo statistico che rappresenta i dati in modo errato. Che fosse intenzionale o meno , sarebbe comunque considerato una statistica fuorviante.
Quando si raccolgono dati per una statistica, ci sono tre punti principali da tenere a mente. Durante uno qualsiasi di questi punti potrebbe verificarsi un problema con l'analisi dei dati.
- Raccolta: durante la raccolta dei dati
- Elaborazione: quando si analizzano i dati e le relative implicazioni
- Presentazione: quando condividi le tue scoperte con gli altri
Una piccola dimensione del campione
I sondaggi sulle dimensioni del campione sono un esempio di creazione di statistiche fuorvianti. Sondaggi o studi condotti su un pubblico di dimensioni campionarie spesso producono risultati così fuorvianti da risultare inutilizzabili.
Per illustrare, un sondaggio pone a 20 persone una domanda sì o no. 19 delle persone rispondono sì al sondaggio. Quindi i risultati mostrano che il 95% delle persone risponderebbe di sì a questa domanda. Ma questo non è un buon sondaggio perché le informazioni sono limitate.
Questa statistica non ha valore reale. Ora, se fai la stessa domanda a 1.000 persone e 950 dicono di sì, allora questa è una statistica molto più affidabile per dimostrare che il 95% delle persone direbbe di sì.
Per condurre uno studio affidabile sulla dimensione del campione, è necessario considerare tre cose:
- Uno : Che tipo di domanda stai facendo?
- Due : qual è il significato della statistica che stai cercando di trovare?
- E tre : quale tecnica statistica utilizzerai?
Per avere risultati affidabili, qualsiasi analisi quantitativa della dimensione del campione dovrebbe includere almeno 200 persone.
Domande caricate
È importante cercare i dati da una fonte neutra . In caso contrario, l'informazione è distorta. Le domande caricate utilizzano un presupposto controverso o ingiustificato per manipolare la risposta. Un esempio di ciò è porre una domanda che inizia con "Cosa ti piace". Questa domanda fa un ottimo lavoro nel raccogliere feedback positivi ma non riesce a insegnarti nulla di utile. Non fornisce alcuna opportunità per la persona di esprimere i propri pensieri e opinioni onesti.
Considera la differenza nelle seguenti due domande:
- Sostieni una riforma fiscale che implicherebbe tasse più alte?
- Sostieni una riforma fiscale che sarebbe vantaggiosa per la redistribuzione sociale?
La domanda si riferisce essenzialmente allo stesso argomento, ma i risultati di ciascuna di queste domande sarebbero molto diversi. I sondaggi dovrebbero essere condotti in modo imparziale e imparziale. Vuoi ottenere le opinioni oneste delle persone e il quadro completo di ciò che pensano le persone. Per raggiungere questo obiettivo, le tue domande non dovrebbero implicare la risposta né provocare una risposta emotiva .
Citando "medie" fuorvianti
Alcune persone usano il termine "medio" per oscurare la verità o mentire per migliorare l'aspetto delle informazioni.
Questa tecnica è particolarmente utile se qualcuno vuole far apparire un numero più grande o migliore di quello che è. Ad esempio, un'università che desidera attrarre nuovi studenti può fornire uno stipendio annuo "medio" per i laureati della propria scuola. Ma potrebbe esserci solo una manciata di studenti che hanno effettivamente stipendi alti. Ma i loro stipendi aumentano il reddito medio di tutti gli studenti. Sembra migliore per l'intera media.
Le medie sono utili anche per nascondere la disuguaglianza. Come altro esempio, supponiamo che un'azienda paghi $ 20.000 all'anno ai suoi 90 dipendenti. Ma il loro capo riceve $ 200.000 all'anno. Se si combinano lo stipendio del capo e quello dei dipendenti, il reddito medio per ogni membro dell'azienda è di $ 21.978.
Sulla carta, sembra fantastico. Ma quel numero non racconta tutta la storia perché uno dei dipendenti (il capo) sta guadagnando molto di più degli altri lavoratori. Quindi questo tipo di risultati conta come statistiche fuorvianti.
Dati cumulativi vs. annuali
I dati cumulativi tengono traccia delle informazioni su un grafico nel tempo. Ogni volta che inserisci dati nei grafici, il grafico si alza.
Dati annuali presenta tutti i dati per un anno specifico.
Il monitoraggio delle informazioni per ogni anno fornisce un quadro più fedele delle tendenze generali.
Un esempio di grafico cumulativo è il grafico Worldometer COVID-19. Durante la pandemia di COVID-19, sono emersi molti esempi di grafici cumulativi. Spesso riflettono il numero cumulativo di casi COVID in un'area specifica.
Alcune aziende utilizzano grafici come questo per far apparire le vendite maggiori di quello che sono. Nel 2013, il CEO di Apple Tim Cook ha ricevuto critiche per aver utilizzato una presentazione che mostrava solo il numero cumulativo di vendite di iPhone. Molti all'epoca pensavano che lo avesse fatto intenzionalmente per nascondere il fatto che le vendite di iPhone stavano diminuendo.
Questo non vuol dire che tutti i dati cumulativi siano errati o falsi. Infatti, può essere utile per tenere traccia delle modifiche o della crescita e dei vari totali. Ma l'importante è prestare attenzione ai cambiamenti nei dati. Quindi guarda più a fondo cosa li ha causati piuttosto che fare affidamento sul grafico per dirti tutto.
Sovrageneralizzazione e campioni distorti
L'eccessiva generalizzazione si verifica quando qualcuno suppone che ciò che è vero per una persona debba essere vero per tutti gli altri. Di solito, questo errore si verifica quando qualcuno conduce uno studio con un certo gruppo di persone. Presumono quindi che i risultati saranno veri per un altro gruppo di persone non imparentato.
I campioni non rappresentativi, o campioni distorti, sono sondaggi che non rappresentano accuratamente la popolazione generale.
Un esempio di campioni distorti si è verificato durante le elezioni presidenziali del 1936 negli Stati Uniti d'America.
Il Literary Digest, una popolare rivista dell'epoca, condusse un sondaggio per prevedere chi avrebbe vinto le elezioni. I risultati prevedevano che Alfred Landon avrebbe vinto con una valanga di voti.
Questa rivista era nota per prevedere con precisione l'esito delle elezioni. Quest'anno, tuttavia, si sono sbagliati completamente. Franklin Roosevelt ha vinto con quasi il doppio dei voti del suo avversario.
Altre ricerche hanno rivelato che erano entrate in gioco due variabili che distorcevano i risultati.
In primo luogo , la maggior parte dei partecipanti al sondaggio erano persone trovate nell'elenco telefonico e negli elenchi delle immatricolazioni automobilistiche. Quindi il sondaggio è stato condotto solo con persone di un certo status socio-economico.
Il secondo fattore è stato che coloro che hanno votato per Landon erano più disposti a rispondere al sondaggio rispetto a coloro che hanno scelto di votare per Roosevelt. Quindi i risultati riflettevano quel pregiudizio.
Troncare un asse
Troncare l'asse su un grafico è un altro esempio di statistiche fuorvianti. Sulla maggior parte dei grafici statistici, sia l'asse x che l'asse y presumibilmente iniziano da zero. Ma troncare l'asse significa che il grafico inizia effettivamente gli assi con un altro valore. Ciò influisce sull'aspetto di un grafico e sulle conclusioni che una persona trarrà.
Ecco un esempio che lo illustra:
Un altro esempio di ciò è accaduto di recente nel settembre 2021. In una trasmissione di Fox News, il conduttore ha utilizzato un grafico che mostra il numero di americani che affermavano di essere cristiani. Il grafico mostrava che il numero di americani che si identificavano come cristiani era diminuito drasticamente negli ultimi 10 anni.
Nel grafico seguente, vediamo che nel 2009 il 77% degli americani si identificava come cristiano.
Entro il 2019, il numero è sceso al 65%. In realtà, non si tratta di una diminuzione enorme. Ma l'asse su questo grafico inizia al 58% e si ferma al 78%. Quindi il calo del 12% dal 2009 al 2019 appare molto più drastico di quanto non sia in realtà.
Causalità e correlazione
Può essere facile ipotizzare una connessione tra due punti dati apparentemente connessi. Eppure, si dice che la correlazione non implica la causalità . Perchè è così?
Questo grafico illustra perché la correlazione non è la stessa cosa della causalità.
I ricercatori sono spesso sotto pressione per scoprire dati nuovi e utili. Quindi la tentazione di saltare la pistola e trarre conclusioni prematuramente è sempre lì. Ecco perché è importante in ogni situazione cercare la causa e l'effetto reali .
Usare le percentuali per nascondere numeri e calcoli
Una percentuale può nascondere i numeri esatti e far apparire i risultati più attendibili e affidabili di quanto non siano.
Ad esempio, se due persone su tre preferiscono un determinato prodotto per la pulizia, potresti dire che il 66,667% delle persone preferisce quel prodotto. Questo rende il numero più ufficiale, specialmente con i numeri dopo la virgola inclusi.
Ecco alcuni altri modi in cui i decimali e le percentuali possono oscurare la verità:
- Nascondere numeri grezzi e campioni di piccole dimensioni . Le percentuali oscurano il valore assoluto dei numeri grezzi. Questo li rende utili per le persone che vogliono nascondere numeri poco lusinghieri o risultati di piccole dimensioni del campione.
- Usando basi diverse. Poiché le percentuali non forniscono i numeri originali su cui si basano, può essere facile distorcere i risultati. Se qualcuno volesse migliorare l'aspetto di un numero, potrebbe calcolarlo partendo da una base diversa.
Questo è successo una volta in un rapporto pubblicato dal New York Times sui lavoratori sindacali. I lavoratori hanno subito una riduzione dello stipendio del 20% un anno e l'anno successivo il Times ha riferito che i lavoratori del sindacato hanno ricevuto un aumento del 5%. Quindi l'affermazione era che avevano ottenuto la restituzione di un quarto della loro riduzione dello stipendio.
Tuttavia, i lavoratori hanno ricevuto un aumento del 5% basato sul loro salario attuale, non sul salario che avevano prima del taglio salariale. Quindi, anche se sulla carta sembrava buono, il taglio del salario del 20% e l'aumento del 5% sono stati calcolati su numeri di base diversi. I due numeri non si confrontavano affatto.
Cherry Picking/scartare dati sfavorevoli
Il termine "raccolta di ciliegie" si basa sull'idea di raccogliere solo i frutti migliori da un albero. Chiunque veda quel frutto è destinato a pensare che tutti i frutti sull'albero siano ugualmente sani. Ovviamente, non è necessariamente così.
Questo stesso principio entra in gioco nel caso del cambiamento climatico. Molti grafici limitano la loro cornice di dati per mostrare solo i cambiamenti climatici dagli anni 2000 al 2013.
Di conseguenza, sembra che le variazioni di temperatura e le anomalie siano coerenti e non cambino molto. Tuttavia, quando fai un passo indietro e guardi il quadro generale, diventa chiaro dove si trovano i cambiamenti e le anomalie.
Questo accade anche nel campo della medicina veterinaria. Quando ai veterinari viene chiesto di presentare i risultati di un nuovo medicinale sperimentale, tendono a presentare i risultati migliori. In particolare, se un'azienda farmaceutica sostiene la sperimentazione, desidera vedere solo i migliori risultati.
I tuoi bellissimi dati meritano di essere online
wpDataTables può farlo in questo modo. C'è una buona ragione per cui è il plug-in n. 1 di WordPress per la creazione di tabelle e grafici reattivi.
Ed è davvero facile fare qualcosa del genere:
- Tu fornisci i dati della tabella
- Configuralo e personalizzalo
- Pubblicalo in un post o in una pagina
E non è solo carino, ma anche pratico. Puoi creare tabelle di grandi dimensioni con un massimo di milioni di righe, oppure puoi utilizzare filtri e ricerche avanzati, oppure puoi scatenarti e renderlo modificabile.
"Sì, ma mi piace troppo Excel e non c'è niente del genere sui siti web". Sì, c'è. Puoi utilizzare la formattazione condizionale come in Excel o Fogli Google.
Ti ho detto che puoi anche creare grafici con i tuoi dati? E questa è solo una piccola parte. Ci sono molte altre funzionalità per te.
Pesca di dati
La pesca dei dati, nota anche come dragaggio dei dati, è l'analisi di grandi quantità di dati con l'obiettivo di trovare una correlazione. Tuttavia, come discusso in precedenza in questo post, la correlazione non implica la causalità. Insistere sul fatto che si traduca solo in statistiche fuorvianti.
Puoi vedere esempi di pesca di dati nei settori industriali ogni giorno. Una settimana viene pubblicato uno scandalo sul data mining, e una settimana dopo viene confutato da un rapporto ancora più oltraggioso.
Un altro problema con questo tipo di analisi dei dati è che le persone scelgono solo i dati che supportano la loro visione e ignorano il resto. Omettendo informazioni contraddittorie, rendono i risultati più convincenti .
Etichette di grafici e grafici confusi
Quando è iniziata la pandemia di COVID-19, più persone che mai si sono rivolte alla visualizzazione dei dati sulla diffusione del virus. Le persone che non hanno mai dovuto lavorare con una rappresentazione visiva delle statistiche sono state improvvisamente gettate fuori dal profondo dei dati statistici.
Inoltre, le organizzazioni spesso cercavano di ottenere rapidamente informazioni sulle persone. A volte ciò significava sacrificare statistiche accurate. Ciò ha causato un picco nelle statistiche fuorvianti e nell'errata interpretazione dei dati.
Circa cinque mesi dopo l'inizio della diffusione del COVID-19, il Dipartimento della sanità pubblica della Georgia degli Stati Uniti ha pubblicato questo grafico:
Lo scopo del grafico era mostrare i 5 paesi con il maggior numero di casi COVID negli ultimi 15 giorni e il numero di casi in un periodo di tempo.
Questo grafico ha alcuni errori che rendono facile fraintendere. L'asse x, ad esempio, non ha un'etichetta che spieghi che rappresenta la progressione dei casi nel tempo.
Peggio ancora, le date sul grafico non sono organizzate cronologicamente. Le date di aprile e maggio sono sparse in tutto il grafico per far sembrare che il numero di casi sia in costante calo. Ogni paese è anche elencato in modo da far sembrare che i casi stiano diminuendo.
Successivamente, hanno ripubblicato il grafico con date e contee meglio organizzate:
Numeri imprecisi
Un altro esempio di statistiche fuorvianti si presenta sotto forma di numeri imprecisi. Nota questa affermazione da una vecchia campagna Reebok.
L'annuncio afferma che la scarpa fa lavorare i muscoli posteriori della coscia e i polpacci di una persona dell'11% in più e può tonificare il sedere di una persona fino al 28% in più rispetto ad altre scarpe da ginnastica . Tutto ciò che la persona deve fare è camminare con le scarpe da ginnastica.
Quei numeri fanno sembrare che Reebok abbia svolto ricerche approfondite sui vantaggi della scarpa.
La realtà era che quei numeri erano completamente inventati. Il marchio ha ricevuto una sanzione per l'utilizzo di tali statistiche fuorvianti. Hanno anche dovuto modificare la dichiarazione e rimuovere i numeri falsi.
Come evitare e identificare l'uso improprio delle statistiche
Le statistiche hanno il potenziale per essere estremamente utili. Ma le statistiche fuorvianti possono anche confondere e ingannare le persone. Le statistiche danno autorità a un'affermazione e convincono le persone a fidarsi di un certo argomento.
Statistiche solide e veritiere aiutano a dare alle persone un'idea e le aiutano a prendere decisioni. Ma le statistiche fuorvianti sono pericolose . Invece di aiutare le persone a evitare trappole e buche, conducono le persone proprio nelle situazioni che volevano evitare.
Ma è possibile identificare statistiche e dati fuorvianti. Quando ti imbatti in una statistica, fermati e poni le seguenti domande:
- Da dove provengono questi dati?
- La fonte è controllata? O è un esperimento a campione?
- Quali altri fattori potrebbero giocare in questo risultato?
- L'informazione sta cercando di informarmi o mi sta indirizzando verso una conclusione predeterminata?
Sia che tu stia raccogliendo dati o che tu stia visualizzando i risultati della ricerca di altri, assicurati che i dati siano accurati. In questo modo non aumenterai la diffusione di statistiche fuorvianti .
Se ti è piaciuto leggere questo articolo sulle statistiche fuorvianti, dovresti leggere anche questi:
- La visualizzazione interattiva dei dati più impressionante che troverai online
- I migliori strumenti di visualizzazione dei dati di WordPress che puoi trovare
- I migliori strumenti e piattaforme di visualizzazione dei dati per te