يمكن أن تكون الإحصائيات المضللة خطيرة (بعض الأمثلة)

نشرت: 2022-12-06

يعتمد الناس على الإحصائيات للحصول على معلومات مهمة. في عالم الأعمال ، يمكن أن تكون الإحصائيات مفيدة لتتبع الاتجاهات وتعظيم الإنتاجية. لكن في بعض الأحيان يمكن تقديم الإحصائيات بطريقة مضللة . على سبيل المثال ، في عام 2007 ، تلقت هيئة معايير الإعلان (ADA) في المملكة المتحدة شكوى بخصوص إعلان لشركة Colgate.

يشتهر الإعلان بأن 80٪ من أطباء الأسنان يوصون باستخدام معجون أسنان كولجيت. جادلت الشكوى التي تلقتها ADA بأن هذا يعد انتهاكًا لقواعد الإعلان في المملكة المتحدة. بعد النظر في الأمر ، اكتشفت ADA أن الإعلان يستخدم إحصائيات مضللة.

صحيح أن العديد من أطباء الأسنان يوصون باستخدام معجون أسنان كولجيت. لكن لم يستشهد جميعهم بكولجيت باعتبارها التوصية الأولى. أوصى معظم أطباء الأسنان بأنواع أخرى من معجون الأسنان أيضًا ، وعادة ما ظهر كولجيت في وقت ما في وقت لاحق.

هذا مجرد مثال واحد على كيفية استخدام الإحصائيات المضللة. يصادف الناس أمثلة إحصائية مضللة في العديد من مجالات الحياة المختلفة. يمكنك أن تجد أمثلة في الأخبار والإعلانات والسياسة وحتى في العلوم.

سيساعدك هذا المنشور على تعلم التعرف على الإحصائيات المضللة والبيانات المضللة الأخرى . وسوف يناقش كيف تضلل هذه البيانات الناس. سوف تتعلم أيضًا متى وكيف تستخدم البيانات عند اتخاذ القرارات الحاسمة.

ما المقصود بالإحصائيات المضللة؟

الإحصاء هو نتيجة جمع البيانات الرقمية وتحليلها بعناية ثم تفسيرها . من المفيد بشكل خاص الحصول على إحصائيات إذا كنت تتعامل مع كمية كبيرة من البيانات ، ولكن أي شيء يمكن قياسه يمكن أن يصبح إحصائيًا. غالبًا ما تكشف الإحصائيات الكثير عن العالم وطريقة عمله.

ومع ذلك ، عندما يتم إساءة استخدام هذه المعلومات ، حتى عن طريق الصدفة ، فإنها تصبح إحصائية مضللة. تعطي الإحصاءات المضللة للأشخاص معلومات خاطئة تخدعهم بدلاً من إبلاغهم .

عندما يأخذ الناس الإحصاء من سياقه ، فإنه يفقد قيمته ويمكن أن يتسبب في استخلاص الناس لاستنتاجات غير صحيحة. يصف مصطلح "إحصائيات مضللة" أي طريقة إحصائية تمثل البيانات بشكل غير صحيح. سواء كان ذلك عن قصد أم لا ، فإنه لا يزال يعتبر إحصاءات مضللة.

عند جمع البيانات للإحصاء ، هناك ثلاث نقاط أساسية يجب وضعها في الاعتبار. يمكن أن تحدث مشكلة في تحليل البيانات أثناء أي من هذه النقاط.

  • التجميع: أثناء جمع البيانات
  • المعالجة: عند تحليل البيانات وانعكاساتها
  • العرض التقديمي: عند مشاركة نتائجك مع الآخرين

حجم عينة صغير

تعد استطلاعات حجم العينة أحد الأمثلة على إنشاء إحصائيات مضللة. غالبًا ما تؤدي الاستطلاعات أو الدراسات التي أجريت على عينة من الجمهور إلى نتائج مضللة للغاية بحيث لا يمكن استخدامها.

للتوضيح ، يسأل استطلاع للرأي 20 شخصًا بنعم أو لا. 19 من الأشخاص أجابوا بنعم على الاستطلاع. لذا تظهر النتائج أن 95٪ من الناس سيردون بنعم على هذا السؤال. لكن هذا ليس مسحًا جيدًا لأن المعلومات محدودة.

هذه الإحصائية ليس لها قيمة حقيقية. الآن إذا سألت 1000 شخص نفس السؤال وقال 950 شخصًا نعم ، فهذه إحصائية أكثر موثوقية لإظهار أن 95٪ من الأشخاص سيجيبون بنعم.

لإجراء دراسة موثوقة لحجم العينة ، عليك التفكير في ثلاثة أشياء:

  • واحد : ما نوع السؤال الذي تطرحه؟
  • ثانيًا : ما أهمية الإحصاء الذي تحاول إيجاده؟
  • وثالثًا : ما الأسلوب الإحصائي الذي ستستخدمه؟

للحصول على نتائج موثوقة ، يجب أن يشمل أي تحليل كمي لحجم العينة 200 شخص على الأقل.

أسئلة محملة

من المهم البحث عن البيانات من مصدر محايد . خلاف ذلك ، فإن المعلومات مائلة. تستخدم الأسئلة المحملة افتراضًا مثيرًا للجدل أو غير مبرر للتلاعب في الإجابة. أحد الأمثلة على ذلك هو طرح سؤال يبدأ ، "ما الذي تحب بشأنه". يقوم هذا السؤال بعمل رائع في جمع التعليقات الإيجابية ولكنه يفشل في تعليمك أي شيء مفيد. لا يوفر أي فرصة للشخص لإبداء أفكاره وآرائه الصادقة.

ضع في اعتبارك الاختلاف في السؤالين التاليين:

  • هل تؤيد إصلاح ضريبي من شأنه أن يعني ضرائب أعلى؟
  • هل تؤيد الإصلاح الضريبي الذي قد يكون مفيدا لإعادة التوزيع الاجتماعي؟

يتعلق السؤال بشكل أساسي بالموضوع نفسه ، لكن نتائج كل سؤال من هذه الأسئلة ستكون مختلفة تمامًا. يجب إجراء الاستطلاعات بطريقة محايدة وغير منحازة. أنت تريد الحصول على آراء الناس الصادقة والصورة الكاملة لما يعتقده الناس. لتحقيق ذلك ، يجب ألا تتضمن أسئلتك إجابة أو إثارة استجابة عاطفية .

الاستشهاد بـ "المتوسطات" المضللة

يستخدم بعض الناس مصطلح "متوسط" لإخفاء الحقيقة أو الكذب لجعل المعلومات تبدو أفضل.

هذه التقنية مفيدة بشكل خاص إذا أراد شخص ما جعل الرقم يبدو أكبر أو أفضل مما هو عليه. على سبيل المثال ، قد تقدم الجامعة التي ترغب في جذب طلاب جدد راتبًا سنويًا "متوسطًا" لخريجي مدارسهم. ولكن قد لا يكون هناك سوى عدد قليل من الطلاب الذين يتقاضون رواتب عالية بالفعل. لكن رواتبهم تجعل متوسط ​​الدخل لجميع الطلاب أعلى. هذا يبدو أفضل بالنسبة للمتوسط ​​كله.

المتوسطات مفيدة أيضًا لإخفاء عدم المساواة. كمثال آخر ، افترض أن إحدى الشركات تدفع 20 ألف دولار سنويًا لموظفيها البالغ عددهم 90 موظفًا. لكن رئيسهم يتقاضى 200 ألف دولار في السنة. إذا جمعت بين أجر الرئيس وأجور الموظفين ، فإن متوسط ​​الدخل لكل عضو في الشركة هو 21978 دولارًا.

على الورق ، هذا يبدو رائعًا. لكن هذا الرقم يفشل في سرد ​​القصة بأكملها لأن أحد الموظفين (الرئيس) يكسب أكثر بكثير من العمال الآخرين. لذلك تعتبر هذه الأنواع من النتائج إحصائيات مضللة.

البيانات التراكمية في مقابل البيانات السنوية

البيانات التراكمية تتعقب المعلومات على الرسم البياني بمرور الوقت. في كل مرة تقوم فيها بإدخال البيانات في المخططات ، يرتفع الرسم البياني.

تعرض البيانات السنوية جميع البيانات لسنة محددة.

توفر معلومات التتبع لكل عام صورة حقيقية للاتجاهات العامة.

أحد الأمثلة على الرسم البياني التراكمي هو الرسم البياني Worldometer COVID-19. خلال جائحة COVID-19 ، ظهرت العديد من الأمثلة على الرسوم البيانية التراكمية. غالبًا ما تعكس العدد التراكمي لحالات COVID في منطقة معينة.

تستخدم بعض الشركات رسومًا بيانية كهذه لجعل المبيعات تبدو أكبر مما هي عليه. في عام 2013 ، تلقى الرئيس التنفيذي لشركة Apple ، Tim Cook ، انتقادات لاستخدامه عرضًا تقديميًا يظهر فقط العدد التراكمي لمبيعات iPhone. شعر الكثيرون في ذلك الوقت أنه فعل ذلك عن عمد لإخفاء حقيقة أن مبيعات iPhone كانت تتضاءل.

هذا لا يعني أن جميع البيانات التراكمية سيئة أو خاطئة. في الواقع ، يمكن أن يكون مفيدًا لتتبع التغييرات أو النمو والإجماليات المختلفة. لكن الشيء المهم هو الانتباه إلى التغييرات في البيانات. ثم انظر بعمق في سبب حدوثها بدلاً من الاعتماد على الرسم البياني لإخبارك بكل شيء.

التعميم المفرط والعينات المتحيزة

يحدث التعميم المفرط عندما يفترض شخص ما أن ما هو صحيح لشخص ما يجب أن يكون صحيحًا بالنسبة للآخرين. عادة ، تحدث هذه المغالطة عندما يجري شخص ما دراسة مع مجموعة معينة من الناس. ثم يفترضون أن النتائج ستكون صحيحة لمجموعة أخرى غير ذات صلة من الناس.

العينات غير التمثيلية ، أو العينات المتحيزة ، هي استطلاعات لا تمثل السكان بشكل دقيق.

حدث أحد الأمثلة على العينات المتحيزة خلال الانتخابات الرئاسية لعام 1936 في الولايات المتحدة الأمريكية.

وأجرت مجلة The Literary Digest ، وهي مجلة شهيرة في ذلك الوقت ، دراسة استقصائية للتنبؤ بمن سيفوز في الانتخابات. توقعت النتائج فوز ألفريد لاندون بانهيار أرضي.

اشتهرت هذه المجلة بالتنبؤ الدقيق بنتائج الانتخابات. لكنهم كانوا مخطئين تمامًا هذا العام. فاز فرانكلين روزفلت بما يقرب من ضعف أصوات خصمه.

كشفت بعض الأبحاث الإضافية أن هناك متغيرين قد أدَّيا إلى تحريف النتائج.

أولاً ، كان معظم المشاركين في الاستطلاع من الأشخاص الموجودين في دليل الهاتف وفي قوائم التسجيل التلقائي. لذلك تم إجراء المسح فقط مع أولئك الذين ينتمون إلى وضع اجتماعي واقتصادي معين.

العامل الثاني هو أن أولئك الذين صوتوا لصالح لاندون كانوا أكثر استعدادًا للرد على الاستطلاع من أولئك الذين اختاروا التصويت لصالح روزفلت. لذا عكست النتائج هذا التحيز.

اقتطاع محور

يعد اقتطاع المحور في الرسم البياني مثالًا آخر على الإحصائيات المضللة. في معظم الرسوم البيانية الإحصائية ، من المفترض أن يبدأ كل من المحور السيني والصادي من الصفر. لكن اقتطاع المحور يعني أن الرسم البياني يبدأ فعليًا بالمحاور عند قيمة أخرى. يؤثر هذا على الطريقة التي سيبدو بها الرسم البياني ، ويؤثر على الاستنتاجات التي سيستخلصها الشخص.

إليك مثال يوضح هذا:

مصدر الصورة

حدث مثال آخر على ذلك مؤخرًا في سبتمبر 2021. في إحدى محطات قناة فوكس نيوز ، استخدم المذيع مخططًا يوضح عدد الأمريكيين الذين ادعوا أنهم مسيحيون. أظهر الرسم البياني أن عدد الأمريكيين الذين تم تحديدهم كمسيحيين قد انخفض بشكل كبير خلال السنوات العشر الماضية.

في الرسم البياني التالي ، نرى أنه في عام 2009 ، تم تحديد 77٪ من الأمريكيين على أنهم مسيحيون.

مصدر الصورة

بحلول عام 2019 ، انخفض العدد إلى 65٪. في الواقع ، هذا ليس انخفاضًا كبيرًا. لكن المحور على هذا المخطط يبدأ عند 58٪ ويتوقف عند 78٪. لذا فإن الانخفاض بنسبة 12٪ من عام 2009 إلى عام 2019 يبدو أكثر حدة بكثير مما هو عليه في الواقع.

السببية والارتباط

قد يكون من السهل افتراض وجود اتصال بين نقطتي بيانات يبدو أنهما متصلتان. ومع ذلك ، يقال إن الارتباط لا يعني السببية . لماذا هذا؟

يوضح هذا الرسم البياني سبب اختلاف الارتباط عن السببية.

مصدر الصورة

غالبًا ما يتعرض الباحثون لضغوط كبيرة لاكتشاف بيانات جديدة ومفيدة. لذا فإن إغراء القفز على البندقية واستخلاص النتائج قبل الأوان موجود دائمًا. لهذا السبب من المهم في كل موقف البحث عن السبب الحقيقي والنتيجة .

استخدام النسب لإخفاء الأرقام والحسابات

يمكن أن تخفي النسبة المئوية الأرقام الدقيقة وتجعل النتائج تبدو أكثر شهرة وموثوقية مما هي عليه.

على سبيل المثال ، إذا كان اثنان من كل ثلاثة أشخاص يفضلون منتجًا معينًا للتنظيف ، فيمكنك القول إن 66.667٪ من الأشخاص يفضلون هذا المنتج. هذا يجعل الرقم يبدو أكثر رسمية ، خاصة مع تضمين الأرقام بعد الفاصلة العشرية.

فيما يلي بعض الطرق الأخرى التي يمكن أن تحجب فيها الكسور العشرية والنسب الحقيقة:

  • إخفاء الأعداد الأولية وأحجام العينات الصغيرة . النسب المئوية تحجب القيمة المطلقة للأرقام الأولية. وهذا يجعلها مفيدة للأشخاص الذين يرغبون في إخفاء الأرقام غير المبهجة أو نتائج حجم العينة الصغيرة.
  • باستخدام قواعد مختلفة. نظرًا لأن النسب المئوية لا توفر الأرقام الأصلية التي تستند إليها ، فقد يكون من السهل تشويه النتائج. إذا أراد شخص ما جعل رقم واحد يبدو أفضل ، فيمكنه حساب هذا الرقم من قاعدة مختلفة.

حدث هذا مرة واحدة في تقرير نشرته صحيفة نيويورك تايمز عن العمال النقابيين. حصل العمال على تخفيض في رواتبهم بنسبة 20٪ في سنة واحدة ، وفي العام التالي ذكرت الصحيفة أن العمال النقابيين حصلوا على زيادة بنسبة 5٪. لذلك كان الادعاء أنهم حصلوا على ربع رواتبهم التي أعيدت إليهم.

ومع ذلك ، حصل العمال على زيادة بنسبة 5٪ على أساس أجرهم الحالي ، وليس على أساس أجرهم قبل خفض الأجور. لذلك على الرغم من أنها تبدو جيدة على الورق ، تم حساب تخفيض الأجور بنسبة 20٪ وزيادة بنسبة 5٪ من أرقام أساسية مختلفة. لم يقارن الرقمان على الإطلاق.

قطف الكرز / تجاهل البيانات غير المواتية

يعتمد مصطلح "قطف الكرز" على فكرة قطف أفضل ثمار من الشجرة. أي شخص يرى تلك الفاكهة لا بد أن يعتقد أن كل الفاكهة على الشجرة صحية بشكل متساوٍ. من الواضح أن هذا ليس هو الحال بالضرورة.

هذا المبدأ نفسه يلعب دوره في حالة تغير المناخ. تقصر العديد من الرسوم البيانية إطار بياناتها لتظهر فقط التغيرات المناخية من 2000 إلى 2013.

نتيجة لذلك ، يبدو أن التغيرات في درجات الحرارة والشذوذ متسقة ولا تتغير كثيرًا. عندما تأخذ خطوة إلى الوراء وتنظر إلى الصورة الكبيرة ، يصبح من الواضح أين التغييرات والشذوذ.

يحدث هذا أيضًا في مجال الطب البيطري. عندما يُطلب من الأطباء البيطريين تقديم النتائج من دواء تجريبي جديد ، فإنهم يميلون إلى تقديم أفضل النتائج. خاصة إذا كانت إحدى شركات الأدوية تدعم التجربة ، فهم يريدون رؤية أفضل النتائج فقط.

تستحق بياناتك الجميلة أن تكون على الإنترنت

يمكن لـ wpDataTables جعلها على هذا النحو. هناك سبب وجيه لكونه المكون الإضافي الأول في WordPress لإنشاء جداول ومخططات سريعة الاستجابة.

مثال حقيقي على wpDataTables في البرية

ومن السهل فعل شيء مثل هذا:

  1. تقوم بتوفير بيانات الجدول
  2. تكوينه وتخصيصه
  3. انشرها في منشور أو صفحة

وهي ليست جميلة فحسب ، ولكنها عملية أيضًا. يمكنك إنشاء جداول كبيرة تصل إلى ملايين الصفوف ، أو يمكنك استخدام عوامل التصفية والبحث المتقدمين ، أو يمكنك جعلها قابلة للتحرير.

"نعم ، لكني أحب Excel كثيرًا ولا يوجد شيء مثل ذلك على مواقع الويب". نعم ، هناك. يمكنك استخدام التنسيق الشرطي كما هو الحال في Excel أو Google Sheets.

هل أخبرتك أنه يمكنك إنشاء مخططات باستخدام بياناتك أيضًا؟ وهذا جزء صغير فقط. هناك الكثير من الميزات الأخرى لك.

صيد البيانات

صيد البيانات ، المعروف أيضًا باسم تجريف البيانات ، هو تحليل كميات كبيرة من البيانات بهدف إيجاد ارتباط. ومع ذلك ، كما نوقش سابقًا في هذا المنشور ، فإن الارتباط لا يعني السببية. الإصرار على أنه لا يؤدي إلا إلى إحصائيات مضللة.

يمكنك أن ترى أمثلة على صيد البيانات في مجالات الصناعة كل يوم. أسبوع واحد تم الكشف عن فضيحة حول التنقيب في البيانات ، وبعد أسبوع تم دحضها من خلال تقرير أكثر شناعة.

هناك مشكلة أخرى في هذا النوع من تحليل البيانات وهي أن الأشخاص يختارون فقط البيانات التي تدعم وجهة نظرهم ويتجاهلون الباقي. من خلال حذف المعلومات المتناقضة ، فإنهم يجعلون النتائج تبدو أكثر إقناعًا .

مربكة تسميات الرسم البياني والمخطط

عندما بدأ جائحة COVID-19 ، تحول عدد أكبر من أي وقت مضى إلى تصورات البيانات الخاصة بانتشار الفيروس. الأشخاص الذين لم يضطروا أبدًا إلى العمل مع التمثيل المرئي للإحصاءات تم التخلص منهم فجأة من النهاية العميقة للبيانات الإحصائية.

إلى جانب ذلك ، كانت المنظمات في كثير من الأحيان تحاول الحصول على معلومات الناس بسرعة. في بعض الأحيان كان هذا يعني التضحية بإحصائيات دقيقة. تسبب هذا في ارتفاع كبير في الإحصائيات المضللة وسوء تفسير البيانات.

بعد حوالي خمسة أشهر من بدء انتشار COVID-19 ، أصدرت وزارة الصحة العامة الأمريكية في جورجيا هذا الرسم البياني:

كان الغرض من الرسم البياني هو إظهار الدول الخمس التي سجلت أعلى حالات COVID على مدار الخمسة عشر يومًا الماضية ، وعدد الحالات على مدار فترة زمنية.

يحتوي هذا المخطط على بعض الأخطاء التي تجعل من السهل إساءة فهمه. لا يحتوي المحور x ، على سبيل المثال ، على تسمية توضح أنه يمثل تطور الحالات بمرور الوقت.

والأسوأ من ذلك ، أن التواريخ على الرسم البياني ليست منظمة ترتيبًا زمنيًا. التواريخ لشهري أبريل ومايو مبعثرة في جميع أنحاء الرسم البياني لتوضيح أن عدد الحالات كان يتناقص باطراد. يتم أيضًا إدراج كل دولة بطريقة تجعلها تبدو أن الحالات كانت في انخفاض.

في وقت لاحق ، أعادوا نشر المخطط بتواريخ ومقاطعات أفضل تنظيماً:

أرقام غير دقيقة

مثال آخر على الإحصائيات المضللة يأتي في شكل أرقام غير دقيقة. لاحظ هذا البيان من حملة ريبوك القديمة.

يزعم الإعلان أن الحذاء يعمل على أوتار الركبة وعجول الشخص بقوة أكبر بنسبة 11٪ ويمكنه أن يعمل على شد مؤخرة الشخص بنسبة تصل إلى 28٪ أكثر من الأحذية الرياضية الأخرى . كل ما على الشخص فعله هو المشي في الحذاء الرياضي.

هذه الأرقام تجعل من الواضح أن ريبوك قد أجرت بحثًا مكثفًا حول فوائد الحذاء.

في الواقع ، تم اختلاق هذه الأرقام بالكامل. تلقت العلامة التجارية عقوبة لاستخدام مثل هذه الإحصاءات المضللة. كان عليهم أيضًا تغيير البيان وإزالة الأرقام المزيفة.

كيفية تجنب وتحديد إساءة استخدام الإحصائيات

يمكن أن تكون الإحصائيات مفيدة للغاية. لكن الإحصاءات المضللة لها أيضًا القدرة على إرباك الناس وخداعهم. تمنح الإحصائيات السلطة لبيان ما وتقنع الناس بالثقة في حجة معينة.

تساعد الإحصاءات المتينة والصحيحة في منح الأشخاص نظرة ثاقبة ومساعدتهم على اتخاذ القرارات. لكن الإحصائيات المضللة خطيرة . بدلاً من مساعدة الناس على تجنب المزالق والحفر ، فإنهم يقودون الناس إلى المواقف التي يريدون تجنبها.

لكن من الممكن تحديد الإحصاءات والبيانات المضللة. عندما تصادف إحصائية ، توقف واسأل الأسئلة التالية:

  • من أين تأتي هذه البيانات؟
  • هل المصدر مسيطر عليه؟ أم أنها تجربة بحجم عينة؟
  • ما هي العوامل الأخرى التي يمكن أن تلعب في هذه النتيجة؟
  • هل تحاول المعلومات إخباري ، أم أنها توجهني إلى نتيجة محددة مسبقًا؟

سواء كنت تجمع البيانات أو كنت تشاهد نتائج أبحاث الآخرين ، تأكد من دقة البيانات. بهذه الطريقة أنت لا تضيف إلى انتشار الإحصائيات المضللة .

إذا كنت قد استمتعت بقراءة هذا المقال حول الإحصائيات المضللة ، فيجب عليك قراءة هذه أيضًا:

  • أكثر التصور التفاعلي للبيانات إثارة للإعجاب الذي ستجده على الإنترنت
  • أفضل أدوات تصور بيانات WordPress التي يمكنك العثور عليها
  • أفضل أدوات ومنصات تصور البيانات لك