المحتوى
تتطلب الأنشطة التجارية والحكومية والأكاديمية دائمًا جمع وتحليل البيانات. إحدى الطرق لتمثيل البيانات العددية هي الرسوم البيانية والرسوم البيانية والرسوم البيانية. تسمح تقنيات التصور هذه للناس باكتساب رؤية أفضل للمشاكل واستنباط الحلول. الثغرات والتكتلات والقيم المتطرفة هي خصائص مجموعات البيانات التي تؤثر على التحليل الرياضي وتكون مرئية بسهولة على التمثيلات المرئية.
ثقوب في البيانات
تشير الثغرات إلى المناطق المفقودة في مجموعة البيانات. على سبيل المثال ، إذا قامت تجربة علمية بجمع بيانات درجة الحرارة في حدود 50 درجة فهرنهايت إلى 100 درجة فهرنهايت ، ولكن لا شيء بين 70 و 80 درجة ، فإن ذلك سيمثل فجوة في مجموعة البيانات. سيكون لمؤامرة سطر من مجموعة البيانات هذه علامات "س" لدرجات الحرارة بين 50 و 70 ومرة أخرى بين 80 و 100 ، ولكن لن يكون هناك شيء بين 70 و 80. يمكن للباحثين أن يحفروا أعمق ويستكشفوا لماذا لا تظهر نقاط بيانات معينة في عينة تم جمعها.
مجموعات معزولة
الكتل هي مجموعات معزولة من نقاط البيانات. تعد المخططات الخطية ، والتي تعد إحدى الطرق لتمثيل مجموعات البيانات ، خطوطًا بها علامات "x" موضوعة فوق أرقام محددة لتصور تواتر حدوثها في مجموعة البيانات. يتم عرض كتلة كمجموعة من هذه العلامات "س" في فاصل صغير أو مجموعة بيانات فرعية. على سبيل المثال ، إذا كانت علامات الامتحان لفئة مكونة من 10 طلاب هي 74 و 75 و 80 و 72 و 74 و 75 و 76 و 86 و 88 و 73 ، فستكون علامات "x" في مؤامرة الخط هي 72 إلى 76 درجة فاصل. هذا سيمثل كتلة البيانات. لاحظ أن عدد مرات تكرار 74 و 75 هو رقمان ، ولكن بالنسبة إلى جميع الدرجات الأخرى ، فهي واحدة.
في النهايات
القيم المتطرفة هي قيم متطرفة - نقاط بيانات تقع خارج القيم الأخرى بشكل كبير في مجموعة بيانات. يجب أن يكون الحد الخارجي أقل بكثير من أو أكبر من غالبية الأرقام في مجموعة بيانات. يعتمد تعريف "المدقع" على الظروف وتوافق المحللين المشاركين في البحث. قد تكون القيم المتطرفة نقاط بيانات سيئة ، تُعرف أيضًا بالضوضاء ، أو قد تحتوي على معلومات قيمة حول الظاهرة التي يتم التحقيق فيها ومنهجية جمع البيانات نفسها. على سبيل المثال ، إذا كانت درجات الفصل الدراسي تقع في الغالب في نطاق من 70 إلى 80 ، ولكن يوجد عدد قليل من النقاط في الخمسينيات المنخفضة ، فقد يمثل ذلك درجات غير عادية.
ضع كل شيء معا
يمكن أن تؤثر الثغرات والقيم المتطرفة والمجموعات في مجموعات البيانات على نتائج التحليل الرياضي. قد تمثل الثغرات والمجموعات أخطاء في منهجية جمع البيانات. على سبيل المثال ، إذا قام استطلاع عبر الهاتف باستطلاع رموز أكواد معينة فقط ، مثل مجمعات الإسكان منخفضة الدخل أو المناطق السكنية الراقية في الضواحي ، وليس قطاعًا عريضًا من السكان ، فمن المحتمل وجود ثغرات ومجموعات في البيانات . يمكن أن يشوه القيم المتطرفة القيمة المتوسطة أو المتوسطة لمجموعة البيانات. على سبيل المثال ، القيمة المتوسطة أو المتوسطة لمجموعة البيانات التي تتكون من أربعة أرقام - 50 و 55 و 65 و 90 - هي 65. ولكن بدون العدد 90 الباقي ، يكون الوسط حوالي 57.