المحتوى
في الإحصائيات ، يتم استخدام التوزيع الجاوسي أو العادي لوصف الأنظمة المعقدة بعدة عوامل. كما هو موضح في كتاب تاريخ الإحصاء لستيفن ستيجلر ، ابتكر إبراهيم دي موفري التوزيع الذي يحمل اسم كارل فريدريك غاوس. تكمن مساهمة غاوس في تطبيقه للتوزيع على نهج المربعات الصغرى لتقليل الخطأ في تركيب البيانات بخط أفضل ملاءمة. جعله بذلك أهم توزيع خطأ في الإحصائيات.
التحفيز
ما هو توزيع عينة من البيانات؟ ماذا لو كنت لا تعرف التوزيع الأساسي للبيانات؟ هل هناك أي طريقة لاختبار الفرضيات حول البيانات دون معرفة التوزيع الأساسي؟ بفضل نظرية الحد المركزي ، الجواب هو نعم.
بيان النظرية
ينص على أن متوسط عينة من مجتمع غير منتهي طبيعي تقريبًا ، أو غاوسي ، مع نفس متوسط عدد السكان الأصلي ، وتباين يساوي الفرق السكاني مقسومًا على حجم العينة. يتحسن التقريب حيث يصبح حجم العينة كبيرًا.
أحيانًا ما يتم إساءة بيان العبارة التقريبية كخلاصة حول التقارب في التوزيع الطبيعي. نظرًا لتغير التوزيع العادي التقريبي مع زيادة حجم العينة ، فإن مثل هذا البيان مضلل.
تم تطوير النظرية بواسطة بيير سيمون لابلاس.
لماذا في كل مكان
توزيعات طبيعية موجودة في كل مكان. السبب يأتي من نظرية الحد المركزي. في كثير من الأحيان ، عندما يتم قياس قيمة ، يكون هذا هو تأثير مجموع العديد من المتغيرات المستقلة. لذلك ، فإن القيمة التي يتم قياسها بحد ذاتها لها جودة عينة متوسطة. على سبيل المثال ، قد يكون لتوزيع أداء الرياضيين شكل الجرس ، نتيجة للاختلافات في النظام الغذائي والتدريب وعلم الوراثة والتدريب وعلم النفس. حتى مرتفعات الرجال لها توزيع طبيعي ، كونها دالة للعديد من العوامل البيولوجية.
غاوس كوبولاس
ما يسمى بـ "وظيفة copula" مع توزيع غوسي كان في الأخبار في عام 2009 بسبب استخدامه في تقييم مخاطر الاستثمار في السندات المضمونة. كان لسوء استخدام الوظيفة دور فعال في الأزمة المالية في الفترة 2008-2009. على الرغم من وجود العديد من أسباب الأزمة ، إلا أنه من غير المحتمل أن يكون قد تم استخدام توزيعات غاوسي بعد فوات الأوان. إن الوظيفة ذات الذيل السميك قد أعطت احتمالًا أكبر للأحداث السلبية.
استنتاج
يمكن إثبات نظرية الحد المركزي في العديد من الأسطر من خلال تحليل وظيفة توليد اللحظات (mgf) لـ (متوسط العينة - متوسط عدد السكان) /؟ (التباين السكاني / حجم العينة) كدالة لـ mgf من السكان الأساسي. يتم تقديم جزء التقريب من النظرية من خلال توسيع نطاق التركيز الأساسي للمجموعات السكانية كسلسلة طاقة ، ثم إظهار معظم المصطلحات غير ذات أهمية لأن حجم العينة يصبح كبيرًا.
يمكن إثبات ذلك في عدد أقل من الأسطر باستخدام امتداد تايلور على المعادلة المميزة لنفس الوظيفة وجعل حجم العينة كبيرًا.
الراحة الحاسوبية
بعض النماذج الإحصائية تفترض أن الأخطاء غوسية. يتيح ذلك توزيعات وظائف المتغيرات الطبيعية ، مثل توزيع chi-square و F ، ليتم استخدامها في اختبار الفرضيات. على وجه التحديد ، في اختبار F ، تتألف إحصاء F من نسبة توزيعات خي مربع ، والتي هي نفسها وظائف لمعلمة التباين الطبيعي. تؤدي نسبة الاثنين إلى إلغاء التباين ، مما يتيح اختبار الفرضيات دون معرفة الفروق بغض النظر عن طبيعتها وثباتها.