المحتوى
عندما يقوم العلماء أو الاقتصاديون أو الإحصائيون بتنبؤات تستند إلى النظرية ثم يقومون بجمع بيانات حقيقية ، فإنهم يحتاجون إلى طريقة لقياس التباين بين القيم المتوقعة والقيم المقاسة. عادةً ما يعتمدون على خطأ مربع التربيع (MSE) ، وهو مجموع أشكال نقاط البيانات الفردية المربعة ومقسمة على عدد نقاط البيانات ناقص 2. عند عرض البيانات على الرسم البياني ، يمكنك تحديد MSE بواسطة جمع الاختلافات في نقاط بيانات المحور العمودي. على الرسم البياني س ص ، ستكون هذه القيم ص.
لماذا مربع الاختلافات؟
ضرب الاختلاف بين القيم المتوقعة والمتوقعة له تأثيران مرغوبان. الأول هو التأكد من أن جميع القيم إيجابية. إذا كانت قيمة واحدة أو أكثر سلبية ، فقد يكون مجموع كل القيم صغيرًا بشكل غير واقعي وتمثيلًا ضعيفًا للتغير الفعلي بين القيم المتوقعة والقيم الملاحظة. الميزة الثانية للتربيع هي إعطاء وزن أكبر للاختلافات الكبيرة ، مما يضمن أن القيمة الكبيرة لـ MSE تعني اختلافات كبيرة في البيانات.
عينة حساب خوارزمية الأسهم
لنفترض أن لديك خوارزمية تتوقع أسعار سهم معين على أساس يومي. يوم الاثنين ، يتوقع أن يكون سعر السهم 5.50 دولار ، ويوم الثلاثاء 6.00 دولار ، الأربعاء 6.00 دولار ، الخميس 7.50 دولار ويوم الجمعة 8.00 دولار. بالنظر إلى يوم الاثنين باعتباره اليوم الأول ، لديك مجموعة من نقاط البيانات التي تظهر على النحو التالي: (1 ، 5.50) ، (2 ، 6.00) ، (3 ، 6.00) ، (4 ، 7.50) و (5 ، 8.00). الأسعار الفعلية هي كما يلي: الاثنين 4.75 دولار (1 ، 4.75) ؛ الثلاثاء 5.35 دولار (2 ، 5.35) ؛ الأربعاء 6.25 دولار (3 ، 6.25) ؛ الخميس 7.25 دولار (4 ، 7.25) ؛ ويوم الجمعة: 8.50 دولار (5 ، 8.50).
الاختلافات بين القيم y لهذه النقاط هي 0.75 و 0.65 و -25.25 و 0.25 و -0.50 على التوالي ، حيث تشير العلامة السلبية إلى قيمة متوقعة أصغر من القيمة الملاحظة. لحساب MSE ، تقوم أولاً بوضع مربع لكل قيمة تنوع ، مما يلغي علامات الطرح وينتج عن 0.5625 و 0.4225 و 0.0625 و 0.0625 و 0.25. جمع هذه القيم يعطي 1.36 وتقسيم على عدد القياسات ناقص 2 ، وهو 3 ، يعطي MSE ، الذي اتضح أنه 0.45.
MSE و RMSE
تشير القيم الأصغر الخاصة بـ MSE إلى اتفاق أوثق بين النتائج المتوقعة والنتائج الملحوظة ، بينما تشير MSE 0.0 إلى اتفاق تام. من المهم أن نتذكر ، مع ذلك ، أن قيم الاختلاف مربعة. عندما يكون قياس الخطأ مطلوبًا في نفس وحدات نقاط البيانات ، يأخذ الإحصائيون الخطأ التربيعي لمتوسط الجذر (RMSE). يحصلون على هذا عن طريق أخذ الجذر التربيعي للخطأ مربع المتوسط. على سبيل المثال أعلاه ، سيكون RSME 0.671 أو حوالي 67 سنتًا.