مقاييس التشتت أو التباين
من MM*Stat Arabisch
المحتويات ,لتمثيل البياني للتوزيع أحادي البعد ,عناصر المقياس ,عناصر المقياس 1
عادة لا تكون مقاييس النزعة المركزية المتنوعة في الأقسام السابقة كافية للتمثيل الجيد للبيانات الأحادية البعد.
نوضح كالتالي :
الانفاق الشهري لوقت الفراغ والعطل (بالمارك الألماني):
تعرض البيانات لعشر عائلات من شخصين : 210,250,340,360,400,430,440,450,530,630 على المحور:
تعرض البيانات للعائلات العشر من أربع أشخاص :340,350,360,380,390,410,420,440,460,490 على المحور :
الوسط الحسابي في كلا الحالتين مساوي الى 404 مارك ألماني , لكن الشكلين البيانيين يظهران اختلافات مرئية ما بين التوزيعين .
للعائلات من أربع أشخاص تكون القيم متمركزة أكثر حول المركز (في هذه الحالة الوسط) من العائلات لشخصين , بمعنى الانتشار أو التباين يكون صغير .
تنظم مقاييس التشتت تغير البيانات . بالاضافة الى مقاييس النزعة المركزية (كالوسط , الوسيط والمنوال).
تزود الوصف المقبول للبيانات الأحادية البعد, بشكل بديهي ,نريد قياسات التشتت التي لها نفس الخاصة اذا نفس الثابت يضاف لكل من نقاط البيانات,
سيكون القياس غير متأثر. الخاصة الثانية اذا البيانات تنتشر بعيدة بشكل مفرد , كمثال عبر الضرب بواسطة ثابت أكبر من 1 , سيزداد القياس.
المدى هو المقياس الأبسط للتشتت :
(1) للبيانات غير المبوبة : يعرف المدى (R) بالفرق مابين القيمة المشاهدة العليا و الصغرى
حيث القيم المرتبة , بمعنى الاحصاءات المرتبة.
(2)البيانات المبوبة : للبيانات المبوبة , يعرف المدى (R) بالفرق مابين الحد الأعلى للفئة الأخيرة (الأعلى) والحد الأدنى للفئة الأولى (الأصغر) :
الخواص :
نلاحظ بأن اضافة الثابت لا تغير البيانات ولا تؤثر على مقاييس التشتت.
المدى الربيعي هو الفرق مابين الربيع الثالث والربيع الأول :
المدى الربيعي : هو عرض المنطقة المركزية التي تستحوذ على 50% من البيانات المشاهدة .
يتعلق المدى الربيعي بالوسيط المعرف كالتالي :
الخواص
الانحياز نحو القيم المتطرفة
اضافة الثابت ثانية لا يؤثر على مقاييس التشتت.
يدعى متوسط الانحرافات المطلقة للقيم الملاحظة عن نقطة ثابتة بالانحراف المتوسط المطلق ويحدد بواسطة .
تكون النقطة الثابتة أي قيمة. عادة هي مختارة لتكون واحدة من مقاييس النزعة المركزية , بشكل نموذجي الوسط الحسابي أو الوسيط .
كما مع المدى والمدى الربيعي , اضافة نفس الثابت لكل البيانات , الضرب بعدد ثابت ينقل القياس بواسطة القيمة المطلقة لنفس الثابت. كل من الصيغ في الأسفل يمكن أن تستخدم للبيانات غير المبوبة. اذا البيانات مبوبة سنستعمل الصيغة الثانية حيث مراكز الفئات , و التكرارات المطلقة والنسبية :
الخواص :
تتضمن الخاصة المثالية للوسيط بأن الوسيط هو القيمة التي تصغر الانحراف المتوسط المطلق . لهذا أي قيمة أخرى مستبدلة فوق , ستنتج قيمة أكبر لهذا القياس .
مثال :
القيم المشاهدة : 2,5,9,20,22,23,29
ندعو متوسط الانحرافات المربعة للقيم المشاهدة عن نقطة ثابتة معينة بمتوسط خطأ المربعات (MSE) أو الانحراف المتوسط المربع .تكون النقطة مختارة.
التباين
اذا اخترنا النقطة لتكون الوسط الحسابي , عندئذ يدعى MSE يدعى بالتباين . سيرمز لتباين القيم المشاهدة ويحسب كالتالي:
الانحراف المعياري :
يعرف الانحراف المعياري ( ) بالجذر التربيعي للتباين .
التباين (وكذلك أيضا الانحراف المعياري ) دائما أكبر من أو يساوي 0 . يشير التباين الصفري بأن جميع البيانات المشاهدة متطابقة ولهذا لا يوجد أي انتشار .
الخواص:
متوسط خطأ المربعات الى (التباين) أصغر من متوسط خطأ المربعات الى أي قيمة أخرى .
ستبرهن هذه النتيجة كالتالي :
تختفي العبارة المتوسطة للخط المتوسط بأن , تضمن هذه الصيغ أن متوسط خطأ المربعات دائما أكبر من أو يساوي التباين.
بوضوح تبقى المساواة فقط اذا
مثال :
القيم المشاهدة : 2,5,9,20,22,23,29
المعياري: بطرح الوسط الحسابي والتقسيم على الانحراف المعياري نخلق مجموعة بيانات جديدة فيها الوسط الحسابي مساوي للصفر والانحراف المعياري مساوي للواحد. لدينا: , حيث عندئذ
النظرية (الاشتراك) :
نفرض أن القيم المشاهدة (البيانات ) مقسمة الى مجموعات مع مشاهدات . نفرض الأوساط الحسابية والتباينات في هذه المجموعات معروفة . للحصول على التباين .
للبيانات المركبة نستعمل :
تحليل التباين :
توضح الصيغة أعلاه أن التباين ينقسم لجزئيين :
التباين الاجمالي = التباين داخل المجموعات + التباين مابين المجموعات
معامل التباين : لكي نقارن الانحرافات المعيارية للتوزيعات المختلفة , نقدم المقياس النسبي للتباين (النسبة للوسط الحسابي), والذي يدعى بمعامل التباين .
يعبر معامل التباين عن التباين كنسبة مئوية للوسط الحسابي :
مثال:
لدينا قيم الوسط الحسابي والانحرافات المعيارية لمجموعتين من المشاهدات :
بمقارنة الانحرافات المعيارية, نقرر أن التباين في مجموعة البيانات الثانية أكبر ثلاث مرات من التباين في المجموعة الأولى. لكن في هذه الحالة سيكون ملائم أكثر مقارنة معاملات التباين, بما أن البيانات لها أوساط حسابية مختلفة جدا :
الانتشار النسبي (معامل التباين) لكلتا مجموعتي البيانات هو نفسه .