مقاييس التشتت أو التباين

من MM*Stat Arabisch

اذهب إلى: تصفح, ابحث

في كلا الحالتين مساوي الى 404 مارك ألماني , لكن الشكلين البيانيين يظهران اختلافات مرئية ما بين التوزيعين . للعائلات من أربع أشخاص تكون القيم متمركزة أكثر حول المركز (في هذه الحالة الوسط) من العائلات لشخصين , بمعنى الانتشار أو التباين يكون صغير .


تنظم مقاييس التشتت تغير البيانات . بالاضافة الى مقاييس النزعة المركزية (كالوسط , الوسيط والمنوال). تزود الوصف المقبول للبيانات الأحادية البعد, بشكل بديهي ,نريد قياسات التشتت التي لها نفس الخاصة اذا نفس الثابت يضاف لكل من نقاط البيانات, سيكون القياس غير متأثر. الخاصة الثانية اذا البيانات تنتشر بعيدة بشكل مفرد , كمثال عبر الضرب بواسطة ثابت أكبر من 1 , سيزداد القياس.



حيث القيم المرتبة , بمعنى الاحصاءات المرتبة.


(2)البيانات المبوبة : للبيانات المبوبة , يعرف المدى (R) بالفرق مابين والحد الأدنى للفئة الأولى (الأصغر)  :



الخواص :

للتحويل الخطي لدينا:


نلاحظ بأن اضافة الثابت لا تغير البيانات ولا تؤثر على مقاييس التشتت.


والربيع الأول :



المدى الربيعي : هو عرض المنطقة المركزية التي تستحوذ على 50% من البيانات المشاهدة .

يتعلق المدى الربيعي بالوسيط المعرف كالتالي :


الخواص


الانحياز نحو القيم المتطرفة


التحويل الخطي:


اضافة الثابت ثانية لا يؤثر على مقاييس التشتت.


بالانحراف المتوسط المطلق ويحدد بواسطة . تكون النقطة الثابتة أي قيمة. عادة هي مختارة لتكون واحدة من مقاييس النزعة المركزية , بشكل نموذجي الوسط الحسابي أو الوسيط .


كما مع المدى والمدى الربيعي , اضافة نفس الثابت لكل البيانات , الضرب بعدد ثابت ينقل القياس بواسطة القيمة المطلقة لنفس الثابت. كل من الصيغ في الأسفل يمكن أن تستخدم للبيانات غير المبوبة. اذا البيانات مبوبة سنستعمل الصيغة الثانية حيث مراكز الفئات , و التكرارات المطلقة والنسبية :




الخواص :


تتضمن الخاصة المثالية للوسيط بأن الوسيط هو القيمة التي تصغر الانحراف المتوسط المطلق . لهذا أي قيمة أخرى مستبدلة فوق , ستنتج قيمة أكبر لهذا القياس .


مثال :


القيم المشاهدة : 2,5,9,20,22,23,29




للتحويل الخطي للبيانات :



H100.gif التباين والانحراف المعياري


ندعو متوسط الانحرافات المربعة للقيم المشاهدة عن نقطة ثابتة معينة بمتوسط خطأ المربعات (MSE) أو الانحراف المتوسط المربع .تكون النقطة مختارة.




التباين


اذا اخترنا النقطة لتكون الوسط الحسابي , عندئذ يدعى MSE يدعى بالتباين . سيرمز لتباين القيم المشاهدة ويحسب كالتالي:




الانحراف المعياري :


يعرف الانحراف المعياري ( ) بالجذر التربيعي للتباين .





التباين (وكذلك أيضا الانحراف المعياري ) دائما أكبر من أو يساوي 0 . يشير التباين الصفري بأن جميع البيانات المشاهدة متطابقة ولهذا لا يوجد أي انتشار .


الخواص:


متوسط خطأ المربعات الى (التباين) أصغر من متوسط خطأ المربعات الى أي قيمة أخرى . ستبرهن هذه النتيجة كالتالي :





تختفي العبارة المتوسطة للخط المتوسط بأن , تضمن هذه الصيغ أن متوسط خطأ المربعات دائما أكبر من أو يساوي التباين. بوضوح تبقى المساواة فقط اذا


مثال :


القيم المشاهدة : 2,5,9,20,22,23,29




للتحويل الخطي يكون لدينا:


المعياري: بطرح الوسط الحسابي والتقسيم على الانحراف المعياري نخلق مجموعة بيانات جديدة فيها الوسط الحسابي مساوي للصفر والانحراف المعياري مساوي للواحد. لدينا: , حيث عندئذ





النظرية (الاشتراك) :


نفرض أن القيم المشاهدة (البيانات ) مقسمة الى مجموعات مع مشاهدات . نفرض الأوساط الحسابية والتباينات في هذه المجموعات معروفة . للحصول على التباين . للبيانات المركبة نستعمل  :



الأوساط الحسابية في المجموعات


التباينات في المجموعات


عدد المشاهدات في المجموعات ,


تحليل التباين :


توضح الصيغة أعلاه أن التباين ينقسم لجزئيين :

التباين الاجمالي = التباين داخل المجموعات + التباين مابين المجموعات


معامل التباين : لكي نقارن الانحرافات المعيارية للتوزيعات المختلفة , نقدم المقياس النسبي للتباين (النسبة للوسط الحسابي), والذي يدعى بمعامل التباين . يعبر معامل التباين عن التباين كنسبة مئوية للوسط الحسابي :


خطأ رياضيات (خطأ في التحويل. أبلغ الخادوم («cli») عن: «SyntaxError: Expected "-", "[", "\\", "\\begin", "\\begin{", "]", "^", "_", "{", "}", [ \t\n\r], [%$], [().], [,:;?!'], [/|], [0-9], [><~], [\-+*=], or [a-zA-Z] but "&" found.in 1:45»): {\displaystyle v=s/\bar{x}\,\,\,\;\;\bar{x}&gt;0 }


مثال:


لدينا قيم الوسط الحسابي والانحرافات المعيارية لمجموعتين من المشاهدات :




بمقارنة الانحرافات المعيارية, نقرر أن التباين في مجموعة البيانات الثانية أكبر ثلاث مرات من التباين في المجموعة الأولى. لكن في هذه الحالة سيكون ملائم أكثر مقارنة معاملات التباين, بما أن البيانات لها أوساط حسابية مختلفة جدا :




الانتشار النسبي (معامل التباين) لكلتا مجموعتي البيانات هو نفسه .