الفرق بين المراجعتين لصفحة: «مقاييس التشتت أو التباين»
من MM*Stat Arabisch
لا ملخص تعديل |
لا ملخص تعديل |
||
(مراجعة متوسطة واحدة بواسطة نفس المستخدم غير معروضة) | |||
سطر ١: | سطر ١: | ||
< | [[المحتويات]] ,[[لتمثيل البياني للتوزيع أحادي البعد ]],[[عناصر المقياس ]],[[عناصر المقياس 1]] | ||
[[صورة:H100.gif]] ''' 2.6مقاييس التشتت أو التباين ''' | |||
عادة لا تكون [[مقاييس النزعة المركزية]] المتنوعة في الأقسام السابقة كافية للتمثيل الجيد للبيانات الأحادية البعد. | |||
نوضح كالتالي : | |||
الانفاق الشهري لوقت الفراغ والعطل (بالمارك الألماني): | |||
تعرض البيانات لعشر عائلات من شخصين : 210,250,340,360,400,430,440,450,530,630 على المحور: | |||
[[صورة:Folimg133.gif]] | |||
تعرض البيانات للعائلات العشر من أربع أشخاص :340,350,360,380,390,410,420,440,460,490 على المحور : | |||
[[صورة:Folimg134.gif]] | |||
<!-- 027.R | |||
png("27.png",width=5, height=5,units="in", res=150) | |||
x <- c(210, 250, 340, 360, 400, 430, 440, 450, 530, 630) | |||
y <- c(340, 350, 360, 380, 390, 410, 420, 440, 460,490) | |||
boxplot(x,y , col = "red") | |||
dev.off() | |||
--> | |||
[[ملف:027.png|350px]] | |||
[[الوسط الحسابي ]] [[صورة:Mmengjavaimg371.gif]] في كلا الحالتين مساوي الى 404 مارك ألماني , لكن الشكلين البيانيين يظهران اختلافات مرئية ما بين التوزيعين . | |||
للعائلات من أربع أشخاص تكون القيم متمركزة أكثر حول المركز (في هذه الحالة الوسط) من العائلات لشخصين , بمعنى الانتشار أو التباين يكون صغير . | للعائلات من أربع أشخاص تكون القيم متمركزة أكثر حول المركز (في هذه الحالة الوسط) من العائلات لشخصين , بمعنى الانتشار أو التباين يكون صغير . | ||
سطر ٩: | سطر ٥٢: | ||
[[صورة:H100.gif]] '''المدى''' | |||
المدى هو المقياس الأبسط للتشتت : | |||
''' (1) للبيانات غير المبوبة : يعرف المدى (R) ''' بالفرق مابين القيمة المشاهدة العليا و الصغرى | |||
[[صورة:Mmengjavaimg372.gif]] | |||
حيث | حيث [[صورة:Mmengjavaimg373.gif]] القيم المرتبة , بمعنى الاحصاءات المرتبة. | ||
'''(2)البيانات المبوبة :''' للبيانات المبوبة , يعرف '''المدى (R)''' بالفرق مابين | '''(2)البيانات المبوبة :''' للبيانات المبوبة , يعرف '''المدى (R)''' بالفرق مابين [[الحد]] الأعلى للفئة الأخيرة (الأعلى)[[صورة:Mmengjavaimg374.gif]] والحد الأدنى للفئة الأولى (الأصغر) [[صورة:Mmengjavaimg375.gif]] : | ||
[[صورة:Mmengjavaimg376.gif]] | |||
'''الخواص :''' | '''الخواص :''' | ||
للتحويل الخطي لدينا: | للتحويل الخطي لدينا: [[صورة:Mmengjavaimg377.gif]] | ||
نلاحظ بأن اضافة الثابت [[صورة:Mmengjavaimg378.gif]] لا تغير البيانات ولا تؤثر على مقاييس التشتت. | |||
[[صورة:H100.gif]] '''المدى الربيعي ''' | |||
المدى الربيعي هو الفرق مابين الربيع الثالث [[صورة:Mmengjavaimg379.gif]] والربيع الأول [[صورة:Mmengjavaimg380.gif]]: | |||
[[صورة:Mmengjavaimg381.gif]] | |||
سطر ٤٤: | سطر ٩٢: | ||
يتعلق المدى الربيعي بالوسيط المعرف كالتالي : | يتعلق المدى الربيعي بالوسيط المعرف كالتالي : | ||
[[صورة:Mmengjavaimg382.gif]] | |||
سطر ٥٥: | سطر ١٠٢: | ||
التحويل الخطي: | التحويل الخطي: [[صورة:Mmengjavaimg383.gif]] | ||
اضافة الثابت [[صورة:Mmengjavaimg378.gif]] ثانية لا يؤثر على مقاييس التشتت. | |||
[[صورة:H100.gif]] '''الانحراف المتوسط المطلق (MAD) ''' | |||
يدعى متوسط الانحرافات المطلقة للقيم الملاحظة عن نقطة ثابتة [[صورة:Mmengjavaimg384.gif]] بالانحراف المتوسط المطلق ويحدد بواسطة [[صورة:Mmengjavaimg385.gif]] . | |||
تكون النقطة الثابتة | تكون النقطة الثابتة [[صورة:Mmengjavaimg386.gif]] أي قيمة. عادة هي مختارة لتكون واحدة من مقاييس النزعة المركزية , بشكل نموذجي الوسط الحسابي [[صورة:Mmengjavaimg312.gif]] أو الوسيط [[صورة:Mmengjavaimg282.gif]]. | ||
كما مع المدى والمدى الربيعي , اضافة نفس الثابت لكل البيانات , الضرب بعدد ثابت ينقل القياس بواسطة القيمة المطلقة لنفس الثابت. كل من الصيغ في الأسفل يمكن أن تستخدم للبيانات غير المبوبة. اذا البيانات مبوبة سنستعمل الصيغة الثانية حيث | كما مع المدى والمدى الربيعي , اضافة نفس الثابت لكل البيانات , الضرب بعدد ثابت ينقل القياس بواسطة القيمة المطلقة لنفس الثابت. كل من الصيغ في الأسفل يمكن أن تستخدم للبيانات غير المبوبة. اذا البيانات مبوبة سنستعمل الصيغة الثانية حيث [[صورة:Mmengjavaimg33.gif]] مراكز الفئات ,[[صورة:Mmengjavaimg387.gif]] و [[صورة:Mmengjavaimg388.gif]] التكرارات المطلقة والنسبية : | ||
[[صورة:Mmengjavaimg389.gif]] | |||
[[صورة:Mmengjavaimg390.gif]] | |||
سطر ٨٤: | سطر ١٣١: | ||
تتضمن الخاصة المثالية للوسيط بأن الوسيط هو القيمة التي تصغر الانحراف المتوسط المطلق . لهذا أي قيمة أخرى مستبدلة | تتضمن الخاصة المثالية للوسيط بأن الوسيط هو القيمة التي تصغر الانحراف المتوسط المطلق . لهذا أي قيمة أخرى مستبدلة [[صورة:Mmengjavaimg386.gif]] فوق , ستنتج قيمة أكبر لهذا القياس . | ||
سطر ٩٤: | سطر ١٤١: | ||
[[صورة:Mmengjavaimg391.gif]] | |||
[[صورة:Mmengjavaimg392.gif]] | |||
للتحويل الخطي للبيانات : | للتحويل الخطي للبيانات : [[صورة:Mmengjavaimg393.gif]] | ||
سطر ١١١: | سطر ١٥٦: | ||
ندعو متوسط الانحرافات المربعة للقيم المشاهدة عن نقطة ثابتة معينة | ندعو متوسط الانحرافات المربعة للقيم المشاهدة عن نقطة ثابتة معينة [[صورة:Mmengjavaimg386.gif]] بمتوسط خطأ المربعات (MSE) أو الانحراف المتوسط المربع .تكون النقطة [[صورة:Mmengjavaimg386.gif]] مختارة. | ||
[[صورة:Mmengjavaimg394.gif]] | |||
[[صورة:Mmengjavaimg395.gif]] | |||
سطر ١٢٦: | سطر ١٦٨: | ||
اذا اخترنا النقطة | اذا اخترنا النقطة [[صورة:Mmengjavaimg386.gif]] لتكون الوسط الحسابي [[صورة:Mmengjavaimg312.gif]] , عندئذ يدعى MSE يدعى بالتباين . سيرمز لتباين القيم المشاهدة [[صورة:Mmengjavaimg396.gif]] ويحسب كالتالي: | ||
[[صورة:Mmengjavaimg397.gif]] | |||
[[صورة:Mmengjavaimg398.gif]] | |||
سطر ١٤٤: | سطر ١٨٢: | ||
يعرف الانحراف المعياري ( | يعرف الانحراف المعياري ( [[صورة:Mmengjavaimg399.gif]] ) بالجذر التربيعي للتباين . | ||
[[صورة:Mmengjavaimg400.gif]] | |||
[[صورة:Mmengjavaimg401.gif]] | |||
التباين | التباين [[صورة:Mmengjavaimg396.gif]] (وكذلك أيضا الانحراف المعياري [[صورة:Mmengjavaimg399.gif]]) دائما أكبر من أو يساوي 0 . يشير التباين الصفري بأن جميع البيانات المشاهدة متطابقة ولهذا لا يوجد أي انتشار . | ||
سطر ١٦٦: | سطر ٢٠٠: | ||
متوسط خطأ المربعات الى | متوسط خطأ المربعات الى [[صورة:Mmengjavaimg312.gif]] (التباين) أصغر من متوسط خطأ المربعات الى أي قيمة أخرى [[صورة:Mmengjavaimg386.gif]] . | ||
ستبرهن هذه النتيجة كالتالي : | ستبرهن هذه النتيجة كالتالي : | ||
[[صورة:Mmengjavaimg402.gif]] | |||
[[صورة:Mmengjavaimg403.gif]] | |||
[[صورة:Mmengjavaimg404.gif]] | |||
تختفي العبارة المتوسطة للخط المتوسط بأن | تختفي العبارة المتوسطة للخط المتوسط بأن [[صورة:Mmengjavaimg405.gif]] , تضمن هذه الصيغ أن متوسط خطأ المربعات [[صورة:Mmengjavaimg406.gif]] دائما أكبر من أو يساوي التباين. | ||
بوضوح تبقى المساواة فقط اذا [[صورة:Mmengjavaimg407.gif]] | |||
بوضوح تبقى المساواة فقط اذا | |||
سطر ١٩٦: | سطر ٢٢٣: | ||
[[صورة:Mmengjavaimg408.gif]] | |||
[[صورة:Mmengjavaimg409.gif]] | |||
للتحويل الخطي يكون لدينا: | للتحويل الخطي يكون لدينا: [[صورة:Mmengjavaimg410.gif]] | ||
المعياري: بطرح الوسط الحسابي والتقسيم على الانحراف المعياري نخلق مجموعة بيانات جديدة فيها الوسط الحسابي مساوي للصفر والانحراف المعياري مساوي للواحد. لدينا: | المعياري: بطرح الوسط الحسابي والتقسيم على الانحراف المعياري نخلق مجموعة بيانات جديدة فيها الوسط الحسابي مساوي للصفر والانحراف المعياري مساوي للواحد. لدينا: [[صورة:Mmengjavaimg411.gif]] , حيث [[صورة:Mmengjavaimg412.gif]] عندئذ | ||
[[صورة:Mmengjavaimg413.gif]] | |||
[[صورة:Mmengjavaimg414.gif]] | |||
سطر ٢٢٦: | سطر ٢٤٩: | ||
نفرض أن القيم المشاهدة (البيانات ) مقسمة الى | نفرض أن القيم المشاهدة (البيانات ) مقسمة الى [[صورة:Mmengjavaimg415.gif]] مجموعات مع [[صورة:Mmengjavaimg416.gif]] مشاهدات . نفرض الأوساط الحسابية والتباينات في هذه المجموعات معروفة . للحصول على التباين .[[صورة:Mmengjavaimg396.gif]] | ||
للبيانات المركبة نستعمل : | للبيانات المركبة نستعمل : | ||
[[صورة:Mmengjavaimg417.gif]] | |||
[[صورة:Mmengjavaimg418.gif]]الأوساط الحسابية في المجموعات | |||
[[صورة:Mmengjavaimg419.gif]] التباينات في المجموعات | |||
[[صورة:Mmengjavaimg420.gif]] عدد المشاهدات في المجموعات ,[[صورة:Mmengjavaimg421.gif]] | |||
سطر ٢٥٧: | سطر ٢٧٨: | ||
[[صورة:Mmengjavaimg422.gif]] | |||
سطر ٢٦٧: | سطر ٢٨٧: | ||
[[صورة:Mmengjavaimg423.gif]] | |||
[[صورة:Mmengjavaimg424.gif]] | |||
سطر ٢٧٨: | سطر ٢٩٧: | ||
[[صورة:Mmengjavaimg425.gif]] | |||
[[صورة:Mmengjavaimg426.gif]] | |||
الانتشار النسبي (معامل التباين) لكلتا مجموعتي البيانات هو نفسه . | الانتشار النسبي (معامل التباين) لكلتا مجموعتي البيانات هو نفسه . |
المراجعة الحالية بتاريخ ١٧:٤١، ٢٠ أغسطس ٢٠٢٠
المحتويات ,لتمثيل البياني للتوزيع أحادي البعد ,عناصر المقياس ,عناصر المقياس 1
عادة لا تكون مقاييس النزعة المركزية المتنوعة في الأقسام السابقة كافية للتمثيل الجيد للبيانات الأحادية البعد.
نوضح كالتالي :
الانفاق الشهري لوقت الفراغ والعطل (بالمارك الألماني):
تعرض البيانات لعشر عائلات من شخصين : 210,250,340,360,400,430,440,450,530,630 على المحور:
تعرض البيانات للعائلات العشر من أربع أشخاص :340,350,360,380,390,410,420,440,460,490 على المحور :
الوسط الحسابي في كلا الحالتين مساوي الى 404 مارك ألماني , لكن الشكلين البيانيين يظهران اختلافات مرئية ما بين التوزيعين .
للعائلات من أربع أشخاص تكون القيم متمركزة أكثر حول المركز (في هذه الحالة الوسط) من العائلات لشخصين , بمعنى الانتشار أو التباين يكون صغير .
تنظم مقاييس التشتت تغير البيانات . بالاضافة الى مقاييس النزعة المركزية (كالوسط , الوسيط والمنوال).
تزود الوصف المقبول للبيانات الأحادية البعد, بشكل بديهي ,نريد قياسات التشتت التي لها نفس الخاصة اذا نفس الثابت يضاف لكل من نقاط البيانات,
سيكون القياس غير متأثر. الخاصة الثانية اذا البيانات تنتشر بعيدة بشكل مفرد , كمثال عبر الضرب بواسطة ثابت أكبر من 1 , سيزداد القياس.
المدى هو المقياس الأبسط للتشتت :
(1) للبيانات غير المبوبة : يعرف المدى (R) بالفرق مابين القيمة المشاهدة العليا و الصغرى
حيث القيم المرتبة , بمعنى الاحصاءات المرتبة.
(2)البيانات المبوبة : للبيانات المبوبة , يعرف المدى (R) بالفرق مابين الحد الأعلى للفئة الأخيرة (الأعلى) والحد الأدنى للفئة الأولى (الأصغر) :
الخواص :
نلاحظ بأن اضافة الثابت لا تغير البيانات ولا تؤثر على مقاييس التشتت.
المدى الربيعي هو الفرق مابين الربيع الثالث والربيع الأول :
المدى الربيعي : هو عرض المنطقة المركزية التي تستحوذ على 50% من البيانات المشاهدة .
يتعلق المدى الربيعي بالوسيط المعرف كالتالي :
الخواص
الانحياز نحو القيم المتطرفة
اضافة الثابت ثانية لا يؤثر على مقاييس التشتت.
يدعى متوسط الانحرافات المطلقة للقيم الملاحظة عن نقطة ثابتة بالانحراف المتوسط المطلق ويحدد بواسطة .
تكون النقطة الثابتة أي قيمة. عادة هي مختارة لتكون واحدة من مقاييس النزعة المركزية , بشكل نموذجي الوسط الحسابي أو الوسيط .
كما مع المدى والمدى الربيعي , اضافة نفس الثابت لكل البيانات , الضرب بعدد ثابت ينقل القياس بواسطة القيمة المطلقة لنفس الثابت. كل من الصيغ في الأسفل يمكن أن تستخدم للبيانات غير المبوبة. اذا البيانات مبوبة سنستعمل الصيغة الثانية حيث مراكز الفئات , و التكرارات المطلقة والنسبية :
الخواص :
تتضمن الخاصة المثالية للوسيط بأن الوسيط هو القيمة التي تصغر الانحراف المتوسط المطلق . لهذا أي قيمة أخرى مستبدلة فوق , ستنتج قيمة أكبر لهذا القياس .
مثال :
القيم المشاهدة : 2,5,9,20,22,23,29
ندعو متوسط الانحرافات المربعة للقيم المشاهدة عن نقطة ثابتة معينة بمتوسط خطأ المربعات (MSE) أو الانحراف المتوسط المربع .تكون النقطة مختارة.
التباين
اذا اخترنا النقطة لتكون الوسط الحسابي , عندئذ يدعى MSE يدعى بالتباين . سيرمز لتباين القيم المشاهدة ويحسب كالتالي:
الانحراف المعياري :
يعرف الانحراف المعياري ( ) بالجذر التربيعي للتباين .
التباين (وكذلك أيضا الانحراف المعياري ) دائما أكبر من أو يساوي 0 . يشير التباين الصفري بأن جميع البيانات المشاهدة متطابقة ولهذا لا يوجد أي انتشار .
الخواص:
متوسط خطأ المربعات الى (التباين) أصغر من متوسط خطأ المربعات الى أي قيمة أخرى .
ستبرهن هذه النتيجة كالتالي :
تختفي العبارة المتوسطة للخط المتوسط بأن , تضمن هذه الصيغ أن متوسط خطأ المربعات دائما أكبر من أو يساوي التباين.
بوضوح تبقى المساواة فقط اذا
مثال :
القيم المشاهدة : 2,5,9,20,22,23,29
المعياري: بطرح الوسط الحسابي والتقسيم على الانحراف المعياري نخلق مجموعة بيانات جديدة فيها الوسط الحسابي مساوي للصفر والانحراف المعياري مساوي للواحد. لدينا: , حيث عندئذ
النظرية (الاشتراك) :
نفرض أن القيم المشاهدة (البيانات ) مقسمة الى مجموعات مع مشاهدات . نفرض الأوساط الحسابية والتباينات في هذه المجموعات معروفة . للحصول على التباين .
للبيانات المركبة نستعمل :
تحليل التباين :
توضح الصيغة أعلاه أن التباين ينقسم لجزئيين :
التباين الاجمالي = التباين داخل المجموعات + التباين مابين المجموعات
معامل التباين : لكي نقارن الانحرافات المعيارية للتوزيعات المختلفة , نقدم المقياس النسبي للتباين (النسبة للوسط الحسابي), والذي يدعى بمعامل التباين .
يعبر معامل التباين عن التباين كنسبة مئوية للوسط الحسابي :
مثال:
لدينا قيم الوسط الحسابي والانحرافات المعيارية لمجموعتين من المشاهدات :
بمقارنة الانحرافات المعيارية, نقرر أن التباين في مجموعة البيانات الثانية أكبر ثلاث مرات من التباين في المجموعة الأولى. لكن في هذه الحالة سيكون ملائم أكثر مقارنة معاملات التباين, بما أن البيانات لها أوساط حسابية مختلفة جدا :
الانتشار النسبي (معامل التباين) لكلتا مجموعتي البيانات هو نفسه .