الوصف العددي للتوزيعات التكرارية أحادية البعد
من MM*Stat Arabisch
المحتويات ,الوصف العددي للتوزيعات التكرارية أحادية البعد , مثال لعرض التوزيعات الأحادية البعد ,قيم الوسط
2.4 الوصف العددي للتوزيعات التكرارية أحادية البعد
تلخص الاحصائية الميزات الخاصة بالبيانات, رسميا ,الاحصائية هي تابع البيانات , وتستعمل لقياس الميزات المختلفة, كمثال توضع البيانات عموما (مقاييس النزعة المركزية ),درجة توزع البيانات (مقاييس التشتت) وفيما اذا تتوزع البيانات بشكل منتظم, درجة ارتباطها ببعضها. سنعتبر في الأقسام التالية المقاييس المتنوعة للنزعة المركزية والتشتت , تستخدم هذه المقاييس لمقارنة مجموعات البيانات المختلفة.
تزود مقاييس النزعة المركزية توضع البيانات أو تركزها.
تدعى القيمة التي تظهر بشكل تكراري أكثر في مجموعة البيانات بالمنوال. اذا المتغير منقطع, المنوال هو القيمة مع التكرار الأكبر. للبيانات المستمرة المقاسة بالدقة الكافية, على أية حال أغلب المشاهدات الملاحظة تنقل الفكرة بلا معنى, على أية حال بواسطة تبويب البيانات نستطيع تحديد فئة المنوال, بمعنى : الفئة ذات التكرار الأعلى.
يعطى المنوال للبيانات المنفصلة أو النوعية بواسطة:
المنوال للبيانات المستمرة المبوبة
فئة المنوال هي الفئة ذات التكرار الأكبر , كما يتألف مجال الفئة من العديد من الأعداد غير المنتهية, نقدم الاصطلاح البسيط , الاصطلاح البسيط هو استعمال مركز الفئة لفئة المنوال.
تتضمن تسوية تقنية بديلة لاختيار النقطة التي تتحرك نحو الخلية المجاورة مع الكثافة العالية للمشاهدات .
تعرف كالتالي :
الحد الأدنى / الأعلى لفئة المنوال ,
التوزيع التكراري للفئة السابقة لفئة المنوال
التوزيع التكراري للفئة التالية لفئة المنوال
مثال : عمر 100 مصباح , العمر (الساعات)
العمر (بالساعات) | |||||
المجموع |
|
يقرب المنوال بواسطة مركز الفئة لفئة المنوال
باستعمال الصيغة السابقة نحصل على :
البيانات المعطاة ,نفرض البيانات ترتب أو تصنف في ترتيب متزايد للحصول على السلسلة المرتبة . وندعو عناصر هذه السلسلة بالترتيب الاحصائي للبيانات, نستطيع القراءة فورا من الترتيب الاحصائي القيمة الكبرى الثالثة والقيمة الصغرى وهكذا.
هو العدد بين الصفر والواحد ويشار الى كنسبة البيانات . القيمة التي تقسم سلسلة الترتيب الاحصائي لمجموعتين ثانويتين تحتوي الأولى والأخيرة مشاهدات أو مايدعى , سنحدده بواسطة . بشكل مكافئ, نعتقد أن هي القيمة الى للبيانات المتوضعة تحت و للبيانات المتوضعة فوق.
الربيعات للبيانات غير المبوبة
هو عدد صحيح و العدد الصحيح الأصغر الكافي , عندئذ نعرف , الربيع لهذه المشاهدة مع الرتبة , .
لدينا عدد صحيح , سنأخذ ليكون مركز النقطة بين و
الربيعات للبيانات المبوبة
للبيانات المبوبة في فئات , سندعم الاستكمال مابين حدود الفئة للحصول على الربيع :
, و , هي الحد الأدنى , الحد الأعلى والتكرار النسبي للفئة المحتواة للربيع ,يتضمن التكرار التجميعي النسبي الفئة السابقة لفئة الربيع التي ترمز .
يعرف الربيع باستعمال التدرج , مبدأ التدرج للربيع يفهم بسهولة من الرسم البياني التالي :
بعض الربيعات الخاصة:
الربيعات العشرية تقسم المشاهدات المرتبة لعشر أجزاء متساوية. العشرية :
الربيعات الخماسية - تقسم المشاهدات المرتبة لخمس أجزاء متساوية. الربيعات:
الربيعات الرباعية - تقسم المشاهدات المرتبة لأربع أجزاء متساوية . الربيعات :
الوسيط (القيمة المركزية)
تدعى القيمة التي تقسم المشاهدات المرتبة لجزئين متساويين بالوسيط , الوسيط أقل حساسية بكثير لتباعد أو تطرف المشاهدات من القياسات الأخرى كالوسط الحسابي .
(1) البيانات غير المبوبة
المتغيرات المبوبة
الوسيط للبيانات المبوبة هو مركز الفئة التي تحتوي الجزء المركزي للبيانات , و
هي الحدود الدنيا و العليا للفئة أي
عندئذ سيحدد الوسيط بسهولة من الرسم البياني لتابع التوزيع
, شاهد الرسوم البيانية التالية :
خواص الوسيط (لمتغيرات عددية) :
المثالية:
الوسيط مثالي بمعنى يقلل مجموع الانحرافات المطلقة للمشاهدات عن النقطة التي تتوضع في وسط البيانات.
اذا البيانات محولة خطيا, عندئذ يحول الوسيط بنفس التحويل الخطي .
مثال :
الدخل الصافي الشهري للأسر1998 , (حتى 25000 مارك ألماني ):
مجال الدخل | نسبة الأسر | تابع التوزيع التجريبي |
(DM) | ||
1-800 | 0.044 | 0.044 |
800-1400 | 0.166 | 0.210 |
1400-3000 | 0.471 | 0.681 |
3000-5000 | 0.243 | 0.924 |
5000-25000 | 0.076 | 1.000 |
الشكل البياني لتابع التوزيع التجريبي :
حساب الربيعات :
يتضمن تابع التوزيع التجريبي (العمود الثالث للجدول) الربيع الأول , والربيع الثاني , الذي يخص الفئة الثالثة (3000-5000 DM) نجد بالحساب التالي:
التفسير :
الربيع الأول: 25 % من الأسر لها دخل شهري صافي لايتجاوز 1535.88 DM و 75% من الأسر لها دخل أعلى من 1535.88 DM مارك ألماني .
الربيع الثاني- الوسيط : 50% من الأسر لها دخل أصغر من 2385.14 DM و 50% من الأسر لها دخل أعلى من 2385.14 DM
الربيع الثالث : 75% من الأسر لها دخل أقل من 3567.90 DM و 25 % من الأسر لها دخل يتجاوز 3567.90 DM
نشير للأعلى بأن 50% من الأسر لها دخل صافي ما بين 1535.88 DM و 3567.90 DM
نحصل على الوسط الحسابي أو المتوسط بمجموع كل المشاهدات و تقسيمها على , الوسط الحسابي حساس للقيم المتطرفة .
عمليا , تميل القيمة المتطرفة لسحب الوسط الحسابي في اتجاهها .
يحسب الوسط الحسابي بطرق متنوعة: باستعمال البيانات الأصلية , باستعمال التوزيع التكراري وباستعمال التوزيع التكراري النسبي .
الحساب باستعمال البيانات الأصلية :
الحساب باستعمال التوزيع التكراري والتكراري النسبي :
خواص الوسط الحسابي :
الخاصة الصفرية : مجموع انحرافات البيانات عن الوسط الحسابي يساوي الصفر.
مجموع المربعات الأقل : مجموع مربعات انحرافات البيانات عن الوسط الحسابي أصغر من مجموع مربعات الانحرافات عن أي نقطة أخرى c .
البيانات المثقلة: نفرض البيانات المشاهدة تكون في المجموعات المنفصلة , عندئذ الوسط الحسابي لكل من المجموعات معروف , عندئذ الوسط الحسابي لكل القيم المشاهدة (نعتبرها كمجموعة واحدة ) سيحسب باستعمال الصيغة:
حيث تشير لعدد المشاهدات في المجموعة ()
التحويل الخطي :
المجموع
مثال 1 :
الدخل الشهري للأسر في 1998 :
مجال الدخل DM | نسبة الأسر( f(x | (F(x |
1-800 | 0.044 | 0.044 |
800-1400 | 0.166 | 0.210 |
1400-3000 | 0.471 | 0.681 |
3000-5000 | 0.243 | 0.924 |
5000-25000 | 0.076 | 1.000 |
حساب الوسط الحسابي باستعمال مراكز الفئات :
الوسط الحسابي 3348.4 DM أعلى من الوسيط المحسوب(2385.14 DM) . يوضح ذلك بـأن الوسط الحسابي أكثر حساسية للعدد الصغير نسبيا من الدخول العالية.
تغير القيم العالية الوسط الحسابي , ولكنها لاتؤثر على الوسيط .
مثال 2 : الدخل الشهري 716 شخص .
المنوال = 2000 DM