الوصف العددي للتوزيعات التكرارية أحادية البعد
من MM*Stat Arabisch
المنوال للبيانات المستمرة المبوبة
فئة المنوال هي الفئة ذات التكرار الأكبر , كما يتألف مجال الفئة من العديد من الأعداد غير المنتهية, نقدم الاصطلاح البسيط , الاصطلاح البسيط هو استعمال مركز الفئة لفئة المنوال.
تتضمن تسوية تقنية بديلة لاختيار النقطة التي تتحرك نحو الخلية المجاورة مع الكثافة العالية للمشاهدات .
تعرف كالتالي :
خطأ رياضيات (خطأ في التحويل. أبلغ الخادوم («cli») عن: «SyntaxError: Expected [a-zA-Z] but ")" found.in 2:20»): {\displaystyle x_{D}=x_{j}^{u}+\frac{\widehat{f}\left( x_{j}\right) -\widehat{f}... ...t( x_{j+1}\right) }\cdot\left( x_{j} ^{u}-x_{j}^{l}\right) \quad,\text{ where} }
الحد الأدنى / الأعلى لفئة المنوال ,
التوزيع التكراري لفئة المنوال
التوزيع التكراري للفئة السابقة لفئة المنوال
التوزيع التكراري للفئة التالية لفئة المنوال
مثال : عمر 100 مصباح , العمر (الساعات)
العمر (بالساعات) | |||||
المجموع |
|
فئة المنوال :
يقرب المنوال بواسطة مركز الفئة لفئة المنوال
باستعمال الصيغة السابقة نحصل على :
,نفرض البيانات ترتب أو تصنف في ترتيب متزايد للحصول على السلسلة المرتبة . وندعو عناصر هذه السلسلة بالترتيب الاحصائي للبيانات, نستطيع القراءة فورا من الترتيب الاحصائي القيمة الكبرى الثالثة والقيمة الصغرى وهكذا.
هو العدد بين الصفر والواحد ويشار الى كنسبة البيانات . القيمة التي تقسم سلسلة الترتيب الاحصائي لمجموعتين ثانويتين تحتوي الأولى والأخيرة مشاهدات أو مايدعى , سنحدده بواسطة . بشكل مكافئ, نعتقد أن هي القيمة الى للبيانات المتوضعة تحت و للبيانات المتوضعة فوق.
الربيعات للبيانات غير المبوبة
هو عدد صحيح و العدد الصحيح الأصغر الكافي , عندئذ نعرف , الربيع لهذه المشاهدة مع الرتبة , .
لدينا عدد صحيح , سنأخذ ليكون مركز النقطة بين و
الربيعات للبيانات المبوبة
للبيانات المبوبة في فئات , سندعم الاستكمال مابين حدود الفئة للحصول على الربيع :
, و , هي الحد الأدنى , الحد الأعلى والتكرار النسبي للفئة المحتواة للربيع ,يتضمن التكرار التجميعي النسبي الفئة السابقة لفئة الربيع التي ترمز .
يعرف الربيع باستعمال التدرج , مبدأ التدرج للربيع يفهم بسهولة من الرسم البياني التالي :
العشرية :
الربيعات الخماسية - تقسم المشاهدات المرتبة لخمس أجزاء متساوية. الربيعات:
الربيعات الرباعية - تقسم المشاهدات المرتبة لأربع أجزاء متساوية . الربيعات :
الوسيط (القيمة المركزية)
تدعى القيمة التي تقسم المشاهدات المرتبة لجزئين متساويين بالوسيط , الوسيط أقل حساسية بكثير لتباعد أو تطرف المشاهدات من القياسات الأخرى كالوسط الحسابي .
يطابق الوسيط للربيع الثاني
(1) البيانات غير المبوبة
n فردي :
n زوجي :
المتغيرات المبوبة
الوسيط للبيانات المبوبة هو مركز الفئة التي تحتوي الجزء المركزي للبيانات , و
هي الحدود الدنيا و العليا للفئة أي
عندئذ سيحدد الوسيط بسهولة من الرسم البياني لتابع التوزيع
, شاهد الرسوم البيانية التالية :
الوسيط مثالي بمعنى يقلل مجموع الانحرافات المطلقة للمشاهدات عن النقطة التي تتوضع في وسط البيانات.
التحويل الخطي :
اذا البيانات محولة خطيا, عندئذ يحول الوسيط بنفس التحويل الخطي .
مثال :
الدخل الصافي الشهري للأسر1998 , (حتى 25000 مارك ألماني ):
مجال الدخل | نسبة الأسر | تابع التوزيع التجريبي |
(DM) | ||
1-800 | 0.044 | 0.044 |
800-1400 | 0.166 | 0.210 |
1400-3000 | 0.471 | 0.681 |
3000-5000 | 0.243 | 0.924 |
5000-25000 | 0.076 | 1.000 |
الشكل البياني لتابع التوزيع التجريبي :
, والربيع الثاني , الذي يخص الفئة الثالثة (3000-5000 DM) نجد بالحساب التالي:
التفسير :
الربيع الأول: 25 % من الأسر لها دخل شهري صافي لايتجاوز 1535.88 DM و 75% من الأسر لها دخل أعلى من 1535.88 DM مارك ألماني .
الربيع الثاني- الوسيط : 50% من الأسر لها دخل أصغر من 2385.14 DM و 50% من الأسر لها دخل أعلى من 2385.14 DM
الربيع الثالث : 75% من الأسر لها دخل أقل من 3567.90 DM و 25 % من الأسر لها دخل يتجاوز 3567.90 DM
نشير للأعلى بأن 50% من الأسر لها دخل صافي ما بين 1535.88 DM و 3567.90 DM
نحصل على الوسط الحسابي أو المتوسط بمجموع كل المشاهدات و تقسيمها على , الوسط الحسابي حساس للقيم المتطرفة .
عمليا , تميل القيمة المتطرفة لسحب الوسط الحسابي في اتجاهها .
يحسب الوسط الحسابي بطرق متنوعة: باستعمال البيانات الأصلية , باستعمال التوزيع التكراري وباستعمال التوزيع التكراري النسبي .
الحساب باستعمال البيانات الأصلية :
خطأ رياضيات (خطأ في التحويل. أبلغ الخادوم («cli») عن: «SyntaxError: Illegal TeX function
Found \bigskipin 1:17»): {\displaystyle \bigskip}
الحساب باستعمال التوزيع التكراري والتكراري النسبي :
خواص الوسط الحسابي :
الخاصة الصفرية : مجموع انحرافات البيانات عن الوسط الحسابي يساوي الصفر.
خطأ رياضيات (خطأ في التحويل. أبلغ الخادوم («cli») عن: «SyntaxError: Illegal TeX function
Found \newlinein 2:18»): {\displaystyle \mathbf{\sum\limits_{i=1}^{n} (x_{i}-\bar{x})=0\newline \sum\limits_{j=1}^{k}(x_{j}-\bar{x})h(x_{j})=0}}
مجموع المربعات الأقل : مجموع مربعات انحرافات البيانات عن الوسط الحسابي أصغر من مجموع مربعات الانحرافات عن أي نقطة أخرى c .
البيانات المثقلة: نفرض البيانات المشاهدة تكون في المجموعات المنفصلة , عندئذ الوسط الحسابي لكل من المجموعات معروف , عندئذ الوسط الحسابي لكل القيم المشاهدة (نعتبرها كمجموعة واحدة ) سيحسب باستعمال الصيغة:
حيث تشير لعدد المشاهدات في المجموعة ()
التحويل الخطي :
المجموع
مثال 1 :
الدخل الشهري للأسر في 1998 :
مجال الدخل DM | نسبة الأسر( f(x | (F(x |
1-800 | 0.044 | 0.044 |
800-1400 | 0.166 | 0.210 |
1400-3000 | 0.471 | 0.681 |
3000-5000 | 0.243 | 0.924 |
5000-25000 | 0.076 | 1.000 |
حساب الوسط الحسابي باستعمال مراكز الفئات :
DM
الوسط الحسابي 3348.4 DM أعلى من الوسيط المحسوب(2385.14 DM) . يوضح ذلك بـأن الوسط الحسابي أكثر حساسية للعدد الصغير نسبيا من الدخول العالية.
تغير القيم العالية الوسط الحسابي , ولكنها لاتؤثر على الوسيط .
مثال 2 : الدخل الشهري 716 شخص .
= 1092.50 DM
=1800 DM
= DM 2400
المنوال = 2000 DM