مقاييس النزعة المركزية
فيما يلي سنتكلم
عن ثلاث أنواع من مقاييس النزعة المركزية هي بالتحديد، المتوسط الحسابي الوسيط
والمنوال. وهي مقاييس هامة في الإحصاء توفر نظرة عامة عن البيانات دون الرجوع
للبيانات نفسها ان كانت كميتها كبيرة. فمثلا يمكن اخذ نظرة عامة عن كمية من مليون
رقم بمجرد النظر المتوسط الحسابي او الوسيط او المنوال.
الوسط الحسابي:
يعتبر الوسط
الحسابي من أكثر مقاييس النزعة المركزية استخداما نظرا لسهولة حسابه، ويستخدم
بكثرة في حياتنا اليومية فالمتوسط الحسابي يعبر عن متوسط دخول الافراد ومتوسط
الرواتب الشهرية ومن الممكن ان نعتبر المتوسط الحسابي انه ليس مقياسا بحد ذاته
ولكن عند استخدامه في مقاييس أخرى مثل مقاييس التشتت يعطي قيم تعبر عن مدى
انحرافات البيانات عن متوسطها وبذلك من الممكن معرفة مدى تجانس البيانات.
يتم حساب الوسط
الحسابي بجمع كل القيم ثم قسمتها على عددها. مثلا لو القيم هي درجات الطلاب في
مادة إحصاء الاعمال كالتالي (45 88 66 57 62 74 89 56 45 77 88 95 ) هي درجات الطلاب من المجموع
الإجمالي 100 فان الوسط الحسابي هو( 45 +88 +66
+57 +62 +74 +89 +56+ 45 +77+ 88 +95) / 12 = 70.16
وهذه القيمة تعتبر مركز الثقل بالنسبة للبيانات وان مجموع الانحرافات عنها
دائما يساوي صفر.
يتم حساب الوسط الحسابي للبيانات المبوبة بشكل جداول تكرارية على شكل فئات
لها حدود، ولكل فئة تردد او تكرارا معين فهو في هذه الحالة مجموع حاصل ضرب مركز كل
فئة في التكرار المناظر له مقسوما على مجموع التكرارات.
مزايا الوسط الحسابي
·
انه سهل الحساب وهذه الميزة سنتعرف اليها
عندما نريد حساب الوسيط حيث ان الوسيط يحتاج الى ترتيب للبيانات وهو ما يتم
معالجته بالحاسب بسرعة اقل من سرعة حساب الوسط الحسابي
·
انه يأخذ بالاعتبار كل القيم حيث انه أحيانا لا
يتم اعتبار كل القيم في حساب مثلا المدى، فالمدى يتم حسابه باستخدام رقيمين فقط
الرقم الأول هو اعلى رقم والرقم الثاني هو اقل رقم.
·
انه أكثر المقاييس شيوعا في الاستخدام وفهما
في المبدأ الأساسي له. فمن السهل جدا معرفة متوسطات الأرقام فقط بجمعها وقسمتها
على عددها لا نحتاج الى ترتيب او تجميع فروق وتربيع كما يحدث في مقاييس التشتت مثل
الانحراف المعياري ومعامل الاختلاف.
·
يستخدم أيضا في برامج الحاسب لمعالجة الصورة
وفلترتها بتنعيم الحواف الخشنة في الصورة وتنعيم الإشارات الصوتية وإزالة الأصوات
المزعجة منها.
عيوب الوسط
الحسابي
·
انه يتأثر جدا بالقيم الشاذة. فمثلا لو هناك
عدد من طلاب مادة إحصاء الاعمال اطوالهم محصور بين 172 الى 176 فان قيمة المتوسط
الحسابي ستكون معبرة عن البيانات بشكل سليم. لكن فرضا اننا اضفنا طالب يلعب كرة
السلة وطوله مترين او 200 وهو الطالب الوحيد في الفصل الذي طوله مترين فان المتوسط
الحسابي سيتغير جذريا دون ان يعبر عن مركزية البيانات.
·
أيضا يصعب حساب المتوسط الحسابي في البيانات
الوصفية. فمثلا لو فرضنا اننا نسجل جنسيات السائحين الأجانب في مصر. "سعودي"،
"أردني"، "امريكي"، "الماني"، "فرنسي"،
"كندي"، "صيني" وهكذا فأننا لن نستطيع إيجاد المتوسط الحسابي
لها لأنها بيانات وصفية فكيف سنجدد مجموعها ؟؟
·
أيضا يصعب حساب المتوسط الحسابي في حالة
الجداول التكرارية المفتوحة.
الوســـــــــيط:
هو ثاني أكثر
مقاييس النزعة المركزية شيوعا ويأخذ في الاعتبار ترتيب القيم وليس قيمتها. على
العكس في المتوسط الحسابي فهو يأخذ في الاعتبار القيمة وليس الموقع او الترتيب.
والوسيط هو القيمة الوسطى في البيانات بعد ترتيبها. وهي أيضا قيمة مركزية في
الموقع وليس في القيمة كما في الوسط الحسابي. ويعرف الوسيط بانه القيمة التي يقل
عنها نصف عدد القيم، ويزيد عنها النصف الاخر أي ان خمسين في المائة من القيم اقل
منه وخمسين في المائة من القيم اعلى منه، وفيما يلي حساب الوسيط في حالة البيانات
الغير مبوبة. والتي لا تحتوي على فئات.
يوجد حالتين لحساب
الوسيط، اما ان يكون عدد القيم المراد حساب الوسيط لها فرديا او زوجيا، في الحالة
الفردية فان الوسيط يكون هو القيمة التي تقع في منتصف البيانات بعد ترتيبها، مثلا
القيم 3 2 1 4 5، لحساب الوسيط لهذه البيانات يجب ترتيبها أولا لتكون 1 2 3 4 5
والقيمة التي تقع في المنتصف هي 3. حيث في الحالة الفردية تكون القيمة مباشرة. اما
في الحالة الزوجية، فيتم إيجاد متوسط القيمتين اللتان تقعان في المنتصف. مثلا،
القيم 10 13 9 15 لإيجاد الوسيط لها يجب ترتيبها أولا لتكون 9 10 13 15 ثم إيجاد
المتوسط الحسابي للقيمتين 10 و13 وهي 11.5 فيكون الوسيط هو 11.5.
يتم حساب الوسيط
في حالة البيانات المبوبة كالتالي: قبل إيجاد الوسيط حسابيا يجب تحديد الفئة التي
يقع فيها الوسيط وهي الفئة التي تتوسط الفئات الأخرى. ويوجد خطوات لإيجاد الوسيط
للبيانات المبوبة
·
نكون جدول التكرارات التجمعي الصاعد
·
نحدد رتبه الوسيط ورتبة الوسيط تساوى مجموع
التكرارات على 2
·
نستخدم العلاقة التالية للحصول على الوسيط
بداية الفئة الوسطية + (رتبة الوسيط – التكرار السابق / التكرار اللاحق – التكرار السابق)
* طول الفئة.
مزايا الوسيط
·
انه لا يتأثر بالقيم الشاذة او المتطرفة،
فمثلا في حالة وجود عدة اشخاص بأطوال تتراوح بين 173 و180 سم فان الوسيط سيعبر
بشكل جيد عن القيم الوسطى للبيانات حتى ان اضفنا قيمة شاذه مثل طول شخص لاعب كرة
سلة إليهم بطول 200 سم فان القيمة الوسطى ستظل ثابتة او قريبة جدا من القيمة
القديمة على عكسي الوسط الحسابي الذي تأثر جدا بالقيم الشاذة والمتطرفة
·
مبدأ حسابه وفكرته بسيطة وغير معقدة فقط
نحتاج الى ترتيب البيانات ثم التركيز على القيمة الوسطى للبيانات. وهي القيمة التي
موقعها دائما في منتصف البيانات ولا يحتاج الى حسابات معقدة.
·
كما قلنا في الوسط الحسابي فان مجموع
الانحرافات عن الوسط الحسابي تكون دائما صفر اما لو اخذنا قيما مطلقة فان الفائز
في هذه الحالة هو الوسيط من ناحية ان مجموع الانحرافات المطلقة الخاصة به اقل منها
في حالة الوسط الحسابي
عيوب الوسيط
·
لا يأخذ في الاعتبار القيم للبيانات ولكن
يأخذ في الاعتبار موقع البيانات وبذلك فان قيمته تكون احدى البيانات وليس قيمة
جديدة تعبر عنه وتعطيه استقلالية. وهذا غير مفيد أحيانا في حالة التطبيقات التي
تحتاج تضمين كل القيم في الحساب او اخذها في الاعتبار
·
مثله مثل الوسط الحسابي يصعب حسابه بالنسبة
للبيانات الوصفية مثل الجنسيات المختلفة او مثلا فصائل الدم او ألوان العيون للبشر
وهكذا.
·
من حيث معالجة الحاسب الالي فان سرعة معالجة
حسابات الوسط الحسابي أسرع بكثير من معالجة حسابات الوسيط لان الوسيط يحتاج الى
ترتيب البيانات وهذه يتم عملها بخوارزميات معقدة حيث ان الترتيب يحتاج البحث عن كل
القيم واخذ القيمة العليا ووضعها في اول القائمة ثم إيجاد القيمة التي تليها ثم
وضعها في القائمة وهكذا وهذا في حالة الترتيب التنازلي.
المنـــــــــوال:
يعرف المنوال بانه
القيمة الأكثر تكرارا او شيوعا بين البيانات ويكثر استخدامه في البيانات الوصفية،
لمعرفة النمط الشائع لشيء ما. وهو القيمة التي تكرر أكثر من غيرها من القيم. وأحيانا
يطلق عليه اسم " القيمة الشائعة" أي القيمة الأكثر شيوعا بين القيم
والمنوال من أكثر المتوسطات استخداما في الحياة التجارية، حيث يعتمد انتاج شركة
الملابس الجاهزة على هذه القيمة لتحديد المقاس الأكثر شيوعا من الملابس ومن ثم
التركيز على انتاج أكبر كمية من الملابس بالمقاس الأكثر شيوعا.
مثلا القيم الأتية
تمثل اعمار الأشخاص 25 55 29 42 29 34 29 29 21 فان قيمة المنوال هي القيمة التي
تكررت كثيرا في البيانات وهي 29 حيث انها تكررت أكثر من غيرها. أيضا يمكن حساب
المنوال للبيانات الوصفية مثل تقديرات الطلاب الأتية: جيد، ممتاز، جيد، جيد جدا،
مقبول، جيد، مقبول، فالمنوال في هذه الحالة هو جيد وهو القيمة الأكثر تكرار او
شيوعا بين التقديرات. نلاحظ انه في حالة الوسط الحسابي والوسيط لم نستطع القيام
بالحسابات لقيم وصفية ولكن في المنوال فان الحسابات للبيانات الوصفية ممكنة وهذه
الميزة الرئيسة للمنوال.
يمكن حساب المنوال
باستخدام جدول التكرارات حيث ان المنوال هي القيمة المناظرة لأكبر تكرار موجود.
نلاحظ أيضا ان المنوال في بعض البيانات يكون غير موجود بالمرة وخصوصا في البيانات
المستمرة التي تحتوي على كسور عشرية فمن الصعب جدا ان يتطابق رقمين على الأقل في
البيانات.
مزايا المنوال:
·
لا يتأثر بالقيم الشاذة الموجودة في وسط
البيانات وان القيم الشاذة هي بمثابة حالة فردية موجودة وسط البيانات ويكون لها
تأثير في حالة واحدة فقط وهي ان تكررت تلك القيم الشاذة بالبيانات.
·
يمتاز المنوال بسهولة حسابه يدويا حيث اننا
نحتاج فقط الى إيجاد القيم الأكثر تكرارا من غيرها. ومن الممكن أيضا ايجاده بشكل
مباشر من جدول التكرارات وهو القيمة المقابلة للفئة الأكثر تكرارا.
·
يمكن حساب المنوال للبيانات الوصفية على عكس
كلا من الوسط الحسابي والوسيط حيث لم يكن بالإمكان حساب الوسط الحسابي والوسيط
لذلك النوع من البيانات
عيوب المنوال:
·
القيم المستمرة عادة ليس لها منوال، وعديد من
الحالات من الممكن ان لا يوجد منوال للبيانات
- صعب الحساب بالنسبة للحاسبات مقارنة بالوسط الحسابي، حيث ان الخوارزمية تحتاج الى النظر في كل القيم لإيجاد كل قيمة منفردة ثم تعداد كم تكررت وهي خوارزميه ليست بسيطة بالنسبة للحاسب الالي.
No comments:
Post a Comment