تجزيء (إحصاء)

هذه هي النسخة الحالية من هذه الصفحة، وقام بتعديلها عبد العزيز (نقاش | مساهمات) في 01:54، 12 ديسمبر 2022 (بوت: إصلاح التحويلات). العنوان الحالي (URL) هو وصلة دائمة لهذه النسخة.

(فرق) → نسخة أقدم | نسخة حالية (فرق) | نسخة أحدث ← (فرق)

في الإحصاء وفي نظرية الاحتمال، يطلق اسم نقاط التجزيء أو نقاط التكسير [1] (بالإنجليزية: Quantiles)‏ على النقاط التي تقسّم مجال توزع احتمالي ما إلى اجزاء ذات احتمالية متساوية أو التي تقسم العينة الإحصائية إلى مجموعات متساوية بالحجم. دائما ما يكون عدد نقاط التجزيء أقل من عدد المجموعات الناتجة بواحد. على سبيل المثال، الرُبيعات وهي حالة خاصة من نقاط التجزيء، هي ثلاث نقاط تجزيء تقسم مجموعة عددية ما أو توزع احتمالي ما إلى أربع مجموعات متساوية (انظر الشكل الجانبي).

ثلاث نقاط تجزيء لدالة الكثافة الاحتمالية لتوزع احتمالي طبيعي. تقسم هذه النقاط التوزيع إلى أربع مجالات متساوية الاحتمال. يطلق على نقاط التجزيء الخاصة هذه اسم الرُّبَيعات (الربيع الأولQ1، الربيع الثاني Q2، والربيع الثالث Q3)

يطلق على نقاط التجزيء المميزة أسماء خاصة مثل الرُبيعات التي سبق ذكرها والمَئينات (التي تقسم المجموعة لمئة قسم) والعُشيرات (التي تقسم المجموعة لعشرة أجزاء). تجدر الإشارة إلى أن المجموعات الجزئية الناتجة عن نقاط التجزيء تسمى أسماء مختلفة عن أسماء نقاط التجزيء لتمييزها عن بعضها. على سبيل المثال المجموعات الجزئية الناتجة عن الربيعات تسمى أرباعا وعن العشيرات أعشارا وهكذا.

بشكل أعم، يطلق مصطلح نقاط تجزيء q (بالانكليزية Quantiles-q) على نقاط التجزيء التي تقسم مجموعة عددية ما إلى مجموعات متساوية الحجم (تقريبا) عددها q. يكون عدد نقاط التجزيء دائما هو q1.

في بعض الحالات قد لا تكون قيمة نقطة التجزيء قيمة وحيدة كما في حالة الوسيط لمجموعة مكونة من عدد زوجي من العناصر.

إذا علمنا دالة التوزيع التراكمي لمتحول ما فيمكن ايجاد نقاط تجزيء q لهذا التوزيع بتطبيق دالة التجزيء (وهي مقلوب دالة التوزيع التراكمي) على القيم

{1/q,2/q,...,(q1)/1}

نقاط التجزيء المشهورة

  • نقاط تجزيء-2 (2-Quantile) وهو الوسيط
  • نقاط تجزيء-3 ويطلق عليها الثليثات ويرمز لها بـ T (بالانكليزية tertiles)
  • نقاط تجزيء-4 وتسمى الربيعات ويرمز لها بـ Q (بالانكليزية quartiles) وهي ثلاث قيم Q1,Q2,Q3 ويسمى الفارق بين الربيع الأول والربيع الثالث Q3Q1 بالانحراف الربيعي
  • نقاط تجزيء-5 ويرمز لها بـ QU (بالانكليزية quintiles)
  • نقاط تجزيء-6 ويرمز لها بـ S (بالانكليزية sextiles)
  • نقاط تجزيء-7 (بالانكليزية septiles)
  • نقاط تجزيء-8 ويرمز لها بـ O (بالانكليزية octiles)
  • نقاط تجزيء-10 وتسمى عشيرات ويرمز لها بـ D (بالانكليزية deciles)
  • نقاط تجزيء-12 ويرمز لها بـ Dd (بالانكليزية duo-deciles)
  • نقاط تجزيء-16 ويرمز لها بـ H (بالانكليزية hexadeciles)
  • نقاط تجزيء-20 ويرمز لها بـ V (بالانكليزية ventiles)
  • نقاط تجزيء-33 ويرمز لها بـ TT (بالانكليزية trigintatreciles)
  • نقاط تجزيء-100 وتسمى المئينات ويرمز لها بـ P (بالانكليزية percentiles)
  • نقاط تجزيء-1000 ويرمز لها بـ Pr (بالانكليزية permilles)

حساب نقاط تجزيء مجتمع إحصائي

كما في حساب الخصائص الاحصائية المختلفة (كالانحراف المعياري) فإن طريقة حساب قيمة نقاط التجزيء تختلف بين حسابها لمجتمع إحصائي وحسابها لعينة احصائية.

في حالة الحساب لمجتمع مكون من قيم متقطعة أو من مجتمع مكون من قيم مستمرة فإن نقطة التجزيء رقم k هي قيمة عنصر المجتمع الذي تتقاطع عنده دالة التوزيع التراكمي للمجتمع مع المستقيم k/q. في صيغة أخرى يمكننا أن نقول عن x أنه نقطة التجزيء رقم k للمتحول X إذا تحقق:

Pr[X<x]k/q أو بصيغة أخرى Pr[Xx]1k/q

و

Pr[Xx]k/q أو بصيغة أخرى Pr[X>x]1k/q

لنفترض مجتمع إحصائي منتهي مكون من N عنصرا متساووا الاحتمال ومعنونين بأرقام 1,...,N من الأصغر إلى الأكبر، يمكن معرفة نقطة التجزيء رقم kمن نقاط التجزي-q لهذا المجتمع من خلال معرفة عنوانه I بتطبيق المعادلة I=Nk/p. إذا كان I عددا غير طبيعي يتم تقريب الناتج إلى العدد الطبيعي الأعلى للحصول على عنوان صحيح (أي أحد العناوين 1,...,N) يكون العنوان الناتج عندها هو عنوان نقطة التجزيء رقم k من نقاط التجزيء-q.

أمافي حال كان I عدد طبيعيا فيمكن اتخاذ قيمة نقطة التجزيء رقم k أيا من الاعداد الواقعة بين العدد ذو العنوان I و العدد ذو العنوان الذي يليه. لكن جرى العرف على اعتماد متوسط العددين ذوي العنوان I والعنوان I+1 كقيمة لنقطة التجزيء رقم k في هذه الحالة.

تقدير نقاط تجزيء عينة

إذا كان لدينا عنية مأخوذة من مجتمع إحصائي ما غير معلوم فإن التوزيع التراكمي للمجتمع ودالة التجزيء لن تكونا معروفتين. وبالتالي فإننا لايمكننا سوى تقدير قيم نقاط التجزيء في هذه الحالة. يوجد عدة طرق للقيام بذلك... تحتوي لغات البرمجة ماثماتيكا و ماتلاب و R و جنو أوكتف على تسع طرق حساب نقاط التجزيء. يحتوي SAS على خمس طرق، سي باي و قيقب على ثمانية، EViews على ست دوال متعددة التعريف، STATA يحتوي على طريقتين، وإكسل واحدة. يدعم Mathematica تطبيق طرق غير قياسية.

بشكل عام كل الطرق تحسب Qp، وهو تقدير لقيمة نقطة التجزيء رقم k من نقط التجزيء-q حيث أنp=k/q، لعينة ذات الحجم N بحساب العنوان h ذو القيمة عددية الحقيقية. إذا وجدنا أن h هو عدد طبيعي يكون عندها عنصر العينة N ذو العنوان h ولنسمه xh (بفرض ترتيب عناصر العينة من الأصغر للأكبر) يكون هذا العنصر هو تقديرنا لقيمة نقطة التجزيء رقم k للمجتمع. أما في حال كان h عددا غير طبيعي فيتم استخدام التقريب أو الاستيفاء لتقدير قيمة نقطة التجزيء رقم k.

المراجع

  1. ^ المصطلح العربي مأخوذ من صفحة المعهد الدولي للإحصاء. وصلة المصطلح. اطلع عليها في 19/3/2017. نسخة محفوظة 22 فبراير 2014 على موقع واي باك مشين.