صلاحية الاختبار

من أرابيكا، الموسوعة الحرة
اذهب إلى التنقل اذهب إلى البحث

صلاحية الاختبار هي المدى الذي يقيس فيه الاختبار (مثل الاختبار الكيميائي أو الفيزيائي أو الدراسي) ما يُفترَض قياسه بدقة. في مجالات الاختبار النفسي والاختبار التعليمي، «تشير الصلاحية إلى الدرجة التي تدعم بها الأدلة والنظريات تفسيرات درجات الاختبار الناجمة عن الاستخدامات المقترحة للاختبارات».[1] على الرغم من أن النماذج الكلاسيكية قسمت المفهوم إلى «صلاحيات» مختلفة (مثل صلاحية المحتوى، وصلاحية المعيار، وصلاحية الإنشاء)،[2] فإن الرأي السائد حاليًا هو أن الصلاحية بنية أحادية مفردة.[3]

تعتبر الصلاحية بشكل عام أهم قضية في الاختبار النفسي والتربوي[4] لأنها تتعلق بالمغزى الموضح في نتائج الاختبار. على الرغم من أن العديد من الكتب المدرسية تقدم الصلاحية كمنشأة ثابتة،[5] تطورت نماذج مختلفة من الصلاحية منذ أول توصيات منشورة لبناء اختبارات نفسية وتعليمية.[6] يمكن تصنيف هذه النماذج في مجموعتين أساسيتين: النماذج الكلاسيكية، والتي تشمل عدة أنواع من الصلاحية، والنماذج الحديثة، التي تقدم الصلاحية كمنشأة واحدة. تعيد النماذج الحديثة تنظيم «الصلاحيات» الكلاسيكية إمّا إلى «جوانب» الصلاحية أو «أنواع» الأدلة الداعمة للصلاحية.[1]

يمكن اختبار / التحقق من صلاحية الاختبار نفسه باستخدام اختبارات الموثوقية بين التصنيفات، والموثوقية ضمن التصنيفات وقابلية التكرار (موثوقية إعادة الاختبار)، وغيرها من السمات، وعادةً ما يتم ذلك من خلال عمليات تشغيل متعددة للاختبار تُقارَن نتائجها. يساعد التحليل الإحصائي في تحديد ما إذا كانت الاختلافات بين النتائج المختلفة كبيرة بما يكفي لتكون مشكلة أو صغيرة بشكل مقبول.

خلفية تاريخية

على الرغم من كون علماء النفس والمعلّمين على دراية بعدة جوانب من الصلاحية قبل الحرب العالمية الثانية، إلا أن طرق إثبات الصلاحية كانت مقيّدة بشكل عام بعلاقات درجات الاختبار مع بعض المعايير المعروفة.[7] تحت إشراف لِي كرونباخ، حاولت التوصيات الفنية لعام 1954 الخاصة بالاختبارات النفسية وتقنيات التشخيص توضيح وتوسيع نطاق الصلاحية من خلال تقسيمها إلى أربعة أجزاء: (أ) الصلاحية المتزامنة، (ب) الصلاحية التنبؤية، (ج) صلاحية المحتوى، (د) بناء الصلاحية.[8] قام منشور كرونباخ وميهل اللاحق بتجميع الصلاحية التنبؤية والمتزامنة في «التوجه المعياري»، الذي أصبح في نهاية المطاف صلاحية المعيار.

خلال العقود الأربعة التالية، عبّر العديد من واضعي النظريات، بمن فيهم كرونباخ نفسه،[9] عن استيائهم من نموذج الصلاحية هذا، ثلاثة-في-واحد.[10][11][12] وبلغت حججهم ذروتها في مقال صموئيل مسيك عام 1995 الذي وصف الصلاحية بأنها بنية واحدة، مؤلفة من ستة «جوانب». في رأيه، قد تتطلب الاستنتاجات المختلفة المقدّمة من درجات الاختبار أنواعًا مختلفة من الأدلة، ولكن لا تتطلب صلاحيات مختلفة.

تدوّن معايير عام 1999 للاختبارات التربوية والنفسية إلى حد كبير نموذج مسيك.[1] تصف هذه المعايير خمسة أنواع من الأدلة الداعمة للصلاحية التي تتضمن كل جانب من جوانب مسيك، ولا تذكر محتوى النماذج الكلاسيكية والمعيار وبناء الصلاحية.

مراجع

  1. ^ أ ب ت American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (1999) Standards for educational and psychological testing. Washington, DC: American Educational Research Association.
  2. ^ Guion, R. M. (1980). On trinitarian doctrines of validity. Professional Psychology, 11, 385-398.
  3. ^ Messick, S. (1995). Validity of psychological assessment: Validation of inferences from persons’ responses and performances as scientific inquiry into score meaning. American Psychologist, 50, 741-749.
  4. ^ Popham, W. J. (2008). All About Assessment / A Misunderstood Grail. Educational Leadership, 66(1), 82-83.
  5. ^ See the otherwise excellent text: Nitko, J.J., Brookhart, S. M. (2004). Educational assessment of students. Upper Saddle River, NJ: Merrill-Prentice Hall.
  6. ^ American Psychological Association, American Educational Research Association, & National Council on Measurement in Education. (1954). Technical recommendations for psychological tests and diagnostic techniques. Washington, DC: The Association.
  7. ^ Angoff, W. H. (1988). Validity: An evolving concept. In H. Wainer ‏ & H. Braun (Eds.), Test Validity (pp. 19-32). Hillsdale, NJ: Lawrence Erlbaum.
  8. ^ Cronbach, L. J., & Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302.
  9. ^ Cronbach, L. J. (1969). Validation of educational measures. Proceedings of the 1969 Invitational Conference on Testing Problems. Princeton, NJ: Educational Testing Service, 35-52.
  10. ^ Loevinger, J. (1957). Objective tests as instruments of psychological theory. Psychological Reports, 3, 634-694.
  11. ^ Tenopyr, M. L. (1977). Content-construct confusion. Personnel Psychology, 30, 47-54.
  12. ^ Guion, R. M. (1977). Content validity–The source of my discontent. Applied Psychological Measurement, 1, 1-10.