يرجى مراجعة هذه المقالة وإزالة وسم المقالات غير المراجعة، ووسمها بوسوم الصيانة المناسبة.

غابة عشوائية

من أرابيكا، الموسوعة الحرة
اذهب إلى التنقل اذهب إلى البحث
غابة عشوائية

الغابة العشوائية أو الغابات العشوائية (بالإنجليزية: Random forest)‏ عبارة عن خوارزمية للتعلم الآلي تم تطويرها بناءً على مجموعة من أشجار القرار.[1][2] تستخدم هذه الخوارزمية للتصنيف، الانحدار ومهام أخرى. عادةً ما تتمتع خوارزمية الغابة العشوائية بدقة أفضل مقارنة بشجرة القرار.[2][3]

تاريخ

أول شخص ابتكر خوارزمية الغابة العشوائية كان تيم هو في 1995. تم تحسين هذه الخوارزمية بواسطة ليو بريمان.[4]

طريقة

لإنشاء غابة عشوائية، يجب تقسيم البيانات إلى مجموعات جزئية عشوائية متعددة. ثم يتم تدريب شجرة لكل مجموعة جزئية. سيكون لكل شجرة تنبؤها الخاصة لكل مثال جديد قادم. سيتم تحديد التنبؤ النهائي للنموذج عن طريق التصويت.[3][5]

أهمية المتغيرات

يمكن لخوارزمية الغابة العشوائية ترتيب المتغيرات بناءً على أهميتها. الصيغة الأساسية لتقييم الأهمية هي نفس صيغة شجرة القرار (على سبيل المثال الانتروبيا أو معامل جيني). الفرق الوحيد هو أنه سيتم حساب متوسط درجات الأهمية للأشجار المختلفة.[1][2]

المراجع

  1. ^ أ ب Piryonesi، S. M.؛ El-Diraby، T. E. (2020) [Published online: December 21, 2019]. "Data Analytics in Asset Management: Cost-Effective Prediction of the Pavement Condition Index". Journal of Infrastructure Systems. ج. 26 ع. 1. DOI:10.1061/(ASCE)IS.1943-555X.0000512.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: url-status (link)
  2. ^ أ ب ت T. Hastie, R. Tibshirani, and J. Friedman, “The Elements of Statistical Learning,” Bayesian Forecast. Dyn. Model., vol. 1, pp. 1–694, 2009. {{استشهاد بكتاب}}: يحتوي الاستشهاد على وسيط غير معروف وفارغ: |بواسطة= (مساعدة)
  3. ^ أ ب Piryonesi, S. Madeh; El-Diraby, Tamer E. (2020-06). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements (بEnglish). 146 (2): 04020022. DOI:10.1061/JPEODX.0000175. ISSN:2573-5438. Archived from the original on 2020-09-15. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (help)
  4. ^ Breiman، Leo (2001). "Random Forests". Machine Learning. ج. 45 ع. 1: 5–32. DOI:10.1023/A:1010933404324. مؤرشف من الأصل في 2020-09-17.
  5. ^ Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking. " O'Reilly Media, Inc.". {{استشهاد بكتاب}}: يحتوي الاستشهاد على وسيط غير معروف وفارغ: |بواسطة= (مساعدة)