معيار استبعاد الروبوتات

من أرابيكا، الموسوعة الحرة
اذهب إلى التنقل اذهب إلى البحث

معيار استبعاد الروبوتات ويعرف باسم آخر وهو بروتكول استبعاد الروبوتات (بالإنجليزية: Robots exclusion standard أو robots exclusion protocol أو ببساطة robots.txt)‏ وهو معيار يستخدم بواسطة أي موقع ويب للاتصال بزاحف الشبكة Web crawler أو أي روبوت موقع آخر، يحدد المعيار كيفية إبلاغ أي روبوت على شبكة الإنترنت عن الأماكن التي لا ينبغي أن تتم معالجتها أو المناطق التي لا يجب معرفتها، الروبوتات تستخدم بواسطة محركات البحث لكي تستطيع عمل تصنيف للمواقع، ليس كل الروبوتات تتعاون مع المعايير والمقاييس الدولية مثل حصاد البريد الإلكتروني وسبام بوت والبرمجيات الخبيثة، والروبوتات التي تبحث عن وتفحص الثغرات الأمنية، معيار استبعاد الروبوتات مقترن دائما بخريطة الموقع

نبذة تاريخية

تم اقتراح هذا المعيار بواسطة مارتن كوستر،[1][2] عندما كان يعمل في نكسر [English]،[3] في فبراير 1994.[4]

حول هذا المعيار

بعض محركات البحث الرئيسية تشمل هذا المعيار مثل بينج[5] ومحرك بحث ياهو! الذي تم ضمه لبينج وإيه أو إل[6] ومحرك بحث جوجل ومحرك بحث ياندكس وأسك دوت كوم،[7] ومحرك بحث بيدو.[8]

أمثلة

بعض الأمثلة على قدرات وما يتم كتابته في هذا الملف كالتالي:
مثال 1
يعطى ما هو مكتوب في المثال التالي قدرة على زيارة كل الروبوتات الموقع، الويلدكارد [English] (*) تعني كل ملفات الموقع وكلمة Disallow تعني عدم سماحية لكل الروبوتات
User-agent: *
Disallow:
نفس النتيجة يمكن أن تتحقق مع ملف robots.txt فارغ
مثال 3
المثال التالي يمنع الروبوتات من دخول ثلاث مجلدات (دليل):
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /junk/
مثال 4
المثال التالي لا يسمح بالتعامل مع ملف معين
User-agent: *
Disallow: /directory/file.html
لاحظ أن جميع الملفات الأخرى في الدليل المحدد سوف تتم معالجتها.
مثال 5
المثال التالي يمنع روبوت معين سيء من التعامل مع موقع الويب
User-agent: BadBot # replace 'BadBot' with the actual user-agent of the bot
Disallow: /
مثال 6
المثال التالي لاثنين من الروبوتات محدديين لعدم الدخول لدليل واحد محدد:
User-agent: BadBot # replace 'BadBot' with the actual user-agent of the bot
User-agent: Googlebot
Disallow: /private/
ملاحظة: يمكن استخدام هذه الطريقة لمنع البوتات لمحركات البحث عند عمل تطوير موقع وحتى الإنتهاء من تطويره حتى لا تلاحظ محركات البحث ذلك التغير ويتأثر الموقع

مثال 7

المثال التالي يوضح كيفية إظهار تعليقات comments يمكن استخدامها بدون تأثير نهائيا:
# Comments appear after the "#" symbol at the start of a line, or after a directive
User-agent: * # match all bots
Disallow: / # keep them out

انظر أيضا

مراجع

  1. ^ Martijn، Koster. "Martijn Koster". مؤرشف من الأصل في 23 سبتمبر 2018. اطلع عليه بتاريخ أغسطس 2020. {{استشهاد ويب}}: تحقق من التاريخ في: |تاريخ الوصول= (مساعدة)
  2. ^ Fielding، Roy (1994). "Maintaining Distributed Hypertext Infostructures: Welcome to MOMspider's Web". First International Conference on the World Wide Web. Geneva. مؤرشف من الأصل (PostScript) في 2017-11-20. اطلع عليه بتاريخ 2013-09-25.
  3. ^ "The Web Robots Pages". Robotstxt.org. 30 يونيو 1994. مؤرشف من الأصل في 2019-05-03. اطلع عليه بتاريخ 2013-12-29.
  4. ^ Koster، Martijn (25 فبراير 1994). "Important: Spiders, Robots and Web Wanderers". www-talk mailing list. مؤرشف من الأصل (Hypermail archived message) في 2013-10-29.
  5. ^ "Robots Exclusion Protocol: joining together to provide better documentation". مؤرشف من الأصل في 2019-03-26. اطلع عليه بتاريخ 2013-02-16.
  6. ^ "About AOL Search". مؤرشف من الأصل في 2017-06-06. اطلع عليه بتاريخ 2013-02-16.
  7. ^ "About Ask.com: Webmasters". مؤرشف من الأصل في 2013-03-28. اطلع عليه بتاريخ 2013-02-16.
  8. ^ "Baiduspider". مؤرشف من الأصل في 2013-08-06. اطلع عليه بتاريخ 2013-02-16.