زاحف مركز

الزاحف المركز أو الزاحف الموضعي هو زاحف الويب الذي يحاول تحميل صفحات الويب التي لها صلة بموضوع محدد مسبقا فقط أو مجموعة من المواضيع. يفترض الزاحف المركز عامة أن الموضوع فقط هو المعطى بينما يفترض الزحف المركز أيضا أن بعض الأمثلة المسماة المتعلقة والغير متعلقة بالصفحات متاحة. قدم الزحف الموضعي لأول مرة منكزر.^[1]^[2]

الاستراتيجيات

الزاحف المركز يرغب بشكل مثالي في تحميل صفحة ويب فقط المتعلقة بموضوع معين وتجنب تحميل كل الصفحات الأخرى. وبالتالي، فقد يتوقع الزاحف المركز تعلق رابطة ما بصفحة معينة قبل تحميل الصفحة فعليا. إن المتكهن يمكن أن يكون هو النص الرابط للروابط، تلك كانت الدراسة التي قام بها بينكرتون ^[3] في الزاحف الذي وضع في الأيام الأولى من الويب. في استعراض لخوارزميات الزاحف الموضعي بين مينكزر وآخرون ^[4] أن مثل هذه الاستراتيجيات البسيطة فعالة جدا في تتبع الارتباطات القصير، في حين أن تقنيات أكثر تطورا مثل تقوية التعليم والتكيف التطوري يمكن أن تعطي أداء أفضل لتتبع الارتباطات الطويل. يقترح ديليجنتي وآخرون^[5] استخدام المحتوى الكامل للصفحات التي تمت زيارتها بالفعل للاستدلال على التشابه بين القيادة والاستعلام والصفحات التي لم تتم زيارتها بعد.

في دراسة أخرى، يتم تحديد علاقة الصفحة بعد تحميل محتوياتها وترسل الصفحات ذات الصلة إلى فهرس المحتويات وتضاف عناوين الروابط التي وردت بها إلى حدود الزحف ويتم استبعاد الصفحات التي تندرج تحت الحد أقصى للصلة . إن أداء الزاحف المركز يعتمد في أغلب الأحيان على ثراء الروابط في الموض وع المحدد قيد البحث ويعتمد عادة البحث المركز على محرك بحث ويب عام لتوفير نقاط انطلاق.

المراجع

^ Menczer, F. (1997). ARACHNID: Adaptive Retrieval Agents Choosing Heuristic Neighborhoods for Information Discovery. In D. Fisher, ed., Proceedings of the 14th International Conference on Machine Learning (ICML97). Morgan Kaufmann. نسخة محفوظة 21 ديسمبر 2012 على موقع واي باك مشين.
^ Menczer, F. and Belew, R.K. (1998). Adaptive Information Agents in Distributed Textual Environments. In K. Sycara and M. Wooldridge (eds.) Proceedings of the 2nd International Conference on Autonomous Agents (Agents '98). ACM Press. نسخة محفوظة 21 ديسمبر 2012 على موقع واي باك مشين.
^ Pinkerton, B. (1994). Finding what people want: Experiences with the WebCrawler. In Proceedings of the First World Wide Web Conference, Geneva, Switzerland. نسخة محفوظة 28 يونيو 2017 على موقع واي باك مشين.
^ Menczer, F., Pant, G., and Srinivasan, P. (2004). Topical Web Crawlers: Evaluating Adaptive Algorithms. ACM Trans. on Internet Technology 4(4): 378–419. نسخة محفوظة 26 يناير 2020 على موقع واي باك مشين.
^ Diligenti, M., Coetzee, F., Lawrence, S., Giles, C. L., and Gori, M. (2000). Focused crawling using context graphs. In Proceedings of the 26th International Conference on Very Large Databases (VLDB), pages 527-534, Cairo, Egypt. نسخة محفوظة 21 ديسمبر 2012 على موقع واي باك مشين.

[1] Menczer, F. (1997). ARACHNID: Adaptive Retrieval Agents Choosing Heuristic Neighborhoods for Information Discovery. In D. Fisher, ed., Proceedings of the 14th International Conference on Machine Learning (ICML97). Morgan Kaufmann. نسخة محفوظة 21 ديسمبر 2012 على موقع واي باك مشين.

[2] Menczer, F. and Belew, R.K. (1998). Adaptive Information Agents in Distributed Textual Environments. In K. Sycara and M. Wooldridge (eds.) Proceedings of the 2nd International Conference on Autonomous Agents (Agents '98). ACM Press. نسخة محفوظة 21 ديسمبر 2012 على موقع واي باك مشين.

[3] Pinkerton, B. (1994). Finding what people want: Experiences with the WebCrawler. In Proceedings of the First World Wide Web Conference, Geneva, Switzerland. نسخة محفوظة 28 يونيو 2017 على موقع واي باك مشين.

[4] Menczer, F., Pant, G., and Srinivasan, P. (2004). Topical Web Crawlers: Evaluating Adaptive Algorithms. ACM Trans. on Internet Technology 4(4): 378–419. نسخة محفوظة 26 يناير 2020 على موقع واي باك مشين.

[5] Diligenti, M., Coetzee, F., Lawrence, S., Giles, C. L., and Gori, M. (2000). Focused crawling using context graphs. In Proceedings of the 26th International Conference on Very Large Databases (VLDB), pages 527-534, Cairo, Egypt. نسخة محفوظة 21 ديسمبر 2012 على موقع واي باك مشين.

[1]

[2]

[3]

[4]

[5]