<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ar">
	<id>https://3rabica.org/index.php?action=history&amp;feed=atom&amp;title=%D9%87%D8%B1%D9%8A%D8%AA%D8%B1%D9%83%D8%B3</id>
	<title>هريتركس - تاريخ المراجعة</title>
	<link rel="self" type="application/atom+xml" href="https://3rabica.org/index.php?action=history&amp;feed=atom&amp;title=%D9%87%D8%B1%D9%8A%D8%AA%D8%B1%D9%83%D8%B3"/>
	<link rel="alternate" type="text/html" href="https://3rabica.org/index.php?title=%D9%87%D8%B1%D9%8A%D8%AA%D8%B1%D9%83%D8%B3&amp;action=history"/>
	<updated>2026-06-09T18:13:01Z</updated>
	<subtitle>تاريخ التعديل لهذه الصفحة في الويكي</subtitle>
	<generator>MediaWiki 1.43.7</generator>
	<entry>
		<id>https://3rabica.org/index.php?title=%D9%87%D8%B1%D9%8A%D8%AA%D8%B1%D9%83%D8%B3&amp;diff=1518236&amp;oldid=prev</id>
		<title>عبد العزيز: بوت: أضاف قالب:روابط شقيقة</title>
		<link rel="alternate" type="text/html" href="https://3rabica.org/index.php?title=%D9%87%D8%B1%D9%8A%D8%AA%D8%B1%D9%83%D8%B3&amp;diff=1518236&amp;oldid=prev"/>
		<updated>2023-06-05T05:11:11Z</updated>

		<summary type="html">&lt;p&gt;بوت: أضاف &lt;a href=&quot;/%D9%82%D8%A7%D9%84%D8%A8:%D8%B1%D9%88%D8%A7%D8%A8%D8%B7_%D8%B4%D9%82%D9%8A%D9%82%D8%A9&quot; title=&quot;قالب:روابط شقيقة&quot;&gt;قالب:روابط شقيقة&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;صفحة جديدة&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{بطاقة برمجية&lt;br /&gt;
 | الاسم                   = هيراتراكس&lt;br /&gt;
 | الاسم الأصلي             = Heritrix&lt;br /&gt;
 | الشعار                 = &lt;br /&gt;
 | لقطة                   = [[ملف:Heritrix-screenshot.png|250px]]&lt;br /&gt;
 | تعليق                  = لقطة لوحدة التحكم للمدير في هيراتراكس&lt;br /&gt;
 | لقطة طويلة             = &lt;br /&gt;
 | المؤلف                  =&lt;br /&gt;
 | المطور                  = &lt;br /&gt;
 | الإصدار                 = &lt;br /&gt;
 | آخر إصدار              =3.0.0&lt;br /&gt;
 | تاريخ آخر إصدار        = {{تاريخ بداية|2009|12|05}}&lt;br /&gt;
 | آخر إصدار تجريبي         =&lt;br /&gt;
 | تاريخ آخر إصدار تجريبي   =&lt;br /&gt;
 | تحديد متواتر            =&lt;br /&gt;
 | لغة البرمجة              = [[جافا (لغة برمجة)|جافا]]&lt;br /&gt;
 | نظام التشغيل           = [[لينكس]]/[[شبيه يونكس]]/[[مايكروسوفت ويندوز]]&lt;br /&gt;
 | المنصة                  =&lt;br /&gt;
 | الحجم                   =&lt;br /&gt;
 | اللغة                  = &lt;br /&gt;
 | الحالة                  =&lt;br /&gt;
 | النوعية                = [[زواحف الويب]]&lt;br /&gt;
 | الترخيص                 = [[رخصة جنو العمومية الصغرى]]&lt;br /&gt;
 | الموقع                  = http://crawler.archive.org&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;هيراتراكس&amp;#039;&amp;#039;&amp;#039; (&amp;#039;&amp;#039;&amp;#039;Heritrix&amp;#039;&amp;#039;&amp;#039;) هو زاحف [[أرشيف الإنترنت|أرشيف أنترنت]]، والذي صمم خصيصا [[أرشفة الويب|للأرشفة ويب]].&amp;lt;ref&amp;gt;{{استشهاد ويب| مسار = https://www.pro-linux.de/cgi-bin/DBApp/check.cgi?ShowApp..7646.100 | عنوان = معلومات عن هريتركس على موقع pro-linux.de | ناشر = pro-linux.de| مسار أرشيف = https://web.archive.org/web/20200408232456/https://www.pro-linux.de/cgi-bin/DBApp/check.cgi?ShowApp..7646.100 | تاريخ أرشيف = 8 أبريل 2020 }}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{استشهاد ويب| مسار = https://www.openhub.net/p/p_w_4643 | عنوان = معلومات عن هريتركس على موقع openhub.net | ناشر = openhub.net| مسار أرشيف = https://web.archive.org/web/20200408232449/https://www.openhub.net/p/p_w_4643 | تاريخ أرشيف = 8 أبريل 2020 }}&amp;lt;/ref&amp;gt; فهو [[مصدر مفتوح|مفتوح المصدر]] ومكتوب ب[[جافا (لغة برمجة)|لغة جافا]]. الواجهة الرئيسية للوصول باستخدام [[متصفح ويب]]، وهناك [[واجهة سطر الأوامر|أداة سطر الأوامر]] التي يمكن اختياريا استخدامها لبدء بالزحف.&lt;br /&gt;
طور هيراتراكس بالاشتراك مع أرشيف الإنترنت والمكتبات الوطنية في الشمال المواصفات المكتوبة في أوائل عام [[2003]]. وكان إطلاقه الرسمي في أول يناير [[2004]]، وتم تحسينها باستمرار من قبل العاملين في أرشيف الإنترنت وغيرها من الأطراف المهتمة.&lt;br /&gt;
== مشاريع استخدمت هيراتراكس ==&lt;br /&gt;
وهناك عدد من المنظمات والمكتبات الوطنية تستخدم هيراتراكس، من بينها:&lt;br /&gt;
&lt;br /&gt;
* [[المكتبة الوطنية الفرنسية|مكتبة فرنسا الوطنية]]&lt;br /&gt;
* [[المكتبة البريطانية]]&lt;br /&gt;
* [http://was.cdlib.org/ مكتبة كاليفورنيا الرقمية لخدمات أرشفة الويب]&lt;br /&gt;
* [[سيتي سير إكس]] (CiteSeerX)&lt;br /&gt;
* [http://www.cbi.umn.edu/documentinginternet2/ توثيق انترنت2]&lt;br /&gt;
* [[أرشيف ومكتبة كندا]]&lt;br /&gt;
* [[مكتبة الجامعة والوطنية في أيسلندا]]&lt;br /&gt;
* [[المكتبة الوطنية الفنلندية]]&lt;br /&gt;
* [[المكتبة الوطنية في نيوزيلندا]]&lt;br /&gt;
* [http://netarkivet.dk/ Netarkivet.dk]&lt;br /&gt;
* [http://www.onb.ac.at/about/webarchivierung.htm المكتبة الوطنية النمساوية، أرشفة الويب]&lt;br /&gt;
* [http://archive.bibalex.org المكتبة الأسكندرية لارشفة الإنترنت]&lt;br /&gt;
== قوس الملفات ==&lt;br /&gt;
في الاصل تخزن هيراتراكس موارد الإنترنت التي تزحف عليها في ملف القوس. هذا القوس ليست لها علاقة كليا لمركز البحوث الزراعية (تنسيق ملف). وقد استخدم هذا الشكل من أرشيف الإنترنت منذ عام 1996 لتخزين الأرشيف على شبكة الويب. ويمكن أيضا [https://web.archive.org/web/20170318225733/http://www.digitalpreservation.gov/formats/fdd/fdd000236.shtml تنسيق الملف WARC]، مماثلة لـARC ولكن أكثر دقة ومرونة. يمكن أيضا أن يتم تكوين هيراتراكس لتخزين الملفات في شكل دليل مشابهة لزاحف [[وجت]] المستخدم عنوان إلى اسم الدليل واسم كل مورد.&lt;br /&gt;
يقوم ملف القوس بتخزين متعددة الموارد المؤرشفة في ملف واحد من أجل تجنب إدارة عدد كبير من الملفات الصغيرة. يتكون الملف من سلسلة من السجلات العنوان، كل رأس يحتوي [[بيانات وصفية]] حول كيفية طلب الموارد تليها راس HTTP والاستجابة لها. ملفات القوس تتراوح ما بين 100 حتي 600 ميغا بايت.&lt;br /&gt;
على سبيل المثال:&lt;br /&gt;
&lt;br /&gt;
 filedesc://IA-2006062.arc 0.0.0.0 20060622190110 text/plain 76&lt;br /&gt;
 1 1 InternetArchive&lt;br /&gt;
 URL IP-address Archive-date Content-type Archive-length&lt;br /&gt;
&lt;br /&gt;
 &amp;lt;nowiki&amp;gt;http://foo.edu:80/hello.html&amp;lt;/nowiki&amp;gt; 127.10.100.2 19961104142103 text/html 187&lt;br /&gt;
 HTTP/1.1 200 OK&lt;br /&gt;
 Date: Thu, 22 Jun 2006 19:01:15 GMT&lt;br /&gt;
 Server: Apache&lt;br /&gt;
 Last-Modified: Sat, 10 Jun 2006 22:33:11 GMT&lt;br /&gt;
 Content-Length: 30&lt;br /&gt;
 Content-Type: text/html&lt;br /&gt;
&lt;br /&gt;
 &amp;lt;html&amp;gt;&lt;br /&gt;
 Hello World!!!&lt;br /&gt;
 &amp;lt;/html&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== ادوات لمعالجة ملفات القوس ===&lt;br /&gt;
&lt;br /&gt;
هيراتراكس يتضمن أداة سطر الأوامر تسمى arcreader والتي يمكن استخدامها لاستخراج محتويات ملف القوس. الأمر التالي يسرد كافة عناوين المواقع والبيانات المخزنة في ملف القوس معين (بصيغة CDX) :&lt;br /&gt;
&lt;br /&gt;
 arcreader IA-2006062.arc&lt;br /&gt;
&lt;br /&gt;
الأمر التالي مقتطفات hello.html من المثال أعلاه بافتراض السجل يبدأ عند إزاحة 140:&lt;br /&gt;
&lt;br /&gt;
 arcreader -o 140 -f dump IA-2006062.arc&lt;br /&gt;
&lt;br /&gt;
أدوات أخرى:&lt;br /&gt;
* [http://wiki.lib.umn.edu/DI2/HowToCrawl أدوات معالجة القوس]&lt;br /&gt;
* [https://web.archive.org/web/20190722194633/http://archive-access.sourceforge.net/projects/wera/ WERA (Web ARchive Access)]&lt;br /&gt;
== أداة سطر الأوامر ==&lt;br /&gt;
هيراتراكس يأتي مع أدوات سطر الأوامر عدة:&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;htmlextractor&amp;#039;&amp;#039;&amp;#039; - يعرض وصلات لاستخراج هيراتراكس بعنوان معين&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;hoppath.pl&amp;#039;&amp;#039;&amp;#039; - يعيد المسار هوب (طريق وصلات) إلى عنوان محدد من الزحف الانتهاء&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;manifest_bundle.pl&amp;#039;&amp;#039;&amp;#039; - حزم في جميع الموارد المشار إليه بواسطة ملف الزحف واضح إلى غير مضغوط أو مضغوط الكرة القطران&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;cmdline-jmxclient&amp;#039;&amp;#039;&amp;#039; - تمكن سطر الأوامر السيطرة على هيراتراكس&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;arcreader&amp;#039;&amp;#039;&amp;#039; - مقتطفات محتويات الملفات القوس (انظر أعلاه)&lt;br /&gt;
&lt;br /&gt;
== انظر أيضًا ==&lt;br /&gt;
&lt;br /&gt;
* [[أرشيف الإنترنت]]&lt;br /&gt;
== المراجع ==&lt;br /&gt;
{{بداية المراجع}}&lt;br /&gt;
* {{استشهاد بمنشورات مؤتمر| مؤلف = Mohr, G., Kimpton, M., Stack, M., Ranitovic, I. | سنة = 2004 | عنوان = Introduction to Heritrix, an archival quality web crawler | عنوان الكتاب = Proceedings of the 4th International Web Archiving Workshop (IWAW’04) | مسار = http://www.iwaw.net/04/Mohr.pdf |مسار أرشيف= https://web.archive.org/web/20160416132702/http://www.iwaw.net/04/Mohr.pdf|تاريخ أرشيف=2016-04-16}}&lt;br /&gt;
* {{استشهاد بمنشورات مؤتمر| مؤلف = Sigurðsson, K. | سنة = 2005 | عنوان = Incremental crawling with Heritrix | عنوان الكتاب = Proceedings of the 5th International Web Archiving Workshop (IWAW’05) | مسار = http://www.iwaw.net/05/papers/iwaw05-sigurdsson.pdf |مسار أرشيف= https://web.archive.org/web/20160602201239/http://www.iwaw.net/05/papers/iwaw05-sigurdsson.pdf|تاريخ أرشيف=2016-06-02}}&lt;br /&gt;
{{نهاية المراجع}}&lt;br /&gt;
== وصلات خارجية ==&lt;br /&gt;
* {{روابط برمجيات}}&lt;br /&gt;
أدوات حسب أرشيف الإنترنت:&lt;br /&gt;
* [https://web.archive.org/web/20180215120453/http://crawler.archive.org هيراتراكس - الموقع الرسمي]&lt;br /&gt;
* [https://web.archive.org/web/20200601200850/http://archive-access.sourceforge.net/projects/nutch/ NutchWAX] - البحث في مجموعات ارشيف الويب&lt;br /&gt;
* [https://web.archive.org/web/20200601203425/http://archive-access.sourceforge.net/projects/wayback/ Wayback (Open source Wayback Machine)] - بحث وتصفح الويب باستخدام مجموعات الأرشيف NutchWax&lt;br /&gt;
&lt;br /&gt;
روابط لأدوات لها علاقة:&lt;br /&gt;
* [http://www.archive.org/web/researcher/ArcFileFormat.php تنسيق أو امتداد ملف القوس]&lt;br /&gt;
* [https://web.archive.org/web/20191112064010/http://crawler.archive.org/faq.html طريقة تشغيل هيراتراكس على ويندوز]&lt;br /&gt;
* [https://web.archive.org/web/20190722194633/http://archive-access.sourceforge.net/projects/wera/ WERA (Web ARchive Access)] - بحث وتصفح الويب باستخدام مجموعات الأرشيف NutchWAX&lt;br /&gt;
&lt;br /&gt;
== المراجع ==&lt;br /&gt;
{{مراجع|2}} {{أرشيف الإنترنت}}&lt;br /&gt;
{{روابط شقيقة}}&lt;br /&gt;
{{شريط بوابات|برمجيات|برمجيات حرة|علم الحاسوب}}&lt;br /&gt;
&lt;br /&gt;
[[تصنيف:أرشيف الويب]]&lt;br /&gt;
[[تصنيف:برمجيات مايكروسوفت ويندوز]]&lt;br /&gt;
[[تصنيف:برمجيات 2014]]&lt;br /&gt;
[[تصنيف:برمجيات تستخدم رخصة جنو العمومية]]&lt;br /&gt;
[[تصنيف:برمجيات محركات بحث]]&lt;br /&gt;
[[تصنيف:برمجيات يونكس]]&lt;br /&gt;
[[تصنيف:بروتوكول نقل النص الفائق]]&lt;br /&gt;
[[تصنيف:زواحف ويب مجانية]]&lt;/div&gt;</summary>
		<author><name>عبد العزيز</name></author>
	</entry>
</feed>