تبديل البحث
بحث
تبديل القائمة
1.2M
107
260
3.5M
أرابيكا
الموسوعة
الصفحة الرئيسة
الأحداث الجارية
أحدث التغييرات
أحدث التغييرات الأساسية
صفحات خاصة
رفع ملف
تصفح
المواضيع
أبجدي
بوابات
مقالة عشوائية
تصفح من غير إنترنت
مشاركة
تواصل مع أرابيكا
مساعدة
الميدان
sitesupport
في مشاريع أخرى
Toggle preferences menu
إشعارات
تبديل القائمة الشخصية
غير مسجل للدخول
سيكون عنوان الآيبي الخاص بك مرئيًا للعامة إذا قمت بإجراء أي تعديلات.
user-interface-preferences
أدوات شخصية
إنشاء حساب
دخول
عرض مصدر ألفازيرو
من أرابيكا، الموسوعة العربية الحرة
شارك هذه الصفحة
معاينة
اقرأ
عرض المصدر
تاريخ
associated-pages
مقالة
نقاش
المزيد من الإجراءات
→
ألفازيرو
ليس لك صلاحية تعديل هذه الصفحة، للسبب التالي:
الفعل الذي اعتزمته مقصور على المستخدمين أعضاء المجموعة:
مستخدمون
.
نص الصفحة:
{{بطاقة برمجية }} '''ألفازيرو''' أو '''ألفا زيرو''' {{إنج|AlphaZero}} هو [[برنامج (حاسوب)|برنامج حاسوب]] طورته شركة [[ديب مايند]] المتخصصة في أبحاث [[ذكاء اصطناعي|الذكاء الاصطناعي]] من أجل إتقان ألعاب ال[[شطرنج]] وال[[شوغي]] و[[غو]]. وتستخدم خوارزميته منهجا مماثلا لمنهج {{وإو|ألفاغو زيرو| AlphaGo Zero}}. أصدر فريق ديب مايند في 5 ديسمبر 2017 مطبوعة أولية عرّف فيها عن ألفازيرو، الذي حقق بعد 24 ساعة من التدريب مستوى لعب فاق مستوى البشر في هذه الألعاب الثلاثة وذلك بهزيمة البرامج أبطال العالم [[ستوكفيش]] وإلمو ونسخة 3 أيام من ألفاغو زيرو. استخدم ألفازيرو في كل حالة {{وإو|لغ=en|تر=Tensor Processing Unit|عر=وحدة معالجة موتر|نص=وحدات معالجة موتر}} ({{اختصار مخفي|TPUs|tensor processing units}}) مخصصة كانت برامج غوغل قد أُمثِلت لاستخدامها.<ref name=preprint>{{استشهاد بأرخايف|author-link1=David Silver (programmer)|first1=David|last1= Silver|first2=Thomas|last2= Hubert|first3= Julian|last3=Schrittwieser|first4= Ioannis|last4=Antonoglou |first5= Matthew|last5= Lai|first6= Arthur|last6= Guez|first7= Marc|last7= Lanctot|first8= Laurent|last8= Sifre|first9= Dharshan|last9= Kumaran|authorlink9=Dharshan Kumaran|first10= Thore|last10= Graepel|first11= Timothy|last11= Lillicrap|first12= Karen|last12= Simonyan|first13=Demis |last13=Hassabis|author-link13=Demis Hassabis |eprint=1712.01815|title=Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm|class=cs.AI|date=5 December 2017}}</ref> تدرب ألفازيرو عبر «اللعب مع الذات» فقط باستخدام 5000 وحدة معالجة موتر من الجيل الأول لتوليد المباريات و64 وحدة معالجة موتر من الجيل الثاني لتدريب [[الشبكة العصبية|الشبكات العصبية]]، كل هذا [[حوسبة متوازية|بالتوازي]] مع عدم الوصول إلى كتب الافتتاحيات أو جداول نهاية اللعب. بعد أربع ساعات من التدريب، قدَّرت ديب مايند أن ألفازيرو كان يلعب الشطرنج [[نظام تصنيف إيلو|بتصنييف إيلو]] أكبر من ستوكفيش 8، وبعد تسع ساعات من التدريب هزمت الخوارزميةُ ستوكفيش 8 في مقابلة موقتة من 100 مباراة (28 فوز، 0 خسارة و72 تعادل).<ref name="preprint"/><ref name=telegraph>{{استشهاد بخبر|مسار=https://www.telegraph.co.uk/science/2017/12/06/entire-human-chess-knowledge-learned-surpassed-deepminds-alphazero/|عنوان=Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours|الأخير=Knapton|الأول=Sarah|تاريخ=6 December 2017|ناشر=[[ديلي تلغراف]]|تاريخ الوصول=6 December 2017|الأخير2=Watson|الأول2=Leon|لغة=en-GB| مسار أرشيف = https://web.archive.org/web/20201202114556/https://www.telegraph.co.uk/science/2017/12/06/entire-human-chess-knowledge-learned-surpassed-deepminds-alphazero/ | تاريخ أرشيف = 2 ديسمبر 2020 }}</ref><ref>{{استشهاد بخبر|الأول=James|الأخير= Vincent|مسار=https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go|عنوان=DeepMind's AI became a superhuman chess player in a few hours, just for fun|ناشر=[[ذا فيرج]]|تاريخ=6 December 2017|تاريخ الوصول=6 December 2017| مسار أرشيف = https://web.archive.org/web/20201202111249/https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go | تاريخ أرشيف = 2 ديسمبر 2020 }}</ref> لعبت خوارزمية ألفازيرو المدربة على آلة وحيدة تملك أربع وحدات معالجة موتر. نُشرت الورقة العلمية الخاصة بألفازيرو من قبل ديب مايند في دورية [[ساينس]] في 7 ديسمبر 2018.<ref name="Science20181207">{{استشهاد بدورية محكمة|الأول1 = David|الأخير1 = Silver|مؤلف1-وصلة=David Silver (programmer)|الأول2 =Thomas |الأخير2 = Hubert|مؤلف2-وصلة=|الأول3 = Julian |الأخير3 =Schrittwieser|الأول4 = Ioannis |الأخير4 = Antonoglou|الأول5 = Matthew |الأخير5 = Lai|الأول6 =Arthur |الأخير6 = Guez|الأول7 = Marc |الأخير7 = Lanctot|الأول8 = Laurent |الأخير8 = Sifre|الأول9 = Dharshan |الأخير9 = Kumaran|الأول10= Thore |الأخير10= Graepel|الأول11= Timothy |الأخير11= Lillicrap|الأول12=Karen |الأخير12= Simonyan|الأول13= Demis |الأخير13= Hassabis|مؤلف13-وصلة=Demis Hassabis|عنوان = A general reinforcement learning algorithm that masters chess, shogi, and go through self-play|صحيفة = [[ساينس|Science]]| issn= |صفحات = 1140–1144|المجلد = 362|العدد = 6419|doi = 10.1126/science.aar6404|pmid = 30523106|تاريخ= 7 December 2018|bibcode =2018Sci...362.1140S|doi-access = free}}</ref> وفي 2019 نشرت ديب مايند ورقة جديدة تعطي تفاصيلا حول {{وإو|ميوزيرو|MuZero}} وهي خوارزمية جديدة قادرة على تعميم عمل ألفازيرو، بحيث تلعب كلًّا من ألعاب [[أتاري|آتاري]] و[[لعبة لوحية|ألعاب الرقعة]] من دون معرفة مسبقة باللعبة أو قوانينها.<ref>{{استشهاد بأرخايف|last=Schrittwieser|first=Julian|last2=Antonoglou|first2=Ioannis|last3=Hubert|first3=Thomas|last4=Simonyan|first4=Karen|last5=Sifre|first5=Laurent|last6=Schmitt|first6=Simon|last7=Guez|first7=Arthur|last8=Lockhart|first8=Edward|last9=Hassabis|first9=Demis|last10=Graepel|first10=Thore|last11=Lillicrap|first11=Timothy|date=2019-11-19|title=Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model|eprint=1911.08265|class=cs.LG}}</ref> {{حد فهرس|3}}
ارجع إلى
ألفازيرو
.
عرض مصدر ألفازيرو
من أرابيكا، الموسوعة العربية الحرة