عرض مصدر ألفازيرو

{{بطاقة برمجية
}}
'''ألفازيرو''' أو '''ألفا زيرو''' {{إنج|AlphaZero}} هو [[برنامج (حاسوب)|برنامج حاسوب]] طورته شركة [[ديب مايند]] المتخصصة في أبحاث [[ذكاء اصطناعي|الذكاء الاصطناعي]] من أجل إتقان ألعاب ال[[شطرنج]] وال[[شوغي]] و[[غو]]. وتستخدم خوارزميته منهجا مماثلا لمنهج {{وإو|ألفاغو زيرو| AlphaGo Zero}}.

أصدر فريق ديب مايند في 5 ديسمبر 2017 مطبوعة أولية عرّف فيها عن ألفازيرو، الذي حقق بعد 24 ساعة من التدريب مستوى لعب فاق مستوى البشر في هذه الألعاب الثلاثة وذلك بهزيمة البرامج أبطال العالم [[ستوكفيش]] وإلمو ونسخة 3 أيام من ألفاغو زيرو. استخدم ألفازيرو في كل حالة {{وإو|لغ=en|تر=Tensor Processing Unit|عر=وحدة معالجة موتر|نص=وحدات معالجة موتر}} ({{اختصار مخفي|TPUs|tensor processing units}}) مخصصة كانت برامج غوغل قد أُمثِلت لاستخدامها.<ref name=preprint>{{استشهاد بأرخايف|author-link1=David Silver (programmer)|first1=David|last1= Silver|first2=Thomas|last2= Hubert|first3= Julian|last3=Schrittwieser|first4= Ioannis|last4=Antonoglou |first5= Matthew|last5= Lai|first6= Arthur|last6= Guez|first7= Marc|last7= Lanctot|first8= Laurent|last8= Sifre|first9= Dharshan|last9= Kumaran|authorlink9=Dharshan Kumaran|first10= Thore|last10= Graepel|first11= Timothy|last11= Lillicrap|first12= Karen|last12= Simonyan|first13=Demis |last13=Hassabis|author-link13=Demis Hassabis |eprint=1712.01815|title=Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm|class=cs.AI|date=5 December 2017}}</ref> تدرب ألفازيرو عبر «اللعب مع الذات» فقط باستخدام 5000 وحدة معالجة موتر من الجيل الأول لتوليد المباريات و64 وحدة معالجة موتر من الجيل الثاني لتدريب [[الشبكة العصبية|الشبكات العصبية]]، كل هذا [[حوسبة متوازية|بالتوازي]] مع عدم الوصول إلى كتب الافتتاحيات أو جداول نهاية اللعب. بعد أربع ساعات من التدريب، قدَّرت ديب مايند أن ألفازيرو كان يلعب الشطرنج [[نظام تصنيف إيلو|بتصنييف إيلو]] أكبر من ستوكفيش 8، وبعد تسع ساعات من التدريب هزمت الخوارزميةُ ستوكفيش 8 في مقابلة موقتة من 100 مباراة (28 فوز، 0 خسارة و72 تعادل).<ref name="preprint"/><ref name=telegraph>{{استشهاد بخبر|مسار=https://www.telegraph.co.uk/science/2017/12/06/entire-human-chess-knowledge-learned-surpassed-deepminds-alphazero/|عنوان=Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours|الأخير=Knapton|الأول=Sarah|تاريخ=6 December 2017|ناشر=[[ديلي تلغراف]]|تاريخ الوصول=6 December 2017|الأخير2=Watson|الأول2=Leon|لغة=en-GB| مسار أرشيف = https://web.archive.org/web/20201202114556/https://www.telegraph.co.uk/science/2017/12/06/entire-human-chess-knowledge-learned-surpassed-deepminds-alphazero/ | تاريخ أرشيف = 2 ديسمبر 2020 }}</ref><ref>{{استشهاد بخبر|الأول=James|الأخير= Vincent|مسار=https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go|عنوان=DeepMind's AI became a superhuman chess player in a few hours, just for fun|ناشر=[[ذا فيرج]]|تاريخ=6 December 2017|تاريخ الوصول=6 December 2017| مسار أرشيف = https://web.archive.org/web/20201202111249/https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go | تاريخ أرشيف = 2 ديسمبر 2020 }}</ref> لعبت خوارزمية ألفازيرو المدربة على آلة وحيدة تملك أربع وحدات معالجة موتر.

نُشرت الورقة العلمية الخاصة بألفازيرو من قبل ديب مايند في دورية [[ساينس]] في 7 ديسمبر 2018.<ref name="Science20181207">{{استشهاد بدورية محكمة|الأول1 = David|الأخير1 = Silver|مؤلف1-وصلة=David Silver (programmer)|الأول2 =Thomas |الأخير2 = Hubert|مؤلف2-وصلة=|الأول3 = Julian |الأخير3 =Schrittwieser|الأول4 = Ioannis |الأخير4 = Antonoglou|الأول5 = Matthew |الأخير5 = Lai|الأول6 =Arthur |الأخير6 = Guez|الأول7 = Marc |الأخير7 = Lanctot|الأول8 =  Laurent |الأخير8 = Sifre|الأول9 = Dharshan |الأخير9 = Kumaran|الأول10= Thore |الأخير10= Graepel|الأول11= Timothy |الأخير11= Lillicrap|الأول12=Karen |الأخير12= Simonyan|الأول13= Demis |الأخير13= Hassabis|مؤلف13-وصلة=Demis Hassabis|عنوان = A general reinforcement learning algorithm that masters chess, shogi, and go through self-play|صحيفة = [[ساينس|Science]]| issn= |صفحات = 1140–1144|المجلد = 362|العدد = 6419|doi = 10.1126/science.aar6404|pmid = 30523106|تاريخ= 7 December 2018|bibcode =2018Sci...362.1140S|doi-access = free}}</ref> وفي 2019 نشرت ديب مايند ورقة جديدة تعطي تفاصيلا حول {{وإو|ميوزيرو|MuZero}} وهي خوارزمية جديدة قادرة على تعميم عمل ألفازيرو، بحيث تلعب كلًّا من ألعاب [[أتاري|آتاري]] و[[لعبة لوحية|ألعاب الرقعة]] من دون معرفة مسبقة باللعبة أو قوانينها.<ref>{{استشهاد بأرخايف|last=Schrittwieser|first=Julian|last2=Antonoglou|first2=Ioannis|last3=Hubert|first3=Thomas|last4=Simonyan|first4=Karen|last5=Sifre|first5=Laurent|last6=Schmitt|first6=Simon|last7=Guez|first7=Arthur|last8=Lockhart|first8=Edward|last9=Hassabis|first9=Demis|last10=Graepel|first10=Thore|last11=Lillicrap|first11=Timothy|date=2019-11-19|title=Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model|eprint=1911.08265|class=cs.LG}}</ref>
{{حد فهرس|3}}