13 نوامبر 2016
کامپیوترهایی که عقب نشینی میکنند
چند روزی است که رقابتهای جهانی قهرمانی شطرنج ۲۰۱۶ در نیویورک آغاز شده است، و قرار است پس از برپایی دوازده مسابقه میان دو مدعی عنوان قهرمانی، مگنوس کارلسن (از نروژ) و سرگئی کارجاکین (از روسیه)، قهرمان جهان در زمینه شطرنج مشخص شود. تا کنون، دو مسابقه برگزار شده است و هر یک از دو شرکت کننده، یک بازی را برده است.
امروزه، تقریبا همه میدانیم که اگر کامپیوترها وارد این مسابقات شوند، ما انسانها حرفی برای گفتن نداریم. کامپیوترها به راحتی میتوانند اساتید بزرگ شطرنج و هر انسان دیگری را مغلوب کنند. گری کاسپاروف افسانهای، در سال ۱۹۹۷ رقابت را به کامپیوتر دیپ بلو (Deep Blue) که ساخته IBM بود، واگذار کرد. داستان این رقابت و جزئیات آن را، میتوانید در این لینک [+] بخوانید. برای علاقهمندان به هوش مصنوعی و/یا شطرنج، قطعا جذاب خواهد بود.
اخیرا مطلب جالبی در خصوص تقابل و رقابت انسان و هوش مصنوعی در شطرنج میخواندم. در میان اظهار نظرهای مختلفی که توسط شطرنجبازان حرفهای در این مقاله آمده بود، این جملات از خانم سوزان پولگار، نظرم را به خود جلب کرد: «اگر خیلی واضح نباشد که بازیکن مجبور به عقب نشینی است، اغلب افراد تمایلی به عقب نشینی ندارند. اما اگر محاسبات یک کامپیوتر نشان دهد که عقب نشینی بهترین حرکت ممکن است، قطعا هیچ مانع روانی، از عقب نشینی کامپیوتر جلوگیری نخواهد کرد.»
این یک بیان تجربی از اصولی است که در حوزه هوش مصنوعی و در مبحث یادگیری تقویتی (Reinforcement Learning) مورد بحث قرار میگیرد. یک سیاست خوب برای یک عامل یاد گیرنده، الزاما یک سیاست حریصانه (Greedy) نیست؛ بسیاری از اوقات، واقعا باید از هدف دور شد. این یک مولفه مهم است که موجودات هوشمند غیر کربنی (کامپیوترها)، به خوبی آن را یاد گرفتهاند. اما پیچیدگیهای روانی افزوده شده به انسان، به عنوان یک پدیده جنبی، اغلب فرصت رسیدن به سیاستهای بهینه را از او میگیرد. به همین دلیل است که ما رقابت در شطرنج و بازی Go را به آنها باختهایم و قطعا باختهای ما، به این مقدار محدود نخواهد ماند.