tgoop.com/matlabtips/1702
Last Update:
اما این پایان راه نیست.
اگر بهجای آنکه تنها یک لایه از آینده را ببینیم، به عمقهای بیشتری فرو رویم، آنگاه میتوانیم از تابع امتیاز سادهتری استفاده کنیم، چرا که خود عمق محاسبه، بار پیشبینی را به دوش میکشد.
و اینجاست که هرس کردن درخت—با تکنیکهایی چون آلفا-بتا—ضرورت مییابد؛ (در اینجا به آن نمی پردازیم) برای آنکه این درخت، در وسعت بینهایت خود، ما را در پیچیدگی غرق نکند.
و ناگهان، در ژرفای این الگوریتم، چهرهای آشنا پدیدار میشود: لاپلاسین.
اپراتوری که زمانی تنها به عنوان توصیفگر گرما، جریان، یا احتمال میشناختیم، اینک در قلب نظریه بازیها سکونت گزیده.
مینیماکس، در جوهر خود، همان لاپلاس بینهایت (∞-Laplacian) است—حد نهایی لاپلاسین که در آن تصمیمها با قاطعیت مطلق گرفته میشوند: یا بیشینه، یا کمینه.
اما اگر تصمیمها را نرمتر بگیریم، اگر اندکی احتمال برای حرکتهای غیرمطلوب هم قائل شویم—چرا که دنیای واقعی سرشار از تصادف است—آنگاه دوباره به لاپلاسین معمول بازمیگردیم. پس:
مینیماکس و لاپلاسین، دو نسخهی یک اصلاند. یکی در خدمت انتخاب، دیگری در خدمت انتشار.
برای دریافت شهودی این حقیقت، بیایید بازی «فکر بکر» را در دوباره نظر بگیریم. در این بازی، ما با یک حدس تصادفی آغاز میکنیم. بازخوردی دریافت میکنیم. الگویی میسازیم. سپس دوباره حدس میزنیم. و این فرآیند—این یادگیری از بازخورد—در جوهر خود، چیزی جز یک مینیماکس ساده نیست.
در مدلهای انتشار (diffusion models) نیز همین روند برقرار است. ما از نویز (توزیع تصادفی یکنواخت یا گاوسین) شروع میکنیم، از آشوب، و با حرکت معکوس، به سمت ساختار میرویم. اینجا، یک شبکهی عصبی، همانند ذهن بازیکن، یاد گرفته است که چقدر هر وضعیت تصادفی از یک توزیع هدف فاصله دارد.
حرکت در این فضا، یعنی در «فضای امتیاز توزیعها»، همان اجرای مینیماکس است. با این تفاوت که در انتشار، جهت حرکت از نظم به بینظمیست؛ و در بازسازی، این مسیر برعکس پیموده میشود.
و قسمت شگفت انگیز آن است که اگر به شطرنج نگاه کنیم، میبینیم که آن نیز نوعی انتشار است. از یک وضعیت دلخواه (حالت اولیه را کنار بگذاریم که کاملا منظم است)، که تصادفی است بازی بهتدریج به سمت یک الگوی نهایی ساده که همان کیش و مات است، میرود. هر بازی، سفریست در فضا-زمان تصمیمات، و پیکربندی نهایی همان الگویی است که به دنبالش هستیم
BY MatlabTips
Share with your friend now:
tgoop.com/matlabtips/1702