tgoop.com/pytorch_howsam/612
Last Update:
بریدهای از کتاب Hands-on LLMs!
در فصل 6 کتاب، درباره مهندسی پرامپت (Prompt Engineering) صحبت شده. در یکی از بخشهای این فصل درباره استدلال یا Reasoning در مدلهای مولد توضیح داده شده. در ادامه، خلاصه این بخش رو آوردم...
کتاب، قبل از اینکه درباره استدلال در مدلهای مولد صحبت کنه، به استدلال در انسان اشاره میکنه. گریزی به کتاب معروف Thikning, Fast and Slow اثر Daniel Kahneman میزنه. این کتاب درباره روشهای فکر کردن انسانهاست و ارتباطی به هوش مصنوعی نداره. این کتاب میگه، به طور کلی، روشهای فکر کردن ما به دو دسته تقسیم میشن: سیستم ۱ و سیستم ۲؛ سیستم ۱ خودکار و سریع هست؛ مثل وقتی که یک چیزی رو سریع حدس میزنی یا احساسی تصمیم میگیری. این سیستم شبیه مدلهای مولد هست که بدون فکر کردن، خروجی تولید میکنن. از طرف دیگه، سیستم ۲، آهستهتر و منطقیتر هست؛ مثلا، وقتی که با دقت فکر میکنی یا یک مساله پیچیده ریاضی حل میکنی. حالا، در LLM تلاش میشه که سیستم 2 پیادهسازی بشه تا مدل قبل از پاسخ دادن، فکر کنه.
کتاب دو روش استدلال رو معرفی میکنه:
1. زنجیره تفکر (Chain-of-Tought)
2. درخت تفکر (Tree-of-Tought)
1. روش Chain-of-Tought:
به جای اینکه مدل مستقیم و سریع پاسخ رو تولید کنه، مراحل فکری رسیدن رو هم نشون میده. مثلا، وقتی یک سوال حل مسئله ریاضی بهش داده میشه، اول فرآیند فکر کردن رو مرحله به مرحله توضیح میده و بعد به جواب نهایی میرسه. این کار باعث میشه مدلها در حل مسائل پیچیده بهتر عمل کنن. این تکنیک شبیه روشی هست که آدمها موقع فکر کردن استفاده میکنن؛ یعنی، اول استدلال و بعد نتیجهکیری.
2. روش Tree-of-Thought:
روش پیشرفتهتری نسبت به Chain-of-Thought هست. توی این روش، به جای اینکه مدل فقط یک مسیر خطی از فکر کردن رو دنبال کنه، چندین مسیر فکری مختلف رو بررسی میکنه؛ مثل یک درخت که شاخههای مختلف داره. هر شاخه نماینده یک راهحل یا یک استدلال متفاوت هست. مدل این شاخهها رو ارزیابی میکنه و بهترینشون رو انتخاب میکنه تا به جواب بهتری برسه. تصویر پیوستی مربوط به همین روش استدلال درختی هست.
کتاب Hands-on LLMs رو قبلا اینجا معرفی کردم. کتاب خوبی هست. خودم هم به تازگی مطالعه این کتاب رو تموم کردم.
@pytorch_howsam
BY PyTorch Howsam

Share with your friend now:
tgoop.com/pytorch_howsam/612