Tensorflow(@CVision)@cvision P.4114

Tensorflow(@CVision)

این مقاله از محققیق اپل میگه در مسائل ساده، مدل‌ های زبانی معمولی که فاقد ساختارهای استدلالی پیشرفته هستن،عملکرد بهتری نسبت به مدل ‌های استدلال ‌محور (LRMs) دارن. علت این پدیده به احتمال زیاد در سادگی ساختار مسئله نهفته ست، جایی که استدلال پیچیده نه‌ تنها…

شاید بهتره که بپذیریم چیزی ‌بنام مدل‌های استدلالی بزرگ (LRMs) اساسا وجود نداره.LRM ها در واقع همون مدل ‌های زبانی بزرگ هستن که فقط بیشتر روی پاسخ خودشون تکرار و بازاندیشی میکنن، یا اطلاعات زمینه ‌ای بیشتری در اختیار خود قرار میدن.

حلقه‌ استدلال معادل اینه که به یک مدل زبانی معمولی بگیم «پاسخت رو اصلاح کن» یا «زمینه‌ بیشتری از این نوع خاص رو در نظر بگیر».

در واقع چیزی ‌بنام استدلال (reasoning) وجود نداره، همیشه صرفا راهکاری بوده برای کاهش پاسخ‌ های ساختگی(hallucination) یا افزودن خودکار اطلاعات زمینه‌ ای ، نه چیز دیگه.

شرکت‌های بزرگ یکی از ترفندهای ابتدایی مهندسی پرامپت رو که سال‌ها پیش بوجود اومده بود، در مدل هاشون تعبیه کردن، و در نهایت برای سود های کلان اون رو برند کردن.

قبلاً اینجا به صورت مفصل دربارش نوشتم:

https://www.tgoop.com/cvision/3770

Tensorflow(@CVision)

به نظرتون چطور میتونیم بدون صرف بودجه زیاد، آموزش مجدد، توانایی یه مدل زبانی رو توی استدلال کردن ارتقا بدیم؟

برای این کار ابتدا باید نگاهی به موضوع عدم ‌قطعیت در مدل‌های زبانی داشته باشیم و یه تعریف دقیق براش ارایه بدیم.

همونطور که میدونید توی مرحله نمونه‌…

❤12👍5

www.tgoop.com/cvision/4114

3.33K viewsAlister☄️, Jun 7 at 16:52

tgoop.com/cvision/4114

Create: 2025-06-07
Last Update: 2025-10-22 04:47:03

BY Tensorflow(@CVision)

Share with your friend now:
tgoop.com/cvision/4114

Telegram News