tgoop.com/pytorch_howsam/571
Last Update:
مدل های o1🍓 و کنکور ریاضی!
دیشب ۱۲ سپتامبر شرکت OpenAI سری جدید مدل های خودش رو با نام o1 معرفی کرد، این مدل ها با یه ویژگی خاص طراحی شده ان، اینکه قبل از پاسخ دادن فکر کنن.
اما چطوری؟ راز این مدل ها استدلال زنجیره ای آن ها یا CoT-Reasoning هست.
اما Chain of Tought یا CoT(استدلال زنجیره ای) دقیقا چیه؟
مدلهای فعلی مثل سری GPT به صورت end-to-end کار میکنن، یعنی ورودی رو به خروجی تبدیل میکنن بدون اینکه خیلی بهش فکر کنن. این به معنی اینه که به سرعت جواب میدن بدون اینکه فرآیند استدلالی پشت جواب رو نشون بدن.
این روش چند مشکل داره:
۱. خیلی از مسائل نیاز به چند مرحله محاسبه یا استدلال دارن که مدلهای عادی ممکنه نتونن همه این مراحل رو در یک گام انجام بدن.
۲. چون مدل مستقیم به خروجی میرسه بدون اینکه استدلال کنه، در مسائل پیچیده احتمال رسیدن به جواب درست کمتر میشه و دقت مدل پایین میاد.
۳. ما نمیدونیم مدل چطور به جواب رسیده و شفافیتی در منطق استفاده شده برای تولید جواب وجود نداره.
اما در استدلال زنجیرهای، مدل به جای اینکه جواب نهایی رو فوری تولید کنه، مراحل مختلفی رو که شامل فرآیند فکر کردن هستن به صورت زنجیرهای تولید میکنه. یعنی مسئله رو به بخشهای کوچکتر تقسیم میکنه و هر بخش رو جداگانه پردازش میکنه و این مراحل رو گام به گام پیش میبره. این شبیه به کاریه که انسان برای حل مسائل پیچیده انجام میده، یعنی تبدیل مسئله به بخشهای کوچکتر و حل مرحله به مرحله.
این روش مشکلات بالا رو حل میکنه چون با پردازش مسئله به صورت گام به گام، هر مرحله به طور مجزا مدیریت میشه و احتمال خطا و از دست دادن اطلاعات مهم کم میشه. همچنین، استدلال استفاده شده توسط مدل به صورت شفاف قابل مشاهده است و ما میفهمیم که چرا مدل به این جواب رسیده.
پس در استدلال زنجیرهای، ورودی اولیه به مدل داده میشه و مدل به جای تولید جواب فوری، ورودی رو به اجزای مختلف تقسیم میکنه. این اجزا به مدل کمک میکنن که استدلالش رو به طور شفافتر و به صورت مرحله به مرحله بیان کنه و به نتایج دقیقتر و بهتری برسه.
تیم OpenAI گفته که هرچی مدل تایم بیشتری رو به فکر کردن اختصاص بده، نتایج بهتری به دست میاد.
این مدل ها که در دو نسخه preview و mini برای حل مسائل سخت و پیچیده علمی و کد نویسی منتشر شدن، عملکرد خوبی نشون دادن.
مدل mini سریعتره و تو کد نویسی عملکرد خوبی داره.
مدل preview مدل بزرگتر و قوی تر هست که پیشرفت چشمگیری نسبت به GPT-4o داشته و توی بنچمارک هایی که خود تیم OpenAI انجام داده، پیشرفت های خیلی بزرگی تو زمینه های علمی به خصوص ریاضیات صورت گرفته، به عنوان مثال:
مدل GPT-4o تونسته به 13 درصد سوالات المپیاد جهانی ریاضیات پاسخ بده اما o1-preview تونسته به 56 درصد سوالات پاسخ بده که خیلی خفنه!
جالبه بدونید مدل اصلی سری یعنی خود o1 به 83 درصد سوالات پاسخ داده!
همچنین این مدل ها تونستن به سطح دانش اموزان PhD در علوم فیزیک، شیمی و زیست شناسی برسن!
در سوالات برنامه نویسی رقابتی جزو 89 درصد برتر واقع شده !
یکی از دوستان زحمت کشیدن سوالات کنکور ریاضی امسال رو به مدل preview دادن و مدل موفق شده بعد از 9 دقیقه به تمام سوالات پاسخ صحیح بده!
دسترسی این مدل ها فعلا فقط برای بخش محدودی از کاربران ChatGPT Plus به صورت خیلی محدود باز شده، تعداد پیام های مجاز نسخه preview 30 پیام در هفته ست و مدل mini ، 50 پیام در هفته که عدد خیلی کمی هست.
همچنین از طریق API هم این مدل ها به صورت محدود(20 ریکوست در ثانیه) فقط برای کاربران سطح 5 (tier 5) قابل دسترسی هست یعنی کاربرانی که حداقل هزار دلار استفاده از API داشته اند.
قیمت استفاده از این مدل ها در API هم زیاد هست و به ازای 1 میلیون توکن ورودی و خروجی مدل preview به ترتیب باید 15 و 60 دلار پرداخت کنین و برای مدل mini به ترتیب 3 و 12 دلار باید پرداخت کنین که 80 درصد نسبت به مدل preview ارزون تر هست.
شرکت OpenAI اعلام کرده که قراره مدل مینی به صورت رایگان در دسترس همه کاربرا قرار بگیره که خبر خوبیه.
BY PyTorch Howsam
Share with your friend now:
tgoop.com/pytorch_howsam/571