tgoop.com/ai_python/17781
Last Update:
این ویدیو دربارهی مدل o4-mini در چارچوب Azure OpenAI Service صحبت میکنه، و تمرکز اصلیاش روی تکنیک Reinforcement Fine-Tuning هست.
همون طور که می دونید، Azure OpenAI Service یک پلتفرم ابری از مایکروسافت هست که مدلهای زبانی OpenAI (مثل GPT) رو در اختیار سازمانها قرار میده.
👉 @ai_python ✍️
حالا سوال شبهه برانگیز در این جا اینه که چرا در عنوان و در خود این ویدیو از کلمه Service استفاده شده؟ در واقع بهش میگن «سرویس» چون در قالب یک سرویس ابری ارائه میشه؛ یعنی کاربران بدون نیاز به Deploy در سیستم های لوکال یا On Prem بعد از اینکه آن را به این روش فاین تیون کردند یا پیاده سازی های پیچیده، میتونن از طریق API یا رابط کاربری بهش دسترسی داشته باشن. (اندپوینت سرورلس)
👉 @ai_python ✍️
سه کاربرد مهم این روش:
اجرای قوانین سفارشی
درک بینشهای خاص سازمانی
مدیریت پیچیدگیهای زیاد در تصمیمگیری
🔍 مثال عملی در ویدیو :
در ویدیو، یک شرکت مشاوره مالی فرضی معرفی میشه که هزاران مشتری داره ولی مشاور کافی نداره. مدل o4-mini با استفاده از دادههای ساختاری و غیرساختاری (مثل ایمیلها و جلسات) یاد میگیره که کدوم مشتریها برای همکاری مناسبتر هستن. (طبیعتن با رویه Reinforcement یا به بیان خودمونی پاداش دادن)
https://youtu.be/L1LMzcqGQ8w?si=oY6nd8AwC0k70Na9
BY DLeX: AI Python

Share with your friend now:
tgoop.com/ai_python/17781