tgoop.com/dotnetcode/3050
Last Update:
امروز، شرکت xAI در رویدادی بزرگ از جدیدترین مدلهای هوش مصنوعی خود، Grok-4 و Grok-4 Heavy، رونمایی کرد و رسماً وارد رقابت برای کسب عنوان قدرتمندترین مدل هوش مصنوعی جهان شد.
این مدلها نه تنها پیشرفتهای چشمگیری نسبت به نسلهای قبلی خود نشان میدهند، بلکه در بنچمارکهای معتبر، رقبای سرسختی مانند GPT-4o و Gemini 2.5 Pro را با اختلاف قابل توجهی پشت سر گذاشتهاند.
همانطور که در نمودارهای منتشر شده از سوی xAI دیده میشود، Grok-4 و بهویژه نسخه قدرتمندتر آن، Grok-4 Heavy، در مجموعهای از بنچمارکهای کلیدی (با قابلیت استفاده از ابزار یا tool calling) عملکردی بینظیر داشتهاند:
*بنچمارک GPQA: امتیاز خیرهکننده 88.9% توسط Grok-4، که نشان از برتری آن در پاسخ به سوالات پیچیده دارد.
*بنچمارک AIME25 & HMMT25: کسب امتیاز کامل 100% در این بنچمارکهای دشوار ریاضی، قدرت استدلال منطقی این مدل را به رخ میکشد.
*بنچمارک LCB (Jan-May): با امتیاز 79.4%، گراک توانایی خود در درک و پردازش زبان طبیعی را به نمایش گذاشته است.
اما شاهکار بزرگ گراک در یکی از سختترین آزمونهای موجود برای سنجش هوش مصنوعی رقم خورد:
یکی از دلایل اصلی این عملکرد فوقالعاده، معماری جدید و نوآورانه گراک است. این مدل از یک سیستم چندعاملی بهره میبرد. به این معنی که چندین "ایجنت" هوشمند به صورت موازی روی یک مسئله کار میکنند، راهحلهای خود را با یکدیگر مقایسه کرده و در نهایت بهترین و دقیقترین پاسخ را ارائه میدهند. این رویکرد، توانایی حل مسئله و استدلال مدل را به سطح جدیدی ارتقا داده است.
برای کاربرانی که به نهایت قدرت این مدل نیاز دارند، xAI از پلن جدید "SuperGrok Heavy" با هزینه ماهانه ۳۰۰ دلار رونمایی کرد. این پلن دسترسی مستقیم به قدرتمندترین نسخه یعنی Grok-4 Heavy را فراهم میکند.
خبرهای هیجانانگیز xAI به همینجا ختم نمیشود:
* مدل ویدئویی: این شرکت اعلام کرد که در حال آموزش مدل پیشرفته پردازش ویدئو خود است.
*مدل Grok-4 Code: تنها چند هفته دیگر، نسخه تخصصی گراک برای کدنویسی با نام Grok-4 Code عرضه خواهد شد که promete انقلابی در این حوزه باشد.
بدون شک، با معرفی Grok-4، رقابت در دنیای هوش مصنوعی وارد مرحله جدید و بسیار هیجانانگیزی شده است. باید منتظر ماند و دید که شرکتهای دیگر چگونه به این قدرتنمایی xAI پاسخ خواهند داد!
📚💻 @dotnetcode