AI_PYTHON Telegram 17674
Forwarded from We all are BiTs
این توییت از Lisan al Gaib در X درباره محدودیت‌های مدل‌های هوش مصنوعی در حل مسائل پیچیده مانند مسئله برج هانوی (Tower of Hanoi) صحبت می‌کند. او اشاره می‌کند که مدل Sonnet 3.7 هنگام حل این مسئله برای n=9 و n=10، به دلیل طولانی بودن پاسخ، زود متوقف می‌شود.

@WearebiTs

چند نکته کلیدی از این پست:

مدل‌ها تصمیم می‌گیرند که زودتر متوقف شوند، زیرا از نظر آن‌ها محاسبه تمام مراحل، زمان‌بر و غیرضروری است.

مدل Sonnet 3.7 تا ۸ دیسک محاسبه را انجام می‌دهد، اما برای تعداد بالاتر متوقف می‌شود.

خطای ناشی از نمونه‌گیری مدل باعث کاهش دقت می‌شود، زیرا احتمال اشتباه در پیش‌بینی هر توکن هرچند اندک، در تعداد بالا جمع شده و تأثیرگذار می‌شود.

مدل‌های مختلف محدودیت خروجی دارند (مثلاً Sonnet 3.7 دارای محدودیت 128k توکن، DeepSeek R1 دارای 64k توکن).

این پست به طور کلی بحث می‌کند که چگونه مدل‌های زبانی هوش مصنوعی با افزایش پیچیدگی مسئله، به دلیل محدودیت‌های خروجی و استراتژی‌های خود، دقتشان کاهش پیدا می‌کند.

https://x.com/scaling01/status/1931817022926839909
2



tgoop.com/ai_python/17674
Create:
Last Update:

این توییت از Lisan al Gaib در X درباره محدودیت‌های مدل‌های هوش مصنوعی در حل مسائل پیچیده مانند مسئله برج هانوی (Tower of Hanoi) صحبت می‌کند. او اشاره می‌کند که مدل Sonnet 3.7 هنگام حل این مسئله برای n=9 و n=10، به دلیل طولانی بودن پاسخ، زود متوقف می‌شود.

@WearebiTs

چند نکته کلیدی از این پست:

مدل‌ها تصمیم می‌گیرند که زودتر متوقف شوند، زیرا از نظر آن‌ها محاسبه تمام مراحل، زمان‌بر و غیرضروری است.

مدل Sonnet 3.7 تا ۸ دیسک محاسبه را انجام می‌دهد، اما برای تعداد بالاتر متوقف می‌شود.

خطای ناشی از نمونه‌گیری مدل باعث کاهش دقت می‌شود، زیرا احتمال اشتباه در پیش‌بینی هر توکن هرچند اندک، در تعداد بالا جمع شده و تأثیرگذار می‌شود.

مدل‌های مختلف محدودیت خروجی دارند (مثلاً Sonnet 3.7 دارای محدودیت 128k توکن، DeepSeek R1 دارای 64k توکن).

این پست به طور کلی بحث می‌کند که چگونه مدل‌های زبانی هوش مصنوعی با افزایش پیچیدگی مسئله، به دلیل محدودیت‌های خروجی و استراتژی‌های خود، دقتشان کاهش پیدا می‌کند.

https://x.com/scaling01/status/1931817022926839909

BY DLeX: AI Python


Share with your friend now:
tgoop.com/ai_python/17674

View MORE
Open in Telegram


Telegram News

Date: |

Deputy District Judge Peter Hui sentenced computer technician Ng Man-ho on Thursday, a month after the 27-year-old, who ran a Telegram group called SUCK Channel, was found guilty of seven charges of conspiring to incite others to commit illegal acts during the 2019 extradition bill protests and subsequent months. Hashtags are a fast way to find the correct information on social media. To put your content out there, be sure to add hashtags to each post. We have two intelligent tips to give you: “Hey degen, are you stressed? Just let it all out,” he wrote, along with a link to join the group. Avoid compound hashtags that consist of several words. If you have a hashtag like #marketingnewsinusa, split it into smaller hashtags: “#marketing, #news, #usa. Select: Settings – Manage Channel – Administrators – Add administrator. From your list of subscribers, select the correct user. A new window will appear on the screen. Check the rights you’re willing to give to your administrator.
from us


Telegram DLeX: AI Python
FROM American