Algorithm design & data structure@AlgorithmDesign_DataStructuer P.1742

ALGORITHMDESIGN_DATASTRUCTUER Telegram 1742

Algorithm design & data structure

بعد از برگزاری المپیاد ریاضی آمریکا در سال ۲۰۲۵، محقق‌ها سوالات آزمون رو به چند مدل زبانی پیشرفته که توانایی استدلال منطقی دارن، دادن تا ببینن چطور از پس حل مسائل برمیان. نتیجه اما خیلی غافلگیرکننده بود: هیچ‌کدوم از مدل‌ها نتونستن بیشتر از ۵ درصد نمره بگیرن.
این موضوع نشون می‌ده که عملکرد بالا و درخشان این مدل‌ها تو آزمون‌های دیگه، ممکنه بیشتر به خاطر شباهت سوال‌ها با دیتای آموزشی‌شون بوده باشه یا اینکه فقط تونستن به جواب درست برسن بدون اینکه واقعاً اثبات درستی ارائه بدن.

Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad

#هوش_مصنوعی
📣👨‍💻 @AlgorithmDesign_DataStructuer

www.tgoop.com/AlgorithmDesign_DataStructuer/1742

971 viewsMay 28 at 10:18

tgoop.com/AlgorithmDesign_DataStructuer/1742

Create: 2025-05-28
Last Update: 2025-06-30 12:43:55

بعد از برگزاری المپیاد ریاضی آمریکا در سال ۲۰۲۵، محقق‌ها سوالات آزمون رو به چند مدل زبانی پیشرفته که توانایی استدلال منطقی دارن، دادن تا ببینن چطور از پس حل مسائل برمیان. نتیجه اما خیلی غافلگیرکننده بود: هیچ‌کدوم از مدل‌ها نتونستن بیشتر از ۵ درصد نمره بگیرن.
این موضوع نشون می‌ده که عملکرد بالا و درخشان این مدل‌ها تو آزمون‌های دیگه، ممکنه بیشتر به خاطر شباهت سوال‌ها با دیتای آموزشی‌شون بوده باشه یا اینکه فقط تونستن به جواب درست برسن بدون اینکه واقعاً اثبات درستی ارائه بدن.

Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad

#هوش_مصنوعی
📣👨‍💻 @AlgorithmDesign_DataStructuer

BY Algorithm design & data structure

Share with your friend now:
tgoop.com/AlgorithmDesign_DataStructuer/1742

Open in Telegram

Telegram News

Date: 2025-06-30|

How to create a business channel on Telegram? (Tutorial) Telegram channels fall into two types: The group’s featured image is of a Pepe frog yelling, often referred to as the “REEEEEEE” meme. Pepe the Frog was created back in 2005 by Matt Furie and has since become an internet symbol for meme culture and “degen” culture. According to media reports, the privacy watchdog was considering “blacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. SUCK Channel Telegram
from us

Telegram Algorithm design & data structure
FROM American