DATA_MATH Telegram 881
LLM берет золото на олимпиаде по астрофизике

Исследователи проверили, как современные большие языковые модели (LLM) справятся с задачами Международной олимпиады по астрономии и астрофизике (IOAA) за 2022–2025 годы.
Результаты впечатляют.

🧠 Тестировались модели:
GPT-5, OpenAI o3, Gemini 2.5 Pro, Claude 4.1 Opus и Claude 4 Sonnet.

📊 Что показали:
- GPT-5 и Gemini 2.5 Pro набрали 85–88 % - это уровень золотой медали .
- Остальные модели показали результат в диапазоне 48–76 %.
- Особенно сильны GPT-5 в анализе данных и Gemini в теории.

💡 Почему это важно:
- LLM впервые достигли уровня лучших олимпиадников по астрофизике.
- Это демонстрирует, что модели уже решают не только текстовые, но и научные, количественные и логические задачи.
- Потенциал таких систем — помощь в научных исследованиях, автоматическом анализе данных и обучении.

⚠️ Ограничения:
- Олимпиадные задачи не охватывают весь спектр реальной астрофизики.
- Возможны «угадывания» и шаблонные решения.
- Неясно, насколько стабильно поведение моделей при реальных данных с шумом и погрешностями.

🟢Подробности: arxiv.org/abs/2510.05016
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1



tgoop.com/data_math/881
Create:
Last Update:

LLM берет золото на олимпиаде по астрофизике

Исследователи проверили, как современные большие языковые модели (LLM) справятся с задачами Международной олимпиады по астрономии и астрофизике (IOAA) за 2022–2025 годы.
Результаты впечатляют.

🧠 Тестировались модели:
GPT-5, OpenAI o3, Gemini 2.5 Pro, Claude 4.1 Opus и Claude 4 Sonnet.

📊 Что показали:
- GPT-5 и Gemini 2.5 Pro набрали 85–88 % - это уровень золотой медали .
- Остальные модели показали результат в диапазоне 48–76 %.
- Особенно сильны GPT-5 в анализе данных и Gemini в теории.

💡 Почему это важно:
- LLM впервые достигли уровня лучших олимпиадников по астрофизике.
- Это демонстрирует, что модели уже решают не только текстовые, но и научные, количественные и логические задачи.
- Потенциал таких систем — помощь в научных исследованиях, автоматическом анализе данных и обучении.

⚠️ Ограничения:
- Олимпиадные задачи не охватывают весь спектр реальной астрофизики.
- Возможны «угадывания» и шаблонные решения.
- Неясно, насколько стабильно поведение моделей при реальных данных с шумом и погрешностями.

🟢Подробности: arxiv.org/abs/2510.05016

BY Математика Дата саентиста







Share with your friend now:
tgoop.com/data_math/881

View MORE
Open in Telegram


Telegram News

Date: |

Activate up to 20 bots The main design elements of your Telegram channel include a name, bio (brief description), and avatar. Your bio should be: Hashtags are a fast way to find the correct information on social media. To put your content out there, be sure to add hashtags to each post. We have two intelligent tips to give you: Co-founder of NFT renting protocol Rentable World emiliano.eth shared the group Tuesday morning on Twitter, calling out the "degenerate" community, or crypto obsessives that engage in high-risk trading. Just as the Bitcoin turmoil continues, crypto traders have taken to Telegram to voice their feelings. Crypto investors can reduce their anxiety about losses by joining the “Bear Market Screaming Therapy Group” on Telegram.
from us


Telegram Математика Дата саентиста
FROM American