BMINAIEV_BLOG Telegram 94
OpenAI / AtCoder World Tour Finals 2025

Сегодня ровно год как я работаю в OpenAI. Время летит супер быстро, но при этом прогресс движется еще быстрее! Буквально год назад Mark Chen показывал мне секретный прототип reasoning модели, который еле справлялся с простыми логическими задачами. А сейчас уже никого не удивишь моделью, которая лучше меня решает CodeForces.

Расскажу о сайд-проекте, которым занимался последнее время с коллегами. Если вы читаете этот блог давно, то знаете, что я люблю эвристические контесты. На них дают задачи, у которых нет единственного правильного решения. Вместо этого есть какой-то скор, который нужно улучшить. Раньше самыми популярными такими контестами были TopCoder Marathon, а сейчас AtCoder Heuristic Conests.

Через неделю в Японии пройдет AtCoder World Tour Finals 2025, в котором будут участвовать 12 лучших участников со всего мира. Например, там будет Psyho, который 7 раз выигрывал финал TopCoder Marathon. Так вот, параллельно с участниками, эту же самую задачу, те же самые 10 часов, будет решать AI.

В качестве проверки на то, хорошо ли вы себе представляете скорость развития AI, предлагаю попробовать угадать, какое место AI займет в итоговой таблице результатов. Насколько я понимаю, сейчас State-of-the-art это агент от SakanaAI, который занял 21е место на недавнем 4х часовом раунде.
36🔥12👍5



tgoop.com/bminaiev_blog/94
Create:
Last Update:

OpenAI / AtCoder World Tour Finals 2025

Сегодня ровно год как я работаю в OpenAI. Время летит супер быстро, но при этом прогресс движется еще быстрее! Буквально год назад Mark Chen показывал мне секретный прототип reasoning модели, который еле справлялся с простыми логическими задачами. А сейчас уже никого не удивишь моделью, которая лучше меня решает CodeForces.

Расскажу о сайд-проекте, которым занимался последнее время с коллегами. Если вы читаете этот блог давно, то знаете, что я люблю эвристические контесты. На них дают задачи, у которых нет единственного правильного решения. Вместо этого есть какой-то скор, который нужно улучшить. Раньше самыми популярными такими контестами были TopCoder Marathon, а сейчас AtCoder Heuristic Conests.

Через неделю в Японии пройдет AtCoder World Tour Finals 2025, в котором будут участвовать 12 лучших участников со всего мира. Например, там будет Psyho, который 7 раз выигрывал финал TopCoder Marathon. Так вот, параллельно с участниками, эту же самую задачу, те же самые 10 часов, будет решать AI.

В качестве проверки на то, хорошо ли вы себе представляете скорость развития AI, предлагаю попробовать угадать, какое место AI займет в итоговой таблице результатов. Насколько я понимаю, сейчас State-of-the-art это агент от SakanaAI, который занял 21е место на недавнем 4х часовом раунде.

BY Боря программирует


Share with your friend now:
tgoop.com/bminaiev_blog/94

View MORE
Open in Telegram


Telegram News

Date: |

Just as the Bitcoin turmoil continues, crypto traders have taken to Telegram to voice their feelings. Crypto investors can reduce their anxiety about losses by joining the “Bear Market Screaming Therapy Group” on Telegram. Telegram has announced a number of measures aiming to tackle the spread of disinformation through its platform in Brazil. These features are part of an agreement between the platform and the country's authorities ahead of the elections in October. 1What is Telegram Channels? Administrators SUCK Channel Telegram
from us


Telegram Боря программирует
FROM American