tgoop.com/bigdatai/1556
Create:
Last Update:
Last Update:
🤖 ByteDance Seed представил **AgentGym-RL** — новый единый фреймворк для обучения агентов с подкреплением.
🔹 Первый универсальный RL-фреймворк для обучения агентов в многошаговых задачах (без SFT).
🔹 Модульная и расширяемая архитектура: web, поиск, игры, embodied-среды и научные задачи.
🔹 Агенты достигают и даже превосходят коммерческие модели на 27 задачах.
▪proj: https://agentgym-rl.github.io
▪repo: https://github.com/woooodyy/AgentGym-RL
#RL #AI #ByteDance #AgentGym #ReinforcementLearning #Agents
BY Big Data AI

Share with your friend now:
tgoop.com/bigdatai/1556