tgoop.com/pythonl/5078
Create:
Last Update:
Last Update:
📐 Agent Reinforcement Trainer — фреймворк для обучения ИИ-агентов через reinforcement learning
Проект предлагает удобный способ прокачки LLM для решения практических задач. Во время работы ART использует метод GRPO и позволяет обучать агентов работать с MCP-серверами, играть в игры и выполнять другие действия через взаимодействие со средой.
Инструмент минимально требователен к данным — система сама анализирует доступные инструменты и генерирует учебные сценарии. Поддерживается интеграция с популярными языковыми моделями, включая Qwen 2.5.
🤖 GitHub
@pythonl
BY Python/ django

Share with your friend now:
tgoop.com/pythonl/5078