tgoop.com/data_analysis_ml/3577
Last Update:
Современные роботы для надёжной и устойчивой работы должны помнить, что происходило ранее.
Но как только в диффузионные политики добавляют историю действий — производительность падает, а обучение становится дорогим и нестабильным.
📌 Исследователи представили новый метод — PTP (Past Trajectory Prediction), который помогает роботам эффективно использовать прошлый опыт.
Что делает PTP:
✅ Учит робота находить связь между прошлым и будущим
✅ Позволяет использовать быстрые кэшированные контексты вместо длинной истории
✅ Ускоряет обучение и повышает качество поведения в 3 раза
✅ Уменьшает вычислительные затраты более чем в 10 раз
✅ Добавляет трюк на этапе запуска, который проверяет, следит ли робот за собственной историей
📈 Обучение роботов с учётом долгосрочного контекста стало реально применимым.
Если мы хотим создавать умных, автономных и надёжных машин — это большой шаг вперёд.
🔗 Подробнее:
- Статья
- Проект
- Код
https://www.tgoop.com/data_analysis_ml
BY Анализ данных (Data analysis)
Share with your friend now:
tgoop.com/data_analysis_ml/3577