tgoop.com/neuraldeep/1297
Last Update:
Агенты обретут память? SMRT может решить эту задачу!
Интересная статья вышла от 22 января на arXiv и стала публикацией дня на HuggingFace - про решение проблемы памяти у многоагентных систем (SRMT: Shared Memory for Multi-agent Lifelong Pathfinding)
Главная идея: авторы придумали, как научить агентов эффективно "общаться" через общую память
Работает это так
1. Каждый агент преобразует свои наблюдения и планы в компактный вектор (mem_i)
2. Все агенты могут "читать" память друг друга через cross-attention механизм и извлекать из векторов памяти других агентов например окружение (obs_i)
3. На основе этой информации каждый агент принимает решения
По сути, агенты учатся общаться на своем "сжатом" языке:
- Умеют "упаковывать" свои намерения в векторы
- Понимают как интерпретировать векторы других агентов
- Вся эта коммуникация происходит автоматически через ResNet энкодер обучение модифицированной, GPT2-based трансформер с shared memory механизмом и cross-attention.
Технически это довольно компактная модель судя по репозиторию на Github
- hidden_size: 512
- attention heads: 8
- max_position_embeddings: 16384
Интересно увидеть, насколько эффективно это работает на практике надо покопать experiments где решались задачи bottleneck
BY Neural Deep

Share with your friend now:
tgoop.com/neuraldeep/1297