Grounding Knowledge 🦾

#ICLR2025 Многие считают, что самая интересная часть конференции - это воркшопы. Во многом так и есть. На воркшопах предполагается обсуждение еще не проверенных, но интересных идей. Туда приглашают спикеров на более узкие темы, да и в целом собираются коллеги из одной специализированной области. После основной конференции как раз было два дня воркшопов. Я поучаствовал в двух из них.

Первый - Reasoning and Planning for Large Language Models был посвящен как раз разным техникам для улчшения способностей LLM к планированию и рассуждению. Мы тоже там презентовали нашу работу - LookPlanGraph, что добавило Россию в общую статистику воркшопа🦾 Первый пленарный спикер был Yuandong Tian из FAIR рассказывал про унификацию символьных и нейросетевых моделей для принятия решения (та самая нейросимвольная интеграция😉). Рассказал про линейку их моделей, использущих внутри трансформера обычный алгоритм поиска типа A* - Searchformer v1, v2 и v3. Упомянул и их модель Coconut с рассуждениями в латентах, но как мы уже сами проверили - работает она так себе. Еще из этого воркшопа отмечу Junxian He с темой «Taming Reinforcement Learning for Effective and Efficient Reasoners», где он подробно проанализировал особенности RL дообучения и заодно представил свой групповой подход.

329 views11:56

#ICLR2025 Второй интересный воркшоп был по робототехнике - Generative Models for Robot Learning. Звездой зедсь был, конечно, Sergey Levine. Он рассказал, как идут дела у его стартапа Physical Intelligence и про их последние работы. Я уже как-то рассказывал про их VLA модель \pi_0, которая при правильном балансе данных для предобучения и дообучения решает сложные обыденные задачи, типа разгрузки стиральнй машины🦾. Но их актуальная модель - это уже \pi_0.5, которая еще более эффективно сочетает низкоуровневую и высокоуровневую стратегии в единой модели. Отмечу и их иерархическую модель Hi Robot, где делается более явное разделение между VLM и VLA.

Из других пленарных докладчиков здесь еще упомяну Yilun Du (бывший аспирант Leslie Kaelbling и Joshua Tenenbaum), который продвигал свою теорию композиционной генерализации на основе принципиа минимизации энергии. Более общий взгляд на диффузионные стратегии. Из обычных устных докладов на воркшопе отметились Policy Agnostic RL: Offline RL and Online RL Fine-Tuning of Any Class and Backbone (улучшили OpenVLA без дополнительных демонстраций за счет декомпозици шага улучшения стратегии) и LAPA - Latent Action Pretraining from Videos (реализовали старую мечту робототехников - предсказывать действия только по видео с ютуба).

461 views12:14

Grounding Knowledge 🦾

#ICLR2025 Вот в целом и все с этой конференцией - прощаемся с Сингапуром и продолжаем готовить работы с прорывными результатами на следующие конференции🧊

💡

Please open Telegram to view this post

VIEW IN TELEGRAM

495 views12:16

Grounding Knowledge 🦾

Forwarded from Институт AIRI

Продлеваем дедлайн подачи заявок на «Лето с AIRI» до 7 мая включительно ⚡️

В этом году программа пройдёт в Томске — городе студентов, науки и белых ночей. С 30 июня по 10 июля вас ждут лекции и семинары по ИИ, проектная работа, постерная сессия и внеучебные активности — от тёплых вечеров в историческом центре до сапов на реке. Отличная возможность прокачать навыки, найти единомышленников и вдохновение для новых исследований.

Если вам нужно будет приглашение от университета (например, чтобы вуз помог с оплатой билетов), мы можем его оформить — просто напишите нам. У многих авиакомпаний есть студенческие скидки, уточняйте при бронировании. Также будет организован трансфер из Новосибирска до Томска.

Подавайте заявку и рассказывайте друзьям — это лето может стать ярким! Если у вас остались вопросы, пишите нам на event@airi.net

📌

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

496 views11:45

Grounding Knowledge 🦾

#papers При публикации результатов в нашей области ценятся не только топовые конференции, как недавно прошедший ICLR, но и солидные журналы. Сроки рассмотрения в них теперь не так уж сильно отличются от рецензирования на конференциях, а раундов исправлений замечаний может быть два и более. Недавно в нашей группе вышли две статьи в престижных журналах: Polygon Decomposition for Obstacle Representation in Motion Planning with Model Predictive Control в Engineering Applications of Artificial Intelligence и SegmATRon: Embodied Adaptive Semantic Segmentation for Indoor Environment в Neurocomputing (top-4 журнал в ИИ). У первой статьи вообще непростая история - она была принята в два журнала 🦾 Но первый отказался ее помещать в номер из-за санкций. Да, редко, но такое случается😥.

А так, обе работы посвящены важной теме - навигации робототехнических платформ. В первой предлагается метод декомпозиции перпятствий для более быстрой и точной работы MPC при следовании траектории🏎. Во второй мы предложили метод адаптивной сегментации при навгиации внутри помещений по изображениям с помощью RL🤖.

640 views04:03

2025/06/19 02:28:10
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>