#ICLR2025 Неструктурированная подборка интересных статей на тему MBRL, robotics policy, LLM planning и около того.
#ICLR2025 Неструктурированная подборка интересных статей на тему MBRL, robotics policy, LLM planning и около того.
Forwarded from Институт AIRI
До закрытия приёма заявок на школу по искусственному интеллекту «Лето с AIRI» в ТГУ — всего 4 дня!
Все лекции и семинары прошлого года доступны в VK Видео — загляните, чтобы почувствовать атмосферу Школы и вдохновиться на участие.
Подавайте заявки по ссылке до 29 апреля 23:59📌
Все лекции и семинары прошлого года доступны в VK Видео — загляните, чтобы почувствовать атмосферу Школы и вдохновиться на участие.
Подавайте заявки по ссылке до 29 апреля 23:59
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Институт AIRI
Исследователи AIRI на ICLR 2025 ⚡️
На этой неделе в Сингапуре стартовала конференция ICLR — одно из важнейших мероприятий в мире машинного обучения. В этом году от AIRI туда приехали сразу 32 исследователя. Они подготовили 9 статей на основном треке:
⚫️ XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning
⚫️ POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation
⚫️ Tight Time Complexities in Parallel Stochastic Optimization with Arbitrary Computation Dynamics
⚫️ Robust Barycenter Estimation using Semi-Unbalanced Neural Optimal Transport
⚫️ Associative memory and dead neurons
⚫️ A3D: Does Diffusion Dream about 3D Alignment?
⚫️ Learning Successor Features with Distributed Hebbian Temporal Memory
⚫️ Efficient Distribution Matching of Representations via Noise-Injected Deep InfoMax
⚫️ On the Fourier analysis in the SO (3) space: EquiLoPO Network
Кроме того, наши исследователи представляют 14 докладов на воркшопах.
Делимся фотографиями с конференции!
На этой неделе в Сингапуре стартовала конференция ICLR — одно из важнейших мероприятий в мире машинного обучения. В этом году от AIRI туда приехали сразу 32 исследователя. Они подготовили 9 статей на основном треке:
Кроме того, наши исследователи представляют 14 докладов на воркшопах.
Делимся фотографиями с конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
#ICLR2025 Третий день конференции также порадовал разносторонними пленарными докладами. С утра задавал тон Danqi Chen из Принстона с актуальной для академии темой "Training Language Models in Academia: Challenge or Calling?" По его словам - у исследователей вне больших корпораций есть две основные задачи - оценка уже существующих моделей (evaluation) и их механистический анализ (перекликается с другим спикером про биологию LLM😇). При этом ограничения мотивируют быть более креативными 🤓и, например, создавать малые модели или делать более эффективное пост-обучение. В подтверждение привел примеры их работ - ShearedLLaMA, SimPO (еще один метод файнтюна вместо RL) и Goedel-Prover. В общем, чем занться - явно еще есть😉
После обеда Tim Rocktaeschel, который теперь директор в DeepMind, показывал много красивых анимаций и картинок на тему "Open-Endedness, World Models, and the Automation of Innovation". Я с ним по поводу необходимости создавать сложные мультимодальные окружения, со свойствами открытого мира, могу только согласиться. Тем более, что мы вместе с ним работали когда-то над средой IGLU. Но вот такое повсеместное использование генеративных моделей с их ошибками и галлюцинациями разделить сложно. В процессе доклада прошлись по всей линейке моделей GAIA-2/Veo2/Genie/Genie2🎮, что больше походило на их рекламу😔 Зато Тим поделился полезной подборкой статей на тему открытых "бесконечных" миров - ее тоже всем рекомендую🙏
После обеда Tim Rocktaeschel, который теперь директор в DeepMind, показывал много красивых анимаций и картинок на тему "Open-Endedness, World Models, and the Automation of Innovation". Я с ним по поводу необходимости создавать сложные мультимодальные окружения, со свойствами открытого мира, могу только согласиться. Тем более, что мы вместе с ним работали когда-то над средой IGLU. Но вот такое повсеместное использование генеративных моделей с их ошибками и галлюцинациями разделить сложно. В процессе доклада прошлись по всей линейке моделей GAIA-2/Veo2/Genie/Genie2🎮, что больше походило на их рекламу😔 Зато Тим поделился полезной подборкой статей на тему открытых "бесконечных" миров - ее тоже всем рекомендую🙏
#ICLR2025 AIRI и МФТИ в заключительный постерный день тоже отметились своими статьями, при этом даже с мультимедиа элементами для привлечения внмиания 🦾