Data Fusion
Дорогие гости, не стесняйтесь делиться своими впечатлениями и фотографиями с площадки. Можно в комментариях к этому посту! Лучшие фото и видео опубликуем в канале 💚
И не забывайте делиться впечатлениями 💚
Please open Telegram to view this post
VIEW IN TELEGRAM
Передохнём и продолжим в 📍Молекуле разговором с Максутом Шадаевым, министом цифрового развития, связи и массовых коммуникаций Российской Федерации.
Беседу проведет⭐️ Денис Суржко, заместитель руководителя департамента анализа данных и моделирования — вице-президент ВТБ.
Далеко не расходитесь!
Беседу проведет
Далеко не расходитесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
📍 Молекула
Не хватает только чая (слушатели последнего сезона подкаста «Деньги любят техно» поймут)💜
Не хватает только чая (слушатели последнего сезона подкаста «Деньги любят техно» поймут)
Please open Telegram to view this post
VIEW IN TELEGRAM
В📍Молекуле сегодня насыщенно по инсайтам рынка: через 10 минут Вадим Кулик начнет модерировать сессию «Обогнать, не догоняя: асимметричный технологический ответ».
В дискуссии также примут участие представители Газпромбанка, «Росатома», Иннопрактики, НИУ ВШЭ, Т1, Совета Федерации. Вопросы в повестке:
• На какие технологии сделать ставку?
• Можно ли «перепрыгнуть» этапы развития в борьбе за технологическое лидерство?
• Какими должны быть стратегия и тактика продвижения российских технологий на международный уровень?
• Какова роль государства в поддержке экспансии российских технологий?
Начнем в 12.30.
Принимаете стратегические решения в ИИ и Data Science? Вы знаете, куда вам идти.
В дискуссии также примут участие представители Газпромбанка, «Росатома», Иннопрактики, НИУ ВШЭ, Т1, Совета Федерации. Вопросы в повестке:
• На какие технологии сделать ставку?
• Можно ли «перепрыгнуть» этапы развития в борьбе за технологическое лидерство?
• Какими должны быть стратегия и тактика продвижения российских технологий на международный уровень?
• Какова роль государства в поддержке экспансии российских технологий?
Начнем в 12.30.
Принимаете стратегические решения в ИИ и Data Science? Вы знаете, куда вам идти.
Лекторий 2 — это на втором этаже, после эскалаторов проходите прямо и потом налево. На всякий случай:)
Детали о статье победителя номинации «Научный прорыв» Data Fusion Awards. Спасибо за обзор, друзья!
Forwarded from Data Secrets
В лаборатории AIRI придумали способ легко масштабировать трансформеры на контекст 2 миллиона токенов
Вчера на конференции Data Fusion прошла церемония награждения Data Fusion Awards (запись). Премию за научный прорыв выиграл Айдар Булатов: он стал одним из авторов работы, в которой предложили способ расширения контекстного окна трансформеров при линейном росте вычислительных затрат.
Нас работа очень заинтересовала, и позже мы познакомились с Айдаром на постерной сессии лично, чтобы немного расспросить его о статье. Главная идея: соединить трансформеры и рекуррентный механизм памяти.
Мы разделяем текст на кусочки и обрабатываем их последовательно. При этом в начало каждого сегмента добавляются векторы памяти, которая обновляется на каждой следующей итерации. Таким образом, self‑attention считается только внутри сегмента, но при этом мы все равно с каждым разом храним все больше и больше информации о тексте.
Масштабируется это действительно хорошо: ребята обучали модель только на последовательностях длины до 3.5к токенов, но на тестах она спокойно выдерживает контекст до 2 миллионов (а позже и до 50 миллионов на модификациях)! Вот гитхаб и статья.
Кстати, на основе этой работы Айдар в команде с Юрием Куратовым и другими авторами также создали бенчмарк BABILong для оценки моделей на длинном контексте. Сейчас на этом бенчмарке тестируют свои модели многие ведущие лабы: Google, Meta, OpenAI. Мы, кстати, даже несколько раз о нем писали, но то, что он был сделан в AIRI, узнали только вчера. Эта работа тоже была в числе победителей премии.
Поздравляем🥳
Вчера на конференции Data Fusion прошла церемония награждения Data Fusion Awards (запись). Премию за научный прорыв выиграл Айдар Булатов: он стал одним из авторов работы, в которой предложили способ расширения контекстного окна трансформеров при линейном росте вычислительных затрат.
Нас работа очень заинтересовала, и позже мы познакомились с Айдаром на постерной сессии лично, чтобы немного расспросить его о статье. Главная идея: соединить трансформеры и рекуррентный механизм памяти.
Мы разделяем текст на кусочки и обрабатываем их последовательно. При этом в начало каждого сегмента добавляются векторы памяти, которая обновляется на каждой следующей итерации. Таким образом, self‑attention считается только внутри сегмента, но при этом мы все равно с каждым разом храним все больше и больше информации о тексте.
Масштабируется это действительно хорошо: ребята обучали модель только на последовательностях длины до 3.5к токенов, но на тестах она спокойно выдерживает контекст до 2 миллионов (а позже и до 50 миллионов на модификациях)! Вот гитхаб и статья.
Кстати, на основе этой работы Айдар в команде с Юрием Куратовым и другими авторами также создали бенчмарк BABILong для оценки моделей на длинном контексте. Сейчас на этом бенчмарке тестируют свои модели многие ведущие лабы: Google, Meta, OpenAI. Мы, кстати, даже несколько раз о нем писали, но то, что он был сделан в AIRI, узнали только вчера. Эта работа тоже была в числе победителей премии.
Поздравляем
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Гуманитарии (даже если только в душе), вам через 15 минут в 📍Молекулу.
⭐ Вадим Кулик проведет сессию «ИИ в эпоху постмодернизма».
Участники дискуссии:
🔵 Философ Александр Дугин
🔵 Декан факультета международных отношений МГИМО Андрей Сушенцов
🔵 Александр Крайнов (Яндекс)
🔵 ⭐ Денис Суржко (ВТБ).
Предчувствуем интереснейшую беседу!
Участники дискуссии:
Предчувствуем интереснейшую беседу!
Please open Telegram to view this post
VIEW IN TELEGRAM
Только-только в зале 📍Физика стартовала дискуссия «Нужна ли России национальная биржа данных?»
Модератор —⭐️ заместитель руководителя Технологического блока - старший вице-президент ВТБ Сергей Безбогов.
В составе участников представители Т-банка, «Сколково», АБД, ДОМ.РФ и других ключевых организаций с большим опытом в работе с данными.
Обсуждаем зарубежный опыт, коммерческий потенциал и централизацию/децентрализацию.
Ждем только вас!
Модератор —
В составе участников представители Т-банка, «Сколково», АБД, ДОМ.РФ и других ключевых организаций с большим опытом в работе с данными.
Обсуждаем зарубежный опыт, коммерческий потенциал и централизацию/децентрализацию.
Ждем только вас!
Please open Telegram to view this post
VIEW IN TELEGRAM
Через 10 минут в 📍Физике продолжаем обсуждать международные отношения, политику и влияние ИИ на общественное сознание.
Модератор —⭐ старший вице-президент ВТБ Сергей Безбогов.
Успейте занять места!
Модератор —
Успейте занять места!
Please open Telegram to view this post
VIEW IN TELEGRAM
Data Fusion
Кейс-стади по ключевым практическим направлениям ML — в этой подборке. 17 апреля в Лектории 2 подряд пройдет сразу несколько классных практико-ориентированных кейс-сессий. Рассказываем быстро и четко: 12.30 NLP. Модератор — Валентин Малых, руководитель…
В 15.40 ждём вас в Лектории 2 на обсуждение рекомендательных систем. Модератор — ⭐ Юлий Шамаев, ВТБ.
Спикеры и темы выступлений:
Евгений Иванов, Wildberries, Lead RecSys ML Engineer
Тема: Кластерные рекомендации и интересы в персонализации: как не разориться на инфраструктуре при постоянном росте количества пользователей
Данил Комаров, Lamoda Tech, Senior DS
Тема: Рекомендации с нуля: как мы в Lamoda превратили главную страницу в ключевую точку входа для персонализированного шоппинга
Сергей Кузнецов, MTS Digital, CTO RecSys Platform
Тема: Рантайм компоненты RecSys платформы
Анна Володкевич, Sber AI Lab, руководитель направления по исследованию данных
Тема: Does It Look Sequential? Анализ последовательных паттернов в датасетах для рекомендательных систем.
Спикеры и темы выступлений:
Евгений Иванов, Wildberries, Lead RecSys ML Engineer
Тема: Кластерные рекомендации и интересы в персонализации: как не разориться на инфраструктуре при постоянном росте количества пользователей
Данил Комаров, Lamoda Tech, Senior DS
Тема: Рекомендации с нуля: как мы в Lamoda превратили главную страницу в ключевую точку входа для персонализированного шоппинга
Сергей Кузнецов, MTS Digital, CTO RecSys Platform
Тема: Рантайм компоненты RecSys платформы
Анна Володкевич, Sber AI Lab, руководитель направления по исследованию данных
Тема: Does It Look Sequential? Анализ последовательных паттернов в датасетах для рекомендательных систем.
Please open Telegram to view this post
VIEW IN TELEGRAM
Через несколько минут начинаем в «Фотоне» обсуждать математическую оптимизацию.
Долго говорить не будем. Вот список спикеров:
Евгений Лепшин
Салават Муллабаев
Алексей Чернов
Роланд Хильдебранд
Юрий Дорн
Дмитрий Яроцкий
Дмитрий Ковалев
Денис Беломестный
Александр Гасников
В общем, это must-see. В «Фотоне» в 15.30🚀
UPD: сессия в двух частях, сделаем перерыв в 17.05 и продолжим.
Долго говорить не будем. Вот список спикеров:
Евгений Лепшин
Салават Муллабаев
Алексей Чернов
Роланд Хильдебранд
Юрий Дорн
Дмитрий Яроцкий
Дмитрий Ковалев
Денис Беломестный
Александр Гасников
В общем, это must-see. В «Фотоне» в 15.30
UPD: сессия в двух частях, сделаем перерыв в 17.05 и продолжим.
Please open Telegram to view this post
VIEW IN TELEGRAM