Запись семинара
Ишан Нобатов (МГТУ, GlowByte) — Импульсные нейросети и метод обучения STDP
▫️ YouTube, Дзен (1 час 5 минут)
▫️ Презентация в базе знаний→
P.S.: RuTube сломался, видимо кто-то что-то перепутал и замедлил не тот tube)
P.P.S.: В августе у нас перерыв, мероприятия NoML продолжим в сентябре.
Ишан Нобатов (МГТУ, GlowByte) — Импульсные нейросети и метод обучения STDP
▫️ YouTube, Дзен (1 час 5 минут)
▫️ Презентация в базе знаний→
P.S.: RuTube сломался, видимо кто-то что-то перепутал и замедлил не тот tube)
P.P.S.: В августе у нас перерыв, мероприятия NoML продолжим в сентябре.
Про p-адические числа и их приложения
Недавно принимал участие в проходившей на мехмате летней математической школе («4-я Международная студенческая школа ведущих университетов Азии»). Прочитал там мини курс с введением в p-адические числа. На последней лекции чистую арифметику захотелось разбивать приложениями, как классическими: p-адические числа (как в целом почти вся теория чисел) применяются в криптографии и теории кодирования, так и более неожиданными: оказывается существует такое направление как p-адические нейронные сети! Вообще всегда считал p-адические числа чистым разделом теории чисел, но тут по новодке коллег с кафедры ИБ ВМК открыл новое для себя целое направление p-адических динамических систем.
В общем, если кто-то тоже хочет погрузиться подробнее в тему, вот литература
▫️ Краткое введение и обзор приложений: A. Yu. Khrennikov, K. Oleschko, M. de Jesús Correa López — Applications of p-adic numbers: from physics to geology, 2016 (~10 стр., ~20 минут)
▫️ Хороший учебник-введение как в p-адические числа с точки зрения теории чисел, так и в p-адический анализ: F.Q. Gouvêa — p-adic Numbers: An Introduction, 2020 (~300 стр.)
▫️ Здесь можно почитать про p-адические нейронные сети: A. Khrennikov, M. Nilson — P-adic Deterministic and Random Dynamics, 2004 (~250 стр.)
▫️ А здесь можно дальше углубиться в p-адическую динамику и приложения: V. Anashin, A. Khrennikov — Applied Algebraic Dynamics, 2009 (500 стр.)
На летней школе, кстати, обнаружилось, что не всем знакома опенсорсная система компьютерной алгебры SageMath (язык — почти Python). Там как раз можно поиграть с p-адическими числами.
P.S.: Снова приходим к выводу, что для занятий DS/ML не помешает знанение алгебры и теории чисел;)
Недавно принимал участие в проходившей на мехмате летней математической школе («4-я Международная студенческая школа ведущих университетов Азии»). Прочитал там мини курс с введением в p-адические числа. На последней лекции чистую арифметику захотелось разбивать приложениями, как классическими: p-адические числа (как в целом почти вся теория чисел) применяются в криптографии и теории кодирования, так и более неожиданными: оказывается существует такое направление как p-адические нейронные сети! Вообще всегда считал p-адические числа чистым разделом теории чисел, но тут по новодке коллег с кафедры ИБ ВМК открыл новое для себя целое направление p-адических динамических систем.
В общем, если кто-то тоже хочет погрузиться подробнее в тему, вот литература
▫️ Краткое введение и обзор приложений: A. Yu. Khrennikov, K. Oleschko, M. de Jesús Correa López — Applications of p-adic numbers: from physics to geology, 2016 (~10 стр., ~20 минут)
▫️ Хороший учебник-введение как в p-адические числа с точки зрения теории чисел, так и в p-адический анализ: F.Q. Gouvêa — p-adic Numbers: An Introduction, 2020 (~300 стр.)
▫️ Здесь можно почитать про p-адические нейронные сети: A. Khrennikov, M. Nilson — P-adic Deterministic and Random Dynamics, 2004 (~250 стр.)
▫️ А здесь можно дальше углубиться в p-адическую динамику и приложения: V. Anashin, A. Khrennikov — Applied Algebraic Dynamics, 2009 (500 стр.)
На летней школе, кстати, обнаружилось, что не всем знакома опенсорсная система компьютерной алгебры SageMath (язык — почти Python). Там как раз можно поиграть с p-адическими числами.
P.S.: Снова приходим к выводу, что для занятий DS/ML не помешает знанение алгебры и теории чисел;)
Про конфиденциальную аналитику
В среду поучаствовал в IV встрече экспертного сообщества по криптографии и большим данным. Мероприятие было организовано компанией Криптонит @kryptonite_channel и проходило в Музее криптографии @cryptography_museum (кстати, кто не был, горячо рекомендую, есть настоящая Энигма и много чего еще интересного).
В этот раз темой встречи были вопросы доверенного ИИ. Кратко рассказал про задачи безопасной коллаборации данных и технологии конфиденциальности в анализе данных. В связи с этим захотелось вспомнить несколько наших мероприятий NoML по связанным темам.
Летом 2023 года у нас был круглый стол про вопросы конфиденциальности в анализе данных, тогда мы с коллегами прошлись по всем основным подходам (федеративное обучение, синтетика, дифференциальная приватность, криптоанклавы, гомоморфное шифрование, совместные конфиденциальные вычисления):
▫️ Роман Постников (Upgini), Павел Снурницын (GlowByte, Kolmogorov AI), Александр Григорьевский (Sber AI Lab) и Андрей Соколов (YADRO) — Методы конфиденциальной аналитики. YouTube | Дзен | RuTube (1 час 50 минут).
В этом июле у нас был доклад коллег из ИСП РАН и Yandex Cloud про практический кейс применения федеративного обучения:
▫️ Евгений Попов (Yandex Cloud), Никита Лазарев (ИСП РАН), Юрий Маркин (ИСП РАН) — Практический опыт применения FL в медицине на примере обучения модели по классификации ЭКГ-синдромов. YouTube | Дзен | RuTube (1 час 35 минут).
Про область федеративного обучения у нас также уже регулярно проходят обзоры:
▫️ Денис Афанасьев (CrossOverMarkets, SberDevices, NeuroHealth.Care, CleverDATA) — Федеративное обучение: обзор методов, платформ и трендов 2024. YouTube | Дзен | RuTube (1 час 20 минут);
▫️ Денис Афанасьев (SberDevices, CleverDATA) — Таксономия методов FL, обзор платформ, основных игроков, вызовов и трендов развития 2023. YouTube | Дзен | RuTube (1 час 20 минут).
Про применение байесовских сетей для генерации синтетики с сохранением структурных связей мы рассказывали весной 2023 года:
▫️ Рахмет Оджаев (GlowByte), Гузелия Мошнина (GlowByte), Фёдор Смирнов (GlowByte) — Методы генерации синтетических данных. YouTube | Дзен | RuTube (1 час 40 минут).
В тему задач коллаборации и обогащения данных можно вспомнить еще вот такой доклад конца 2023 года:
▫️ Роман Постников (Upgini), Максим Воеводский (Upgini) — Upgini: Библиотека для поиска и обогащения ML моделей релевантными внешними фичами. YouTube | Дзен | RuTube (1 час 25 минут).
А в 2022 году у нас выходил выпуск подкаста, где тоже обсуждали важность конфиденциальных вычислений в бизнес задачах с ИИ:
▫️ Лев Рагулин (oneFactor), Александр Бородин (GlowByte) — Конфиденциальные и совместные вычисления на основе ML. YouTube | Дзен | RuTube (35 минут).
В среду поучаствовал в IV встрече экспертного сообщества по криптографии и большим данным. Мероприятие было организовано компанией Криптонит @kryptonite_channel и проходило в Музее криптографии @cryptography_museum (кстати, кто не был, горячо рекомендую, есть настоящая Энигма и много чего еще интересного).
В этот раз темой встречи были вопросы доверенного ИИ. Кратко рассказал про задачи безопасной коллаборации данных и технологии конфиденциальности в анализе данных. В связи с этим захотелось вспомнить несколько наших мероприятий NoML по связанным темам.
Летом 2023 года у нас был круглый стол про вопросы конфиденциальности в анализе данных, тогда мы с коллегами прошлись по всем основным подходам (федеративное обучение, синтетика, дифференциальная приватность, криптоанклавы, гомоморфное шифрование, совместные конфиденциальные вычисления):
▫️ Роман Постников (Upgini), Павел Снурницын (GlowByte, Kolmogorov AI), Александр Григорьевский (Sber AI Lab) и Андрей Соколов (YADRO) — Методы конфиденциальной аналитики. YouTube | Дзен | RuTube (1 час 50 минут).
В этом июле у нас был доклад коллег из ИСП РАН и Yandex Cloud про практический кейс применения федеративного обучения:
▫️ Евгений Попов (Yandex Cloud), Никита Лазарев (ИСП РАН), Юрий Маркин (ИСП РАН) — Практический опыт применения FL в медицине на примере обучения модели по классификации ЭКГ-синдромов. YouTube | Дзен | RuTube (1 час 35 минут).
Про область федеративного обучения у нас также уже регулярно проходят обзоры:
▫️ Денис Афанасьев (CrossOverMarkets, SberDevices, NeuroHealth.Care, CleverDATA) — Федеративное обучение: обзор методов, платформ и трендов 2024. YouTube | Дзен | RuTube (1 час 20 минут);
▫️ Денис Афанасьев (SberDevices, CleverDATA) — Таксономия методов FL, обзор платформ, основных игроков, вызовов и трендов развития 2023. YouTube | Дзен | RuTube (1 час 20 минут).
Про применение байесовских сетей для генерации синтетики с сохранением структурных связей мы рассказывали весной 2023 года:
▫️ Рахмет Оджаев (GlowByte), Гузелия Мошнина (GlowByte), Фёдор Смирнов (GlowByte) — Методы генерации синтетических данных. YouTube | Дзен | RuTube (1 час 40 минут).
В тему задач коллаборации и обогащения данных можно вспомнить еще вот такой доклад конца 2023 года:
▫️ Роман Постников (Upgini), Максим Воеводский (Upgini) — Upgini: Библиотека для поиска и обогащения ML моделей релевантными внешними фичами. YouTube | Дзен | RuTube (1 час 25 минут).
А в 2022 году у нас выходил выпуск подкаста, где тоже обсуждали важность конфиденциальных вычислений в бизнес задачах с ИИ:
▫️ Лев Рагулин (oneFactor), Александр Бородин (GlowByte) — Конфиденциальные и совместные вычисления на основе ML. YouTube | Дзен | RuTube (35 минут).
Мероприятия NoML в сентябре
Скоро начинаем осенний сезон наших мероприятий!
Сентябрь у нас наполнился семинарами. Все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 04.09 | Альфия Харламова (GlowByte AA), Гевонд Асадян (Альфа-Банк) — Унифицированный процесс разработки и продуктивизации каскадов связанных ML моделей в Альфа-Банке;
▫️ 11.09 | Арсений Попов (ИТМО) — Стохастические дифференциальные уравнения: несколько слов и пара примеров сверху;
▫️ 18.09 | Сергей Панкратов (GlowByte AA) — Reinforcement Learning для задачи Next Best Offer;
▫️ 25.09 | Алексей Ложкинс (LA Optimization) — Искусство математического моделирования.
Ссылка для подключения: Google Meet→
На всякий случай следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.
Скоро начинаем осенний сезон наших мероприятий!
Сентябрь у нас наполнился семинарами. Все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 04.09 | Альфия Харламова (GlowByte AA), Гевонд Асадян (Альфа-Банк) — Унифицированный процесс разработки и продуктивизации каскадов связанных ML моделей в Альфа-Банке;
▫️ 11.09 | Арсений Попов (ИТМО) — Стохастические дифференциальные уравнения: несколько слов и пара примеров сверху;
▫️ 18.09 | Сергей Панкратов (GlowByte AA) — Reinforcement Learning для задачи Next Best Offer;
▫️ 25.09 | Алексей Ложкинс (LA Optimization) — Искусство математического моделирования.
Ссылка для подключения: Google Meet→
На всякий случай следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.
Семинар про оркестратор каскадов моделей
▫️ 4 сентября (среда), 17:00 МСК
▫️ Подключение→
Выступают: Альфия Харламова (GlowByte), Гевонд Асадян (Альфа-Банк)
Тема: От бизнес-потребности к эксплуатации за 5 шагов: как мы выстроили унифицированный процесс разработки и продуктивизации каскадов связанных ML моделей в Альфа-Банке
Аннотация
Для всестороннего анализа клиента используется большое число внешних источников данных, обработка которых выделяется в отдельные модули. В отличии от ситуации, когда под все кейсы используется одна сложная модель, многомодульный подход в системе принятия решений позволяет добиться гибкости при выстраивании разных стратегий вызова моделей. Каскад — это набор независимых моделей, запускаемых последовательно или параллельно на разных уровнях иерархии и выдающих один общий результат.
В докладе расскажем:
▫️ О проблемах и ограничениях, возникающих при оркестрации моделей;
▫️ Как мы пришли к потребности в едином инструменте для управления каскадами;
▫️ Что такое Онлайн-каскад-девелопер и из чего он состоит;
▫️ Что мы получили в итоге, и какова реальная бизнес ценность такого инструмента;
▫️ Каким мы видим дальнейшее развитие инструмента.
▫️ 4 сентября (среда), 17:00 МСК
▫️ Подключение→
Выступают: Альфия Харламова (GlowByte), Гевонд Асадян (Альфа-Банк)
Тема: От бизнес-потребности к эксплуатации за 5 шагов: как мы выстроили унифицированный процесс разработки и продуктивизации каскадов связанных ML моделей в Альфа-Банке
Аннотация
Для всестороннего анализа клиента используется большое число внешних источников данных, обработка которых выделяется в отдельные модули. В отличии от ситуации, когда под все кейсы используется одна сложная модель, многомодульный подход в системе принятия решений позволяет добиться гибкости при выстраивании разных стратегий вызова моделей. Каскад — это набор независимых моделей, запускаемых последовательно или параллельно на разных уровнях иерархии и выдающих один общий результат.
В докладе расскажем:
▫️ О проблемах и ограничениях, возникающих при оркестрации моделей;
▫️ Как мы пришли к потребности в едином инструменте для управления каскадами;
▫️ Что такое Онлайн-каскад-девелопер и из чего он состоит;
▫️ Что мы получили в итоге, и какова реальная бизнес ценность такого инструмента;
▫️ Каким мы видим дальнейшее развитие инструмента.
Семинар про стохастические дифференциальные уравнения
▫️ 11 сентября (среда), 17:00 МСК
▫️ Подключение→
Выступает: Арсений Попов, студент и ассистент научно-образовательного центра математики университета ИТМО
Тема: Стохастические дифференциальные уравнения: несколько слов и пара примеров сверху
Аннотация
На семинаре отвлечемся на основные идеи стохастического исчисления: введем понятие случайного процесса, рассмотрим классический и ключевой для нас случай описания броуновского движения, подойдём к понятиям стохастических интеграла и дифференциала, а также стохастических дифференциальных уравнений (СДУ). Рассмотрим пару подходов к "решению" СДУ: нахождение решения для моментов, и (в случае краевой задачи) нахождение плотности вероятности с использованием уравнения Фоккера-Планка. Завершим парой иллюстраций применения СДУ в финансовой математике и диффузионных моделях.
Уровень сложности: начинающий, для понимания материала будет достаточно знаний математического анализа и теории вероятностей уровня выпускника инженерной специальности и некоторых представлений о дифференциальных уравнениях.
▫️ 11 сентября (среда), 17:00 МСК
▫️ Подключение→
Выступает: Арсений Попов, студент и ассистент научно-образовательного центра математики университета ИТМО
Тема: Стохастические дифференциальные уравнения: несколько слов и пара примеров сверху
Аннотация
На семинаре отвлечемся на основные идеи стохастического исчисления: введем понятие случайного процесса, рассмотрим классический и ключевой для нас случай описания броуновского движения, подойдём к понятиям стохастических интеграла и дифференциала, а также стохастических дифференциальных уравнений (СДУ). Рассмотрим пару подходов к "решению" СДУ: нахождение решения для моментов, и (в случае краевой задачи) нахождение плотности вероятности с использованием уравнения Фоккера-Планка. Завершим парой иллюстраций применения СДУ в финансовой математике и диффузионных моделях.
Уровень сложности: начинающий, для понимания материала будет достаточно знаний математического анализа и теории вероятностей уровня выпускника инженерной специальности и некоторых представлений о дифференциальных уравнениях.
Про стохастические дифференциальные уравнения
Материалы по теме от докладчика Арсения Попова @GreatestParrot.
Книги и учебники:
▫️ Я.И. Белопольская, Стохастические дифференциальные уравнения. Приложения к задачам математической физики и финансовой математики, 2023 (~300 стр.);
▫️ Д.Ф. Кузнецов, Стохастические дифференциальные уравнения: теория и практика численного решения, 2007 (~770 стр.);
▫️ С.С. Степанов, Стохастический мир, 2012 (~370 стр.);
▫️ Плюс более полный список литературы можно найти здесь.
Курс лекций:
▫️ А.Ю. Веретенников, Теория стохастических дифференциальных уравнений (19 лекций).
Пост про генеративные модели:
▫️ Yang Song, Score-based generative modeling with stochastic differential equations, 2021 (~25 минут).
А в контексте диффузионных моделей наш модератор Вазген Амбарцумов @VagOnOff вспоминал про доклады Дмитрия Ветрова:
▫️ D. Vetrov, Introduction to diffusion models (part I, part II), 2022 (~2 часа 30 минут).
Материалы по теме от докладчика Арсения Попова @GreatestParrot.
Книги и учебники:
▫️ Я.И. Белопольская, Стохастические дифференциальные уравнения. Приложения к задачам математической физики и финансовой математики, 2023 (~300 стр.);
▫️ Д.Ф. Кузнецов, Стохастические дифференциальные уравнения: теория и практика численного решения, 2007 (~770 стр.);
▫️ С.С. Степанов, Стохастический мир, 2012 (~370 стр.);
▫️ Плюс более полный список литературы можно найти здесь.
Курс лекций:
▫️ А.Ю. Веретенников, Теория стохастических дифференциальных уравнений (19 лекций).
Пост про генеративные модели:
▫️ Yang Song, Score-based generative modeling with stochastic differential equations, 2021 (~25 минут).
А в контексте диффузионных моделей наш модератор Вазген Амбарцумов @VagOnOff вспоминал про доклады Дмитрия Ветрова:
▫️ D. Vetrov, Introduction to diffusion models (part I, part II), 2022 (~2 часа 30 минут).
Семинар про RL для задачи NBO
▫️ 18 сентября (среда), 17:00 МСК
▫️ Подключение→
Выступает: Сергей Панкратов (GlowByte Advanced Analytics)
Тема: Reinforcement Learning для задачи Next Best Offer
Аннотация
Системы NBO играют ключевую роль в персонализированном маркетинге, помогая предлагать клиентам наиболее релевантные продукты и услуги в реальном времени. Вспомним какие существуют базовые классические и Deep Learning алгоритмы и стратегии обучения, когда и как их можно применить, рассмотрим несколько интересных кейсов из практики применительно к задаче NBO и рекомендациям товаров/действий.
В докладе:
▫️ Обзор основных классических и DL алгоритмов;
▫️ Типовая схема процесса обучения;
▫️ Примеры кейсов on-line / off-line обучения.
Уровень сложности: начинающий, для понимания материала будет достаточно общих знаний и навыков в Supervised Learning.
▫️ 18 сентября (среда), 17:00 МСК
▫️ Подключение→
Выступает: Сергей Панкратов (GlowByte Advanced Analytics)
Тема: Reinforcement Learning для задачи Next Best Offer
Аннотация
Системы NBO играют ключевую роль в персонализированном маркетинге, помогая предлагать клиентам наиболее релевантные продукты и услуги в реальном времени. Вспомним какие существуют базовые классические и Deep Learning алгоритмы и стратегии обучения, когда и как их можно применить, рассмотрим несколько интересных кейсов из практики применительно к задаче NBO и рекомендациям товаров/действий.
В докладе:
▫️ Обзор основных классических и DL алгоритмов;
▫️ Типовая схема процесса обучения;
▫️ Примеры кейсов on-line / off-line обучения.
Уровень сложности: начинающий, для понимания материала будет достаточно общих знаний и навыков в Supervised Learning.
NoML Recap — NBO & RL
В преддверии завтрашнего доклада можно вспомнить, что у нас тут уже было со словами NBO и RL.
Про бизнес задачу NBO:
▫️ Вазген Амбарцумов (GlowByte), Маркетинговая оптимизация и задача Next Best Offer, 2024. YouTube | Дзен | RuTube (1 час 15 минут).
Про разгон оптимизационных совлеров для NBO у нас кстати появился свежий посте в блоге на Хабре:
▫️ Как нам удалось в 100 раз ускорить решение оптимизационной задачи NBO в Альфа-Банке, 2024 (6 минут).
Детальный доклад про подход с разгоном солверов:
▫️ Максим Гончаров (GlowByte), Алексей Никоноров (GlowByte), Опыт по ускорению оптимизационных open source солверов на примере решения задачи NBO, 2024. YouTube | Дзен | RuTube (1 час 45 минут).
Про RL для NBO можно еще вспомнить наш старый пост на Хабре:
▫️ Как Reinforcement Learning помогает ритейлерам, 2020 (14 минут).
И вот еще пара историй в сторону многоруких бандитов:
▫️ Дмитрий Забавин (GlowByte), Сергей Вакунов (GlowByte), RL-SQL: Решение задачи многорукого бандита методом сэмплирования Томпсона, для произвольных распределений, средствами SQL, 2023. YouTube | Дзен | RuTube (2 часа);
▫️ Юрий Дорн (МГУ, МФТИ, ШАД), Bandits with something: бандиты с бюджетами (bandits with knapsacks) и бандиты с тяжелыми хвостами (bandits with heavy tails), 2024. YouTube | Дзен | RuTube (1 час 30 минут).
Также была у нас когда-то подборка материалов для подробного изучения темы:
▫️ Курсы и книги по RL.
И вот еще пара подборок статей:
▫️ От A/B тестов к многоруким бандитам и RL;
▫️ RL, рек. системы и всякое разное.
В преддверии завтрашнего доклада можно вспомнить, что у нас тут уже было со словами NBO и RL.
Про бизнес задачу NBO:
▫️ Вазген Амбарцумов (GlowByte), Маркетинговая оптимизация и задача Next Best Offer, 2024. YouTube | Дзен | RuTube (1 час 15 минут).
Про разгон оптимизационных совлеров для NBO у нас кстати появился свежий посте в блоге на Хабре:
▫️ Как нам удалось в 100 раз ускорить решение оптимизационной задачи NBO в Альфа-Банке, 2024 (6 минут).
Детальный доклад про подход с разгоном солверов:
▫️ Максим Гончаров (GlowByte), Алексей Никоноров (GlowByte), Опыт по ускорению оптимизационных open source солверов на примере решения задачи NBO, 2024. YouTube | Дзен | RuTube (1 час 45 минут).
Про RL для NBO можно еще вспомнить наш старый пост на Хабре:
▫️ Как Reinforcement Learning помогает ритейлерам, 2020 (14 минут).
И вот еще пара историй в сторону многоруких бандитов:
▫️ Дмитрий Забавин (GlowByte), Сергей Вакунов (GlowByte), RL-SQL: Решение задачи многорукого бандита методом сэмплирования Томпсона, для произвольных распределений, средствами SQL, 2023. YouTube | Дзен | RuTube (2 часа);
▫️ Юрий Дорн (МГУ, МФТИ, ШАД), Bandits with something: бандиты с бюджетами (bandits with knapsacks) и бандиты с тяжелыми хвостами (bandits with heavy tails), 2024. YouTube | Дзен | RuTube (1 час 30 минут).
Также была у нас когда-то подборка материалов для подробного изучения темы:
▫️ Курсы и книги по RL.
И вот еще пара подборок статей:
▫️ От A/B тестов к многоруким бандитам и RL;
▫️ RL, рек. системы и всякое разное.
Еще про многоруких бандитов
Кстати в контексте вот этого семинара:
▫️ Юрий Дорн (МГУ, МФТИ, ШАД), Bandits with something: бандиты с бюджетами (bandits with knapsacks) и бандиты с тяжелыми хвостами (bandits with heavy tails), 2024. YouTube | Дзен | RuTube (1 час 30 минут)
подборка материалов от докладчика Юрия Дорна что-то не доехала до канала, пришло время исправиться.
Введение в тему:
▫️ A. Slivkins, Introduction to Multi-Armed Bandits, 2019 (~160 стр.)
Две работы по тяжелым хвостам:
▫️ S. Bubeck, N. Cesa-Bianchi, G. Lugosi, Bandits with heavy tail, 2012 (14 стр., ~20-30 минут);
▫️ J. Huang, Y. Dai, L. Huang, Adaptive Best-of-Both-Worlds Algorithm for Heavy-Tailed Multi-Armed Bandits, 2022 (28 стр., 50-70 минут).
Кстати в контексте вот этого семинара:
▫️ Юрий Дорн (МГУ, МФТИ, ШАД), Bandits with something: бандиты с бюджетами (bandits with knapsacks) и бандиты с тяжелыми хвостами (bandits with heavy tails), 2024. YouTube | Дзен | RuTube (1 час 30 минут)
подборка материалов от докладчика Юрия Дорна что-то не доехала до канала, пришло время исправиться.
Введение в тему:
▫️ A. Slivkins, Introduction to Multi-Armed Bandits, 2019 (~160 стр.)
Две работы по тяжелым хвостам:
▫️ S. Bubeck, N. Cesa-Bianchi, G. Lugosi, Bandits with heavy tail, 2012 (14 стр., ~20-30 минут);
▫️ J. Huang, Y. Dai, L. Huang, Adaptive Best-of-Both-Worlds Algorithm for Heavy-Tailed Multi-Armed Bandits, 2022 (28 стр., 50-70 минут).
Про RL
Запись вчерашнего семинара скоро будет, а пока список литературы и материалов из доклада Сергея:
Книги:
▫️ R.S. Sutton, A.G. Barto, Reinforcement Learning, 2018, есть перевод (~550 стр.);
▫️ M. Lapan, Deep Reinforcement Learning Hands-On, 2020, есть перевод (~540 стр.);
▫️ L. Graesser, W.L. Keng, Foundations of Deep Reinforcement Learning, есть перевод (~410 стр.).
Вводная статья:
▫️ B. Jaeger, A. Geiger, An Invitation to Deep Reinforcement Learning, 2023 (38 стр.).
Курс:
▫️ Deep Reinforcement Learning Course.
Кейс команды GlowByte Advanced Analytics:
▫️ Как Reinforcement Learning помогает ритейлерам, 2020 (14 минут).
И еще пара статей:
▫️ Y. Lin et al., A Survey on Reinforcement Learning for Recommender Systems, 2021 (20 стр., ~1,5 часа);
▫️ F. Chen et al., BCRLSP: An Offline Reinforcement Learning Framework for Sequential Targeted Promotion, 2022 (7 стр., ~30-40 минут).
Запись вчерашнего семинара скоро будет, а пока список литературы и материалов из доклада Сергея:
Книги:
▫️ R.S. Sutton, A.G. Barto, Reinforcement Learning, 2018, есть перевод (~550 стр.);
▫️ M. Lapan, Deep Reinforcement Learning Hands-On, 2020, есть перевод (~540 стр.);
▫️ L. Graesser, W.L. Keng, Foundations of Deep Reinforcement Learning, есть перевод (~410 стр.).
Вводная статья:
▫️ B. Jaeger, A. Geiger, An Invitation to Deep Reinforcement Learning, 2023 (38 стр.).
Курс:
▫️ Deep Reinforcement Learning Course.
Кейс команды GlowByte Advanced Analytics:
▫️ Как Reinforcement Learning помогает ритейлерам, 2020 (14 минут).
И еще пара статей:
▫️ Y. Lin et al., A Survey on Reinforcement Learning for Recommender Systems, 2021 (20 стр., ~1,5 часа);
▫️ F. Chen et al., BCRLSP: An Offline Reinforcement Learning Framework for Sequential Targeted Promotion, 2022 (7 стр., ~30-40 минут).
Запись семинара
Сергей Панкратов (GlowByte) — Reinforcement Learning для задачи Next Best Offer. YouTube | Дзен | RuTube (~1 час 50 минут).
Слайды можно найти в базе знаний noml.club и в чате @noml_community.
Сергей Панкратов (GlowByte) — Reinforcement Learning для задачи Next Best Offer. YouTube | Дзен | RuTube (~1 час 50 минут).
Слайды можно найти в базе знаний noml.club и в чате @noml_community.
NoML Recap — внезапно про MLOps
В прошлый четверг была конференция Scoring Day. Коллеги Екатерина Лазаричева из Альфа-Банка и Альфия Харламова из GlowByte выступили там с докладом про продуктивизацию и оркестрацию каскадов ML моделей. Более детальный рассказ по теме был у нас недавно на семинаре:
▫️ Альфия Харламова, Гевонд Асадян, От бизнес-потребности к эксплуатации за 5 шагов: как мы выстроили унифицированный процесс разработки и продуктивизации каскадов связанных ML моделей в Альфа-Банке, 2024. YouTube | Дзен | RuTube (~45 минут).
И в связи с этим событием вспомним еще некоторые (далеко не все) наши мероприятия вокруг платформ для ML и MLOps:
▫️ Михаил Зайцев, Григорий Шутов, Евгений Вилков, Платформа для DS/ML Kolmogorov: архитектура и демо, 2024. YouTube | Дзен | RuTube (~1 час 20 минут);
▫️ Tina Naro, Nathan Mogilchenko, ClearML: Introduction & Demo, 2024. YouTube | Дзен | RuTube (~1 час 45 минут);
▫️ Артём Трофимов, Григорий Шутов, Данил Сивцов, Митап про MLOps: решения GlowByte, Yandex.Cloud и Cloud MLSpace, 2022. YouTube | Дзен | RuTube (~2 часа 20 минут).
Ну и говоря про MLOps нельзя пройти мимо темы FS:
▫️ Feature Store NoML Recap.
В прошлый четверг была конференция Scoring Day. Коллеги Екатерина Лазаричева из Альфа-Банка и Альфия Харламова из GlowByte выступили там с докладом про продуктивизацию и оркестрацию каскадов ML моделей. Более детальный рассказ по теме был у нас недавно на семинаре:
▫️ Альфия Харламова, Гевонд Асадян, От бизнес-потребности к эксплуатации за 5 шагов: как мы выстроили унифицированный процесс разработки и продуктивизации каскадов связанных ML моделей в Альфа-Банке, 2024. YouTube | Дзен | RuTube (~45 минут).
И в связи с этим событием вспомним еще некоторые (далеко не все) наши мероприятия вокруг платформ для ML и MLOps:
▫️ Михаил Зайцев, Григорий Шутов, Евгений Вилков, Платформа для DS/ML Kolmogorov: архитектура и демо, 2024. YouTube | Дзен | RuTube (~1 час 20 минут);
▫️ Tina Naro, Nathan Mogilchenko, ClearML: Introduction & Demo, 2024. YouTube | Дзен | RuTube (~1 час 45 минут);
▫️ Артём Трофимов, Григорий Шутов, Данил Сивцов, Митап про MLOps: решения GlowByte, Yandex.Cloud и Cloud MLSpace, 2022. YouTube | Дзен | RuTube (~2 часа 20 минут).
Ну и говоря про MLOps нельзя пройти мимо темы FS:
▫️ Feature Store NoML Recap.
Семинар про искусство математического моделирования
▫️ 25 сентября (среда), 17:00 МСК
▫️ Подключение→
Выступает: Алексей Ложкинс (LA Optimization)
Тема: Искусство математического моделирования
Аннотация
Промышленное математическое программирование — компромисс полезности моделей и их производительности. В некоторых случаях, производительность возможно повысить путем незначительного изменения исходной модели — об этом поговорим на семинаре.
В рамках доклада рассмотрим несколько задач целочисленного линейного программирования. Примеры призваны помочь в определении того, что есть "хорошая" и "плохая" модель.
Уровень сложности: средний, для понимания материала будет достаточно общих знаний об области исследования операций. В докладе будут фигурировать такие задачи, как поток минимальной стоимости, задача о разбиении множества и транспортная задача.
▫️ 25 сентября (среда), 17:00 МСК
▫️ Подключение→
Выступает: Алексей Ложкинс (LA Optimization)
Тема: Искусство математического моделирования
Аннотация
Промышленное математическое программирование — компромисс полезности моделей и их производительности. В некоторых случаях, производительность возможно повысить путем незначительного изменения исходной модели — об этом поговорим на семинаре.
В рамках доклада рассмотрим несколько задач целочисленного линейного программирования. Примеры призваны помочь в определении того, что есть "хорошая" и "плохая" модель.
Уровень сложности: средний, для понимания материала будет достаточно общих знаний об области исследования операций. В докладе будут фигурировать такие задачи, как поток минимальной стоимости, задача о разбиении множества и транспортная задача.
NoML Digest
Про конфиденциальную аналитику В среду поучаствовал в IV встрече экспертного сообщества по криптографии и большим данным. Мероприятие было организовано компанией Криптонит @kryptonite_channel и проходило в Музее криптографии @cryptography_museum (кстати,…
Про доверенный ИИ и AI TRiSM
Появилась запись встречи экспертного сообщества по криптографии и большим данным от 28 августа 2024 года по теме “Доверенный ИИ”:
▫️ RuTube | VK Видео (~2 часа 30 минут).
Еще вслед небольшая мысль, которую не успел озвучить во время своего выступления. Есть такой термин от Гартнера AI TRiSM (Trust, Risk, Security Management), стоящий на 4-х столпах:
▫️ Explainability / Model Monitoring;
▫️ ModelOps;
▫️ AI Application Security;
▫️ (Data) Privacy.
Все эти темы как раз детально обсудили на встрече экспертного сообщества 28 августа.
По нашему мнению есть еще один важный столп, который должны накрывать вопросы доверенного ИИ, это:
▫️ Процессы принятия решений.
Ведь степень доверия к технологиям и методам DS/ML/AI не может быть абсолютной, она всегда относительна — относительна бизнес-приложениям, в которых используются эти методы, то есть принятию решений, которые частично или полностью автоматизируются с помощью ИИ.
А математическая оптимизация и исследование операций, которые мы тут активно продвигаем — это как раз про моделирование для автоматизации принятия решений.
Появилась запись встречи экспертного сообщества по криптографии и большим данным от 28 августа 2024 года по теме “Доверенный ИИ”:
▫️ RuTube | VK Видео (~2 часа 30 минут).
Еще вслед небольшая мысль, которую не успел озвучить во время своего выступления. Есть такой термин от Гартнера AI TRiSM (Trust, Risk, Security Management), стоящий на 4-х столпах:
▫️ Explainability / Model Monitoring;
▫️ ModelOps;
▫️ AI Application Security;
▫️ (Data) Privacy.
Все эти темы как раз детально обсудили на встрече экспертного сообщества 28 августа.
По нашему мнению есть еще один важный столп, который должны накрывать вопросы доверенного ИИ, это:
▫️ Процессы принятия решений.
Ведь степень доверия к технологиям и методам DS/ML/AI не может быть абсолютной, она всегда относительна — относительна бизнес-приложениям, в которых используются эти методы, то есть принятию решений, которые частично или полностью автоматизируются с помощью ИИ.
А математическая оптимизация и исследование операций, которые мы тут активно продвигаем — это как раз про моделирование для автоматизации принятия решений.
Про методы ускорения солверов
Алексейс вчера на семинаре сделал интересный доклад про то, как переформулировка постановки задач мат. оптимизации помогает существенно повысить производительность солвера. После доклада у нас случилась небольшая дискуссия, на которой вспоминали про другие способы ускорения солверов, так что пока ждем запись вчерашнего семинара, можно вспомнить доклады по этой теме:
▫️ Семён Косяченко, ML в задачах смешанной линейно-целочисленной оптимизации. ZyOpt, 2023. YouTube | Дзен | RuTube (~1 час 20 минут);
▫️ Максим Гончаров, Алексей Никоноров, Опыт по ускорению оптимизационных open source солверов на примере решения задачи NBO, 2024. YouTube | Дзен | RuTube (~1 час 45 минут).
А еще вспоминали квантовые компьютеры, так что про квантово-вдохновленную оптимизацию тоже будет в тему:
▫️ Сергей Усманов, Квантово-вдохновленные алгоритмы оптимизации для прикладных задач, 2024. YouTube | Дзен | RuTube (~1 час 25 минут).
Другие доклады по мат. оптимизации и исследованию операций можно найти в нашей базе знаний noml.club, есть соответствующий тег.
Алексейс вчера на семинаре сделал интересный доклад про то, как переформулировка постановки задач мат. оптимизации помогает существенно повысить производительность солвера. После доклада у нас случилась небольшая дискуссия, на которой вспоминали про другие способы ускорения солверов, так что пока ждем запись вчерашнего семинара, можно вспомнить доклады по этой теме:
▫️ Семён Косяченко, ML в задачах смешанной линейно-целочисленной оптимизации. ZyOpt, 2023. YouTube | Дзен | RuTube (~1 час 20 минут);
▫️ Максим Гончаров, Алексей Никоноров, Опыт по ускорению оптимизационных open source солверов на примере решения задачи NBO, 2024. YouTube | Дзен | RuTube (~1 час 45 минут).
А еще вспоминали квантовые компьютеры, так что про квантово-вдохновленную оптимизацию тоже будет в тему:
▫️ Сергей Усманов, Квантово-вдохновленные алгоритмы оптимизации для прикладных задач, 2024. YouTube | Дзен | RuTube (~1 час 25 минут).
Другие доклады по мат. оптимизации и исследованию операций можно найти в нашей базе знаний noml.club, есть соответствующий тег.
Мероприятия NoML в октябре
Полный план онлайн семинаров на следующий месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 02.10 | Александр Рыжков (Sber AI Lab), Как LightAutoML победил на Kaggle AutoML Grand Prix 2024?
▫️ 09.10 | Алексей Тарасов (Разумное Расписание), Алгоритм огранки бриллиантов на основе методов нелинейной оптимизации;
▫️ 16.10 | Илья Герасимов (Криптонит, ВМК МГУ), О схемах полностью гомоморфного шифрования: реализации, применение и стойкость;
▫️ 23.10 | (Тема будет объявлена позже);
▫️ 30.10 | Фёдор Смирнов (GlowByte), Вероятностное программирование для кластеризации временных рядов.
Ссылка для подключения: Google Meet→
Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.
Полный план онлайн семинаров на следующий месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 02.10 | Александр Рыжков (Sber AI Lab), Как LightAutoML победил на Kaggle AutoML Grand Prix 2024?
▫️ 09.10 | Алексей Тарасов (Разумное Расписание), Алгоритм огранки бриллиантов на основе методов нелинейной оптимизации;
▫️ 16.10 | Илья Герасимов (Криптонит, ВМК МГУ), О схемах полностью гомоморфного шифрования: реализации, применение и стойкость;
▫️ 23.10 | (Тема будет объявлена позже);
▫️ 30.10 | Фёдор Смирнов (GlowByte), Вероятностное программирование для кластеризации временных рядов.
Ссылка для подключения: Google Meet→
Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.