Семинар про бизнес кейсы Causal Inference
▫️ 27 ноября (среда), 17:00 МСК
▫️ Подключение→
Выступает: Вадим Андреевич Порватов, ML Engineer, Skoltech
Тема: Causal Inference для вашего проекта: обзор кейсов
Аннотация
Бизнес задачи на базе аналитики и DS/ML требуют не только определения корреляций в данных, но и понимания истинных причинно-следственных связей в процессах генеририрующих эти данные. На семинаре расскажем как графы и методы из uplift-моделирования помогают приблизиться к выявлению причинности, а также поговорим, кто и где этим сейчас занимается, в том числе на примере боевых кейсов команды GlowByte Advanced Analytics.
Рассмотрим:
▫️ Основные концепции причинно-следственного анализа (Causal Inference): графовые вероятностные модели, байесовские сети, свойства сепарации и условной независимости;
▫️ Преимущества использования графов для визуализации и анализа сложных систем и их причинно-следственных связей;
▫️ Основные алгоритмы обучения структур и параметров байесовских сетей;
▫️ Два практических кейса: маркетинг — оценка эффекта от нетаргетированных кампаний и цепи поставок — оценка влияния факторов и событий на основные финансовые показатели.
Уровень сложности: начинающий, доклад рассчитан на широкую публику с базовыми знаниями об алгоритмах оценки эффекта.
Ключевые слова: causal inference, causal discovery, байесовские сети, uplift моделирование.
▫️ 27 ноября (среда), 17:00 МСК
▫️ Подключение→
Выступает: Вадим Андреевич Порватов, ML Engineer, Skoltech
Тема: Causal Inference для вашего проекта: обзор кейсов
Аннотация
Бизнес задачи на базе аналитики и DS/ML требуют не только определения корреляций в данных, но и понимания истинных причинно-следственных связей в процессах генеририрующих эти данные. На семинаре расскажем как графы и методы из uplift-моделирования помогают приблизиться к выявлению причинности, а также поговорим, кто и где этим сейчас занимается, в том числе на примере боевых кейсов команды GlowByte Advanced Analytics.
Рассмотрим:
▫️ Основные концепции причинно-следственного анализа (Causal Inference): графовые вероятностные модели, байесовские сети, свойства сепарации и условной независимости;
▫️ Преимущества использования графов для визуализации и анализа сложных систем и их причинно-следственных связей;
▫️ Основные алгоритмы обучения структур и параметров байесовских сетей;
▫️ Два практических кейса: маркетинг — оценка эффекта от нетаргетированных кампаний и цепи поставок — оценка влияния факторов и событий на основные финансовые показатели.
Уровень сложности: начинающий, доклад рассчитан на широкую публику с базовыми знаниями об алгоритмах оценки эффекта.
Ключевые слова: causal inference, causal discovery, байесовские сети, uplift моделирование.
NoML Recap — Байесовские сети и причинно-следственный анализ
Семинары, которые были у нас ранее:
▫️ Подробный доклад (на слайдах в конце есть обширный список литературы, включая статьи с важными результатами про байесовские сети): Максим Гончаров (GlowByte), От байесовских сетей к структурным причинно-следственным моделям, 2022. YouTube | Дзен | RuTube (~2 часа);
▫️ Во второй части этого доклада можно найти хорошее введение в байесовские сети: Фёдор Смирнов, Гузелия Мошнина, Рахмет Оджаев (GlowByte), Методы генерации синтетических данных, 2023. YouTube | Дзен | RuTube (~1 час 40 минут);
▫️ Доклад про причинно-следственный анализ в целом: Полина Окунева (GlowByte), Методы Causal Inference, 2022. YouTube | Дзен | RuTube (~1 час 40 минут).
Учебники и книги, которые рекомендуют участники нашего сообщества:
▫️ J. Pearl, D. Mackenzie, The Book of Why: The New Science of Cause and Effect, 2018;
▫️ J. Pearl, Causality: Models, Reasoning, and Inference, 2009;
▫️ J. Peters, D. Janzing , B. Schölkopf, Elements of Causal Inference: Foundations and Learning Algorithms, 2017;
▫️ R.E. Neapolitan, Learning Bayesian Networks, 2003;
▫️ F.V. Jensen, T.D. Nielsen, Bayesian Networks and Decision Graphs, 2007;
▫️ D. Koller, N. Friedman, Probabilistic Graphical Models: Principles and Techniques, 2009.
Курсы на Coursera:
▫️ Probabilistic Graphical Models Specialization.
Семинары, которые были у нас ранее:
▫️ Подробный доклад (на слайдах в конце есть обширный список литературы, включая статьи с важными результатами про байесовские сети): Максим Гончаров (GlowByte), От байесовских сетей к структурным причинно-следственным моделям, 2022. YouTube | Дзен | RuTube (~2 часа);
▫️ Во второй части этого доклада можно найти хорошее введение в байесовские сети: Фёдор Смирнов, Гузелия Мошнина, Рахмет Оджаев (GlowByte), Методы генерации синтетических данных, 2023. YouTube | Дзен | RuTube (~1 час 40 минут);
▫️ Доклад про причинно-следственный анализ в целом: Полина Окунева (GlowByte), Методы Causal Inference, 2022. YouTube | Дзен | RuTube (~1 час 40 минут).
Учебники и книги, которые рекомендуют участники нашего сообщества:
▫️ J. Pearl, D. Mackenzie, The Book of Why: The New Science of Cause and Effect, 2018;
▫️ J. Pearl, Causality: Models, Reasoning, and Inference, 2009;
▫️ J. Peters, D. Janzing , B. Schölkopf, Elements of Causal Inference: Foundations and Learning Algorithms, 2017;
▫️ R.E. Neapolitan, Learning Bayesian Networks, 2003;
▫️ F.V. Jensen, T.D. Nielsen, Bayesian Networks and Decision Graphs, 2007;
▫️ D. Koller, N. Friedman, Probabilistic Graphical Models: Principles and Techniques, 2009.
Курсы на Coursera:
▫️ Probabilistic Graphical Models Specialization.
Мероприятия NoML в декабре
План мероприятий на ближайший месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 04.12 | онлайн | Фёдор Смирнов (GlowByte Advanced Analytics), Вероятностное программирование для сегментации и восстановления временных рядов;
▫️ 11.12 | офлайн | Круглый стол: Семён Косяченко, Александр Попков, Глеб Канин (Оптимакрос); Василий Замолотов (Аксеникс); Алексей Тарасов (Разумное Расписание); Алексейс Ложкинс (LA Optimization); Максим Гончаров, Павел Снурницын (GlowByte); Математическая оптимизация: подходы, технологии, бизнес задачи и тренды;
▫️ 18.12 | онлайн | Александр Гавриков (Т-Банк, R&D центр), Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований;
▫️ 25.12 | онлайн | Максим Гончаров, Павел Снурницын (GlowByte Advanced Analytics), Интеллект принятия решений: почему в эру ИИ не стоит забывать о классических методах математического моделирования;
Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются детали предстоящих докладов.
План мероприятий на ближайший месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 04.12 | онлайн | Фёдор Смирнов (GlowByte Advanced Analytics), Вероятностное программирование для сегментации и восстановления временных рядов;
▫️ 11.12 | офлайн | Круглый стол: Семён Косяченко, Александр Попков, Глеб Канин (Оптимакрос); Василий Замолотов (Аксеникс); Алексей Тарасов (Разумное Расписание); Алексейс Ложкинс (LA Optimization); Максим Гончаров, Павел Снурницын (GlowByte); Математическая оптимизация: подходы, технологии, бизнес задачи и тренды;
▫️ 18.12 | онлайн | Александр Гавриков (Т-Банк, R&D центр), Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований;
▫️ 25.12 | онлайн | Максим Гончаров, Павел Снурницын (GlowByte Advanced Analytics), Интеллект принятия решений: почему в эру ИИ не стоит забывать о классических методах математического моделирования;
Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются детали предстоящих докладов.
Семинар про вероятностное программирование и временные ряды
▫️ 4 декабря (среда), 17:00 МСК
▫️ Подключение→
Выступает: Фёдор Смирнов, тимлид DS, практика Advanced Analytics GlowByte
Тема: Вероятностное программирование для сегментации и восстановления временных рядов
Аннотация
На семинаре будут рассмотрены упрощенные модельные примеры использования аппарата вероятностного программирования для работы с временными рядами. В частности, мы поговорим про подход к сегментации, ознакомимся с игрушечным примером восстановления промо-календаря из временного ряда, а также затронем другие области применения этого аппарата. Будет показано, как с помощью структурно-вероятностной модели и набора гипотез можно решать типовые задачи на временных рядах. В конце доклада будет представлен пример решения упрощённой задачи классическим байесовским методом без использования специализированных фреймворков.
Уровень сложности: начинающий; от слушателей ожидается: базовые знания вероятности и статистики, начальное понимание концепций временных рядов, интерес к применению вероятностных методов в анализе данных.
Ключевые слова: вероятностное программирование, структурно-вероятностные модели, map-оценка , сэмплирование, байесовские методы, анализ временных рядов.
▫️ 4 декабря (среда), 17:00 МСК
▫️ Подключение→
Выступает: Фёдор Смирнов, тимлид DS, практика Advanced Analytics GlowByte
Тема: Вероятностное программирование для сегментации и восстановления временных рядов
Аннотация
На семинаре будут рассмотрены упрощенные модельные примеры использования аппарата вероятностного программирования для работы с временными рядами. В частности, мы поговорим про подход к сегментации, ознакомимся с игрушечным примером восстановления промо-календаря из временного ряда, а также затронем другие области применения этого аппарата. Будет показано, как с помощью структурно-вероятностной модели и набора гипотез можно решать типовые задачи на временных рядах. В конце доклада будет представлен пример решения упрощённой задачи классическим байесовским методом без использования специализированных фреймворков.
Уровень сложности: начинающий; от слушателей ожидается: базовые знания вероятности и статистики, начальное понимание концепций временных рядов, интерес к применению вероятностных методов в анализе данных.
Ключевые слова: вероятностное программирование, структурно-вероятностные модели, map-оценка , сэмплирование, байесовские методы, анализ временных рядов.
Про SMT и SAT
Недавно у нас был вот такой доклад:
▫️ Константин Чухарев (ИТМО, Huawei), От SAT к SMT: новый рубеж в решении задач и формальной верификации. YouTube | Дзен | RuTube (~1 час 10 минут).
А ранее в этом году был еще вот такой:
▫️ Александр Андреев (ИТМО, GlowByte), Алгоритмы решения SAT: теоретические и практические аспекты. YouTube | Дзен | RuTube (~55 минут).
Ниже некоторые материалы по теме от участников нашего сообщества.
Для начинающих:
▫️ Простая и понятная статья, посвящённая использованию решателя Z3: Understanding SMT solvers: An Introduction to Z3 (~20 минут).
Верификация ПО — SMT-решатели значительно упрощают процесс проверки корректности программ:
▫️ Symbolic analyzer для TVM (The Telegram Open Network Virtual Machine), основанный на USVM: espritoxyz/tool;
▫️ Универсальная символическая виртуальная машина для анализа программ на Java, Python, Go: USVM;
▫️ Инструмент проверки смарт-контрактов на соответствие спецификациям: Certora.
Проверка и анализ политик безопасности — применение Automated Reasoning, кейс AWS:
▫️ Neha Rungta, A billion SMT queries a day, 2022 (~55 минут);
▫️ Andrew Gacek, How AWS uses automated reasoning to help you achieve security at scale, 2018 (~10 минут).
Реверс-инжиниринг — SMT решатели помогают анализировать программы, изучать их поведение и находить уязвимости:
▫️ Однодневный воркшоп по использованию SMT-решателей для реверс-инжиниринга. Есть примеры решение интересных CTF задач: SMT Solver Workshop, 2016.
И в тему прошлой недели: байесовские сети и причинно следственный анализ — алгоритмы обучения структуры сети на базе SAT:
▫️ S. Triantafillou, I. Tsamardinos, I.G. Tollis, Learning Causal Structure from Overlapping Variable Sets, 2010 (8 стр., ~30-40 минут);
▫️ A. Hyttinen, P.O. Hoyer, F. Eberhardt, M. Jarvisalo, Discovering Cyclic Causal Models with Latent Variables: A General SAT-Based Procedure, 2013 (9 стр., ~35-45 минут).
Недавно у нас был вот такой доклад:
▫️ Константин Чухарев (ИТМО, Huawei), От SAT к SMT: новый рубеж в решении задач и формальной верификации. YouTube | Дзен | RuTube (~1 час 10 минут).
А ранее в этом году был еще вот такой:
▫️ Александр Андреев (ИТМО, GlowByte), Алгоритмы решения SAT: теоретические и практические аспекты. YouTube | Дзен | RuTube (~55 минут).
Ниже некоторые материалы по теме от участников нашего сообщества.
Для начинающих:
▫️ Простая и понятная статья, посвящённая использованию решателя Z3: Understanding SMT solvers: An Introduction to Z3 (~20 минут).
Верификация ПО — SMT-решатели значительно упрощают процесс проверки корректности программ:
▫️ Symbolic analyzer для TVM (The Telegram Open Network Virtual Machine), основанный на USVM: espritoxyz/tool;
▫️ Универсальная символическая виртуальная машина для анализа программ на Java, Python, Go: USVM;
▫️ Инструмент проверки смарт-контрактов на соответствие спецификациям: Certora.
Проверка и анализ политик безопасности — применение Automated Reasoning, кейс AWS:
▫️ Neha Rungta, A billion SMT queries a day, 2022 (~55 минут);
▫️ Andrew Gacek, How AWS uses automated reasoning to help you achieve security at scale, 2018 (~10 минут).
Реверс-инжиниринг — SMT решатели помогают анализировать программы, изучать их поведение и находить уязвимости:
▫️ Однодневный воркшоп по использованию SMT-решателей для реверс-инжиниринга. Есть примеры решение интересных CTF задач: SMT Solver Workshop, 2016.
И в тему прошлой недели: байесовские сети и причинно следственный анализ — алгоритмы обучения структуры сети на базе SAT:
▫️ S. Triantafillou, I. Tsamardinos, I.G. Tollis, Learning Causal Structure from Overlapping Variable Sets, 2010 (8 стр., ~30-40 минут);
▫️ A. Hyttinen, P.O. Hoyer, F. Eberhardt, M. Jarvisalo, Discovering Cyclic Causal Models with Latent Variables: A General SAT-Based Procedure, 2013 (9 стр., ~35-45 минут).
NoML Recap — вероятностное программирование
Семинар вчера был в формате воркшопа, пока ждем запись и код, рекомендуем пересмотреть предыдущий доклад по теме:
▫️ Максим Гончаров (GlowByte), Вероятностное программирование: использование генеративных моделей для восстановления ненаблюдаемых факторов, 2022. YouTube | Дзен | RuTube (~2 часа 10 минут).
Плюс подборка материалов (введение в Pyro, другие фреймворки, литература):
▫️Про вероятностное программирование.
Семинар вчера был в формате воркшопа, пока ждем запись и код, рекомендуем пересмотреть предыдущий доклад по теме:
▫️ Максим Гончаров (GlowByte), Вероятностное программирование: использование генеративных моделей для восстановления ненаблюдаемых факторов, 2022. YouTube | Дзен | RuTube (~2 часа 10 минут).
Плюс подборка материалов (введение в Pyro, другие фреймворки, литература):
▫️Про вероятностное программирование.
Очная встреча про математическую оптимизацию
▫️ 11 декабря (среда), 17:00 МСК
▫️ Место встречи: г. Москва, Нижний Сусальный пер., д. 5 стр. 19 (БЦ Арма, офис компании GlowByte), вход свободный, ставьте 💯, если придёте очно
▫️ Онлайн-трансляция будет на нашем YouTube канале
Тема: Математическая оптимизация: подходы, технологии, бизнес задачи и тренды
Приглашенные эксперты:
▫️ Семён Косяченко, Александр Попков, Глеб Канин (Optimacros);
▫️ Василий Замолотов (Axenix);
▫️ Алексейс Ложкинс (LA Optimization / BIA Technologies);
▫️ Алексей Тарасов (Разумное Расписание);
▫️ Максим Гончаров (GlowByte Advanced Analytics).
Модератор дискуссии:
▫️ Павел Снурницын (GlowByte Advanced Analytics).
План встречи:
В первой части приглашенные эксперты расскажут о своем опыте применения методов математической оптимизации и исследования операций в реальных бизнес-задачах. Они поделятся примерами успешных проектов, обсудят актуальные проблемы и вызовы, с которыми сталкиваются, и способы их решения.
Во второй части мероприятия состоится панельная дискуссия, где эксперты и участники смогут обсудить ключевые вопросы, посвященные следующим темам:
▫️ Технологии и методы
— Возможности российских вендоров и open-source решений для разработки и отладки оптимизационных моделей.
— Выбор оптимальной стратегии для решения задач: классические методы, метаэвристики или имитационное моделирование, их преимущества и ограничения в различных сценариях.
— Актуальные потребности бизнеса в готовых программных продуктах на базе математической оптимизации, включая решения для логистики, графикования, интегрированного планирования и других задач в области управления цепями поставок.
▫️ Продуктивизация
— Учет жестких временных ограничений на принятие решений в реальных системах и другие вопросы системного дизайна промышленных сервисов на основе математической оптимизации.
— Способы, фреймворки и метрики для эффективного взаимодействия с бизнес-заказчиками, не обладающими глубокими знаниями в области математической оптимизации.
— Особенности управления модельным риском в случае оптимизационного и имитационного моделирования.
▫️ Кадры и обучение
— Вход в профессию: роль академического образования и самообучения в подготовке специалистов.
— Способы повышения квалификации и профессионального роста в области исследования операций.
— Взаимодействие академической среды и индустрии не только в области образования, но и для совместного решения прикладных и научных задач.
▫️ Тренды
— Интеграция ИИ в настройку оптимизационных солверов.
— Новые инструменты и подходы при решении из области исследования операций.
— Личные наблюдения участников и глобальные тенденции.
После официальной части в каком нибудь пабе неподалеку можно будет более плотно обсудить насущные вопросы;)
Мероприятие организовано при поддержке Optimacros и GlowByte.
▫️ 11 декабря (среда), 17:00 МСК
▫️ Место встречи: г. Москва, Нижний Сусальный пер., д. 5 стр. 19 (БЦ Арма, офис компании GlowByte), вход свободный, ставьте 💯, если придёте очно
▫️ Онлайн-трансляция будет на нашем YouTube канале
Тема: Математическая оптимизация: подходы, технологии, бизнес задачи и тренды
Приглашенные эксперты:
▫️ Семён Косяченко, Александр Попков, Глеб Канин (Optimacros);
▫️ Василий Замолотов (Axenix);
▫️ Алексейс Ложкинс (LA Optimization / BIA Technologies);
▫️ Алексей Тарасов (Разумное Расписание);
▫️ Максим Гончаров (GlowByte Advanced Analytics).
Модератор дискуссии:
▫️ Павел Снурницын (GlowByte Advanced Analytics).
План встречи:
В первой части приглашенные эксперты расскажут о своем опыте применения методов математической оптимизации и исследования операций в реальных бизнес-задачах. Они поделятся примерами успешных проектов, обсудят актуальные проблемы и вызовы, с которыми сталкиваются, и способы их решения.
Во второй части мероприятия состоится панельная дискуссия, где эксперты и участники смогут обсудить ключевые вопросы, посвященные следующим темам:
▫️ Технологии и методы
— Возможности российских вендоров и open-source решений для разработки и отладки оптимизационных моделей.
— Выбор оптимальной стратегии для решения задач: классические методы, метаэвристики или имитационное моделирование, их преимущества и ограничения в различных сценариях.
— Актуальные потребности бизнеса в готовых программных продуктах на базе математической оптимизации, включая решения для логистики, графикования, интегрированного планирования и других задач в области управления цепями поставок.
▫️ Продуктивизация
— Учет жестких временных ограничений на принятие решений в реальных системах и другие вопросы системного дизайна промышленных сервисов на основе математической оптимизации.
— Способы, фреймворки и метрики для эффективного взаимодействия с бизнес-заказчиками, не обладающими глубокими знаниями в области математической оптимизации.
— Особенности управления модельным риском в случае оптимизационного и имитационного моделирования.
▫️ Кадры и обучение
— Вход в профессию: роль академического образования и самообучения в подготовке специалистов.
— Способы повышения квалификации и профессионального роста в области исследования операций.
— Взаимодействие академической среды и индустрии не только в области образования, но и для совместного решения прикладных и научных задач.
▫️ Тренды
— Интеграция ИИ в настройку оптимизационных солверов.
— Новые инструменты и подходы при решении из области исследования операций.
— Личные наблюдения участников и глобальные тенденции.
После официальной части в каком нибудь пабе неподалеку можно будет более плотно обсудить насущные вопросы;)
Мероприятие организовано при поддержке Optimacros и GlowByte.
NoML Recap — доклады экспертов круглого стола
Почти все эксперты завтрашней встречи выступали у нас ранее (а кто-то даже не один раз), напомним некоторые доклады:
▫️ Семён Косяченко, Решение задачи балансов на графе и поиск ошибок измерителей с помощью нейросетей, 2024. YouTube | Дзен | RuTube (~1 час 5 минут).
▫️ Василий Замолотов, Эффективное планирование шихтования и оптимизация логистики, 2023. YouTube | Дзен | RuTube (~1 час 5 минут).
▫️ Алексейс Ложкинс, Искусство математического моделирования, 2024. YouTube | Дзен | RuTube (~1 час 30 минут).
▫️ Алексей Тарасов, Алгоритм огранки бриллиантов на основе методов нелинейной оптимизации, 2024. YouTube | Дзен | RuTube (~1 час 20 минут).
▫️ Максим Гончаров, Введение в прикладную математическую оптимизацию, 2023. YouTube | Дзен | RuTube (~1 час 35 минут).
Приходите завтра на нашу встречу сообщества, познакомимся в офлайне.
Почти все эксперты завтрашней встречи выступали у нас ранее (а кто-то даже не один раз), напомним некоторые доклады:
▫️ Семён Косяченко, Решение задачи балансов на графе и поиск ошибок измерителей с помощью нейросетей, 2024. YouTube | Дзен | RuTube (~1 час 5 минут).
▫️ Василий Замолотов, Эффективное планирование шихтования и оптимизация логистики, 2023. YouTube | Дзен | RuTube (~1 час 5 минут).
▫️ Алексейс Ложкинс, Искусство математического моделирования, 2024. YouTube | Дзен | RuTube (~1 час 30 минут).
▫️ Алексей Тарасов, Алгоритм огранки бриллиантов на основе методов нелинейной оптимизации, 2024. YouTube | Дзен | RuTube (~1 час 20 минут).
▫️ Максим Гончаров, Введение в прикладную математическую оптимизацию, 2023. YouTube | Дзен | RuTube (~1 час 35 минут).
Приходите завтра на нашу встречу сообщества, познакомимся в офлайне.
Семинар про Influence Maximization
▫️ 18 декабря (среда), 17:00 МСК
▫️ Подключение→
Выступает: Александр Гавриков, Senior Researcher R&D центра Т-Банка
Тема: Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований
Аннотация
Задача Influence Maximization занимает ключевое место в сфере анализа социальных сетей и мессенджеров, где основная цель заключается в определении узлов, способных максимально эффективно распространять информацию среди пользователей. В докладе рассматриваются современные исследования и разработки алгоритмов, освещаются текущие тренды и методы решения, их достоинства, недостатки и ограничения. Презентация включает в себя как теоретические обзоры, так и практические примеры применения данных методов в различных индустриях, что делает её актуальной для специалистов в областях дискретной математики и Computer Science.
Уровень сложности: продвинутый, для понимания доклада требуются базовые знания дискретной математики, теории вероятностей, теории графов и временной сложности алгоритмов
Ключевые слова: Influence Maximization, Influence propagation models, Independent cascade, Linear Threshold, CELF, TIM+, IMM, CoFIM, Community-based models
▫️ 18 декабря (среда), 17:00 МСК
▫️ Подключение→
Выступает: Александр Гавриков, Senior Researcher R&D центра Т-Банка
Тема: Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований
Аннотация
Задача Influence Maximization занимает ключевое место в сфере анализа социальных сетей и мессенджеров, где основная цель заключается в определении узлов, способных максимально эффективно распространять информацию среди пользователей. В докладе рассматриваются современные исследования и разработки алгоритмов, освещаются текущие тренды и методы решения, их достоинства, недостатки и ограничения. Презентация включает в себя как теоретические обзоры, так и практические примеры применения данных методов в различных индустриях, что делает её актуальной для специалистов в областях дискретной математики и Computer Science.
Уровень сложности: продвинутый, для понимания доклада требуются базовые знания дискретной математики, теории вероятностей, теории графов и временной сложности алгоритмов
Ключевые слова: Influence Maximization, Influence propagation models, Independent cascade, Linear Threshold, CELF, TIM+, IMM, CoFIM, Community-based models
Семинар не только про ML
▫️ 25 декабря (среда), 17:00 МСК
▫️ Подключение→
Выступают: Максим Гончаров, Павел Снурницын (GlowByte Advanced Analytics)
Тема: Not only ML или Почему в эру ИИ не стоит забывать о классических методах мат. моделирования
Аннотация
На заключительном в этом году семинаре поговорим не только про ML) Подведём итоги не только этого года но и вообще последних лет существования сообщества NoML и нашей команды в GlowByte AA.
▫️ Разберём таксономию современных прикладных аналитических методов, включая прогнозную, описательную и предписательную аналитику. Обсудим, где место последним нашумевшим технологиям, таким как LLM и GenAI, в этой структуре.
▫️ Рассмотрим также применение методов имитационного моделирования, дизайна экспериментов, обучения с подкреплением, динамического программирования и причинно-следственного анализа для решения сложных бизнес-задач.
▫️ Пройдемся по практическим кейсам применения прогнозных, оптимизационных и имитационных моделей для решения бизнес-задач в различных отраслях, таких как производство, логистика, ритейл, финансовый сектор и др. Обсудим, как совместное использование разнообразных методов и подходов помогает получать результаты принципиально другого характера.
▫️ Обсудим текущий ландшафт технологий для оптимизации и исследования операций, включая вызовы, связанные с импортозамещением. В заключение поговорим про системный дизайн, модельный риск и вопросы доверенного ИИ.
Уровень сложности: начинающий, семинар носит обзорный (а может быть даже и программный характер) и ориентирован на слушателей имеющих практический опыт работы в проектах на стыке анализа данных, мат. оптимизации и исследования операций.
Ключевые слова: прогнозная, описательная и предписательная аналитика, математическая оптимизация, имитационное моделирование, исследование операций, причинно-следственный анализ, модельный риск, доверенный ИИ.
▫️ 25 декабря (среда), 17:00 МСК
▫️ Подключение→
Выступают: Максим Гончаров, Павел Снурницын (GlowByte Advanced Analytics)
Тема: Not only ML или Почему в эру ИИ не стоит забывать о классических методах мат. моделирования
Аннотация
На заключительном в этом году семинаре поговорим не только про ML) Подведём итоги не только этого года но и вообще последних лет существования сообщества NoML и нашей команды в GlowByte AA.
▫️ Разберём таксономию современных прикладных аналитических методов, включая прогнозную, описательную и предписательную аналитику. Обсудим, где место последним нашумевшим технологиям, таким как LLM и GenAI, в этой структуре.
▫️ Рассмотрим также применение методов имитационного моделирования, дизайна экспериментов, обучения с подкреплением, динамического программирования и причинно-следственного анализа для решения сложных бизнес-задач.
▫️ Пройдемся по практическим кейсам применения прогнозных, оптимизационных и имитационных моделей для решения бизнес-задач в различных отраслях, таких как производство, логистика, ритейл, финансовый сектор и др. Обсудим, как совместное использование разнообразных методов и подходов помогает получать результаты принципиально другого характера.
▫️ Обсудим текущий ландшафт технологий для оптимизации и исследования операций, включая вызовы, связанные с импортозамещением. В заключение поговорим про системный дизайн, модельный риск и вопросы доверенного ИИ.
Уровень сложности: начинающий, семинар носит обзорный (а может быть даже и программный характер) и ориентирован на слушателей имеющих практический опыт работы в проектах на стыке анализа данных, мат. оптимизации и исследования операций.
Ключевые слова: прогнозная, описательная и предписательная аналитика, математическая оптимизация, имитационное моделирование, исследование операций, причинно-следственный анализ, модельный риск, доверенный ИИ.
Запись семинара
Запись семинара прошедшего 25 декабря:
Максим Гончаров, Павел Снурницын (GlowByte), Not only ML или Почему в эру ИИ не стоит забывать о классических методах мат. моделирования. YouTube | Дзен | RuTube (~1 час 55 минут).
Продолжим наши еженедельные мероприятиям в конце января / начале февраля.
Запись семинара прошедшего 25 декабря:
Максим Гончаров, Павел Снурницын (GlowByte), Not only ML или Почему в эру ИИ не стоит забывать о классических методах мат. моделирования. YouTube | Дзен | RuTube (~1 час 55 минут).
Продолжим наши еженедельные мероприятиям в конце января / начале февраля.
Мероприятия NoML в феврале
План семинаров на ближайший месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 05.02 | Дмитрий Васильков (QuSolve), Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet;
▫️ 12.02 | Егор Дудырев (НИУ ВШЭ, Университет Лотарингии), Кластеризация на правилах или как найти кластеризации, которые легко объяснить;
▫️ 19.02 | Алан-Барсаг Газзаев (MTS AI, ИТМО), Обучение языковой модели Cotype Nano;
▫️ 26.02 | Ярослав Шмулев (R77 AI), Рекомендательная система для завода по оптимизации процесса производства стали;
Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются детали предстоящих докладов и ссылки для подключения.
План семинаров на ближайший месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 05.02 | Дмитрий Васильков (QuSolve), Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet;
▫️ 12.02 | Егор Дудырев (НИУ ВШЭ, Университет Лотарингии), Кластеризация на правилах или как найти кластеризации, которые легко объяснить;
▫️ 19.02 | Алан-Барсаг Газзаев (MTS AI, ИТМО), Обучение языковой модели Cotype Nano;
▫️ 26.02 | Ярослав Шмулев (R77 AI), Рекомендательная система для завода по оптимизации процесса производства стали;
Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются детали предстоящих докладов и ссылки для подключения.
Семинар про интерпретируемый ИИ и солвер OptJet
▫️ 5 февраля (среда), 17:00 МСК
▫️ Подключение→
Выступает: Дмитрий Васильков, генеральный директор QuSolve
Тема: Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet
Аннотация
ML-модели и ИИ в целом все шире используются в областях, где цена ошибки при принятии решения высока (например, в медицине или финансах). В связи с этим активно развиваются методы объяснения и проверки тех или иных решений, принимаемых ИИ-системами. Эта область знаний получила название “интерпретируемый ИИ” (Explainable AI, XAI). Существующие методы XAI можно подразделить на эвристические и строгие: первые простые и быстрые, зато вторые точные и надежные. Один из эффективных строгих методов — представление ML-модели в виде множества логических высказываний и использование аппарата формальной логики и созданных на его основе вычислительных алгоритмов для поиска минимального набора критериев, на основе которых исследуемая ML-модель принимает то или иное решение. В докладе расскажем об использовании алгоритма MaxSAT, реализованного в солвере OptJet, для интерпретации ансамблевых ML-моделей.
Уровень сложности: начинающий/средний, для понимания доклада будет достаточно базовых знаний по DS/ML и математической оптимизации.
Ключевые слова: интерпретация ML-моделей, интерпретируемый ИИ (XAI), математическая оптимизация, MaxSAT, SAT, оптимизационные решатели/солверы.
▫️ 5 февраля (среда), 17:00 МСК
▫️ Подключение→
Выступает: Дмитрий Васильков, генеральный директор QuSolve
Тема: Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet
Аннотация
ML-модели и ИИ в целом все шире используются в областях, где цена ошибки при принятии решения высока (например, в медицине или финансах). В связи с этим активно развиваются методы объяснения и проверки тех или иных решений, принимаемых ИИ-системами. Эта область знаний получила название “интерпретируемый ИИ” (Explainable AI, XAI). Существующие методы XAI можно подразделить на эвристические и строгие: первые простые и быстрые, зато вторые точные и надежные. Один из эффективных строгих методов — представление ML-модели в виде множества логических высказываний и использование аппарата формальной логики и созданных на его основе вычислительных алгоритмов для поиска минимального набора критериев, на основе которых исследуемая ML-модель принимает то или иное решение. В докладе расскажем об использовании алгоритма MaxSAT, реализованного в солвере OptJet, для интерпретации ансамблевых ML-моделей.
Уровень сложности: начинающий/средний, для понимания доклада будет достаточно базовых знаний по DS/ML и математической оптимизации.
Ключевые слова: интерпретация ML-моделей, интерпретируемый ИИ (XAI), математическая оптимизация, MaxSAT, SAT, оптимизационные решатели/солверы.
Семинар про кластеризацию на базе анализа формальных понятий
▫️ 12 февраля (среда), 17:00 МСК
▫️ Подключение→
Выступает: Егор Дудырев (НИУ ВШЭ, Университет Лотарингии)
Тема: Кластеризация на правилах или как найти кластеризации, которые легко объяснить
Аннотация
В этом докладе мы рассмотрим пайплайн кластеризации на правилах, где каждый кластер задаётся простым, легко читаем условием. В случае с числовыми данными, такие условия будут выглядеть как: "объект x находится в кластере y если значение его 1-го признака x1 лежит в интервале [a, b], а значение десятого признака x10 – в интервале [c, d]".
Предложенный пайплайн ставится в противовес к "традиционному" подходу к кластеризации – где всё внимание уделяется расстоянию между объектами из разных кластеров. Из-за чего появляются кластера, которые трудно интерпретировать. Ведь даже чтобы объяснить, почему объект х лежит в кластере y, нужно нужно сначала посчитать расстояние в многомерном (часто, масштабированном) пространстве между x и всеми кластерами.
Семинар будет построен на основе статьи "Clustering with Stable Pattern Concepts" (предварительная публикация) представленной на воркшопе FCA4AI проходившем в рамках Европейской Конференции по ИИ (ECAI) в октябре 2024 года.
Мы рассмотрим пайплайн состоящий из трёх шагов:
1. как найти хорошие "стабильные" паттерны в данных, которые могут использованы в качестве описаний кластеров;
2. как объединить отдельные кластеры в кластеризации: т.е. как скомбинировать кластеры так, чтобы они покрывали (почти) все данные и при этом (почти) не пересекались;
3. и как из множества найденных кластеризаций выбрать одну наилучшую.
Вторая часть доклада будет посвящена обсуждению алгоритма комбинирования кластеров из шага 2: этот алгоритм получился довольно простым, при этом он содержит множество техник, эффективных для решения комбинаторных задач на бинарных данных.
Уровень сложности: продвинутый, для понимания доклада необходимо базовое представления о задаче кластеризации. В ходе доклада будут использованы термины из областей Frequent Itemset Mining и Subgroup Discovery, поэтому знакомство с этими областями может помочь, но совсем не обязательно. Наконец, рассматриваемый алгоритм является оптимизированной версией обхода графа в ширину, так что он будет полезен людям, знающим базу теории графов.
Ключевые слова: Clustering, Formal Concept Analysis, Pattern Structures, Rare Itemset Mining.
▫️ 12 февраля (среда), 17:00 МСК
▫️ Подключение→
Выступает: Егор Дудырев (НИУ ВШЭ, Университет Лотарингии)
Тема: Кластеризация на правилах или как найти кластеризации, которые легко объяснить
Аннотация
В этом докладе мы рассмотрим пайплайн кластеризации на правилах, где каждый кластер задаётся простым, легко читаем условием. В случае с числовыми данными, такие условия будут выглядеть как: "объект x находится в кластере y если значение его 1-го признака x1 лежит в интервале [a, b], а значение десятого признака x10 – в интервале [c, d]".
Предложенный пайплайн ставится в противовес к "традиционному" подходу к кластеризации – где всё внимание уделяется расстоянию между объектами из разных кластеров. Из-за чего появляются кластера, которые трудно интерпретировать. Ведь даже чтобы объяснить, почему объект х лежит в кластере y, нужно нужно сначала посчитать расстояние в многомерном (часто, масштабированном) пространстве между x и всеми кластерами.
Семинар будет построен на основе статьи "Clustering with Stable Pattern Concepts" (предварительная публикация) представленной на воркшопе FCA4AI проходившем в рамках Европейской Конференции по ИИ (ECAI) в октябре 2024 года.
Мы рассмотрим пайплайн состоящий из трёх шагов:
1. как найти хорошие "стабильные" паттерны в данных, которые могут использованы в качестве описаний кластеров;
2. как объединить отдельные кластеры в кластеризации: т.е. как скомбинировать кластеры так, чтобы они покрывали (почти) все данные и при этом (почти) не пересекались;
3. и как из множества найденных кластеризаций выбрать одну наилучшую.
Вторая часть доклада будет посвящена обсуждению алгоритма комбинирования кластеров из шага 2: этот алгоритм получился довольно простым, при этом он содержит множество техник, эффективных для решения комбинаторных задач на бинарных данных.
Уровень сложности: продвинутый, для понимания доклада необходимо базовое представления о задаче кластеризации. В ходе доклада будут использованы термины из областей Frequent Itemset Mining и Subgroup Discovery, поэтому знакомство с этими областями может помочь, но совсем не обязательно. Наконец, рассматриваемый алгоритм является оптимизированной версией обхода графа в ширину, так что он будет полезен людям, знающим базу теории графов.
Ключевые слова: Clustering, Formal Concept Analysis, Pattern Structures, Rare Itemset Mining.