Telegram Web
Запись cеминара

Сергей Ковальчук (Университет ИТМО), Агенты искусственного интеллекта для поддержки принятия решений: контекст принятия решений, когнитивные характеристики, взаимодействие с человеком. YouTube | Дзен | RuTube (~1 час 30 минут).
Семинар про бизнес кейсы Causal Inference

▫️ 27 ноября (среда), 17:00 МСК
▫️ Подключение→

Выступает: Вадим Андреевич Порватов, ML Engineer, Skoltech

Тема: Causal Inference для вашего проекта: обзор кейсов

Аннотация
Бизнес задачи на базе аналитики и DS/ML требуют не только определения корреляций в данных, но и понимания истинных причинно-следственных связей в процессах генеририрующих эти данные. На семинаре расскажем как графы и методы из uplift-моделирования помогают приблизиться к выявлению причинности, а также поговорим, кто и где этим сейчас занимается, в том числе на примере боевых кейсов команды GlowByte Advanced Analytics.
Рассмотрим:
▫️ Основные концепции причинно-следственного анализа (Causal Inference): графовые вероятностные модели, байесовские сети, свойства сепарации и условной независимости;
▫️ Преимущества использования графов для визуализации и анализа сложных систем и их причинно-следственных связей;
▫️ Основные алгоритмы обучения структур и параметров байесовских сетей;
▫️ Два практических кейса: маркетинг — оценка эффекта от нетаргетированных кампаний и цепи поставок — оценка влияния факторов и событий на основные финансовые показатели.

Уровень сложности: начинающий, доклад рассчитан на широкую публику с базовыми знаниями об алгоритмах оценки эффекта.

Ключевые слова: causal inference, causal discovery, байесовские сети, uplift моделирование.
Запись семинара

Вадим Порватов (Сколтех), Causal Inference для вашего проекта: обзор кейсов. YouTube | Дзен | RuTube (~1 час 5 минут).
NoML Recap — Байесовские сети и причинно-следственный анализ

Семинары, которые были у нас ранее:
▫️ Подробный доклад (на слайдах в конце есть обширный список литературы, включая статьи с важными результатами про байесовские сети): Максим Гончаров (GlowByte), От байесовских сетей к структурным причинно-следственным моделям, 2022. YouTube | Дзен | RuTube (~2 часа);
▫️ Во второй части этого доклада можно найти хорошее введение в байесовские сети: Фёдор Смирнов, Гузелия Мошнина, Рахмет Оджаев (GlowByte), Методы генерации синтетических данных, 2023. YouTube | Дзен | RuTube (~1 час 40 минут);
▫️ Доклад про причинно-следственный анализ в целом: Полина Окунева (GlowByte), Методы Causal Inference, 2022. YouTube | Дзен | RuTube (~1 час 40 минут).

Учебники и книги, которые рекомендуют участники нашего сообщества:
▫️ J. Pearl, D. Mackenzie, The Book of Why: The New Science of Cause and Effect, 2018;
▫️ J. Pearl, Causality: Models, Reasoning, and Inference, 2009;
▫️ J. Peters, D. Janzing , B. Schölkopf, Elements of Causal Inference: Foundations and Learning Algorithms, 2017;
▫️ R.E. Neapolitan, Learning Bayesian Networks, 2003;
▫️ F.V. Jensen, T.D. Nielsen, Bayesian Networks and Decision Graphs, 2007;
▫️ D. Koller, N. Friedman, Probabilistic Graphical Models: Principles and Techniques, 2009.

Курсы на Coursera:
▫️ Probabilistic Graphical Models Specialization.
Мероприятия NoML в декабре

План мероприятий на ближайший месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:

▫️ 04.12 | онлайн | Фёдор Смирнов (GlowByte Advanced Analytics), Вероятностное программирование для сегментации и восстановления временных рядов;

▫️ 11.12 | офлайн | Круглый стол: Семён Косяченко, Александр Попков, Глеб Канин (Оптимакрос); Василий Замолотов (Аксеникс); Алексей Тарасов (Разумное Расписание); Алексейс Ложкинс (LA Optimization); Максим Гончаров, Павел Снурницын (GlowByte); Математическая оптимизация: подходы, технологии, бизнес задачи и тренды;

▫️ 18.12 | онлайн | Александр Гавриков (Т-Банк, R&D центр), Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований;

▫️ 25.12 | онлайн | Максим Гончаров, Павел Снурницын (GlowByte Advanced Analytics), Интеллект принятия решений: почему в эру ИИ не стоит забывать о классических методах математического моделирования;

Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются детали предстоящих докладов.
Семинар про вероятностное программирование и временные ряды

▫️ 4 декабря (среда), 17:00 МСК
▫️ Подключение→

Выступает: Фёдор Смирнов, тимлид DS, практика Advanced Analytics GlowByte

Тема: Вероятностное программирование для сегментации и восстановления временных рядов

Аннотация
На семинаре будут рассмотрены упрощенные модельные примеры использования аппарата вероятностного программирования для работы с временными рядами. В частности, мы поговорим про подход к сегментации, ознакомимся с игрушечным примером восстановления промо-календаря из временного ряда, а также затронем другие области применения этого аппарата. Будет показано, как с помощью структурно-вероятностной модели и набора гипотез можно решать типовые задачи на временных рядах. В конце доклада будет представлен пример решения упрощённой задачи классическим байесовским методом без использования специализированных фреймворков.

Уровень сложности: начинающий; от слушателей ожидается: базовые знания вероятности и статистики, начальное понимание концепций временных рядов, интерес к применению вероятностных методов в анализе данных.

Ключевые слова: вероятностное программирование, структурно-вероятностные модели, map-оценка , сэмплирование, байесовские методы, анализ временных рядов.
Про SMT и SAT

Недавно у нас был вот такой доклад:
▫️ Константин Чухарев (ИТМО, Huawei), От SAT к SMT: новый рубеж в решении задач и формальной верификации. YouTube | Дзен | RuTube (~1 час 10 минут).

А ранее в этом году был еще вот такой:
▫️ Александр Андреев (ИТМО, GlowByte), Алгоритмы решения SAT: теоретические и практические аспекты. YouTube | Дзен | RuTube (~55 минут).

Ниже некоторые материалы по теме от участников нашего сообщества.

Для начинающих:
▫️ Простая и понятная статья, посвящённая использованию решателя Z3: Understanding SMT solvers: An Introduction to Z3 (~20 минут).

Верификация ПО — SMT-решатели значительно упрощают процесс проверки корректности программ:
▫️ Symbolic analyzer для TVM (The Telegram Open Network Virtual Machine), основанный на USVM: espritoxyz/tool;
▫️ Универсальная символическая виртуальная машина для анализа программ на Java, Python, Go: USVM;
▫️ Инструмент проверки смарт-контрактов на соответствие спецификациям: Certora.

Проверка и анализ политик безопасности — применение Automated Reasoning, кейс AWS:
▫️ Neha Rungta, A billion SMT queries a day, 2022 (~55 минут);
▫️ Andrew Gacek, How AWS uses automated reasoning to help you achieve security at scale, 2018 (~10 минут).

Реверс-инжиниринг — SMT решатели помогают анализировать программы, изучать их поведение и находить уязвимости:
▫️ Однодневный воркшоп по использованию SMT-решателей для реверс-инжиниринга. Есть примеры решение интересных CTF задач: SMT Solver Workshop, 2016.

И в тему прошлой недели: байесовские сети и причинно следственный анализ — алгоритмы обучения структуры сети на базе SAT:
▫️ S. Triantafillou, I. Tsamardinos, I.G. Tollis, Learning Causal Structure from Overlapping Variable Sets, 2010 (8 стр., ~30-40 минут);
▫️ A. Hyttinen, P.O. Hoyer, F. Eberhardt, M. Jarvisalo, Discovering Cyclic Causal Models with Latent Variables: A General SAT-Based Procedure, 2013 (9 стр., ~35-45 минут).
NoML Recap — вероятностное программирование

Семинар вчера был в формате воркшопа, пока ждем запись и код, рекомендуем пересмотреть предыдущий доклад по теме:
▫️ Максим Гончаров (GlowByte), Вероятностное программирование: использование генеративных моделей для восстановления ненаблюдаемых факторов, 2022. YouTube | Дзен | RuTube (~2 часа 10 минут).

Плюс подборка материалов (введение в Pyro, другие фреймворки, литература):
▫️Про вероятностное программирование.
Запись cеминара

Фёдор Смирнов, Максим Гончаров (GlowByte), Вероятностное программирование для сегментации и восстановления временных рядов. YouTube | Дзен | RuTube (~1 час 55 минут).
Очная встреча про математическую оптимизацию

▫️ 11 декабря (среда), 17:00 МСК
▫️ Место встречи: г. Москва, Нижний Сусальный пер., д. 5 стр. 19 (БЦ Арма, офис компании GlowByte), вход свободный, ставьте 💯, если придёте очно
▫️ Онлайн-трансляция будет на нашем YouTube канале

Тема: Математическая оптимизация: подходы, технологии, бизнес задачи и тренды

Приглашенные эксперты:
▫️ Семён Косяченко, Александр Попков, Глеб Канин (Optimacros);
▫️ Василий Замолотов (Axenix);
▫️ Алексейс Ложкинс (LA Optimization / BIA Technologies);
▫️ Алексей Тарасов (Разумное Расписание);
▫️ Максим Гончаров (GlowByte Advanced Analytics).
Модератор дискуссии:
▫️ Павел Снурницын (GlowByte Advanced Analytics).

План встречи:
В первой части приглашенные эксперты расскажут о своем опыте применения методов математической оптимизации и исследования операций в реальных бизнес-задачах. Они поделятся примерами успешных проектов, обсудят актуальные проблемы и вызовы, с которыми сталкиваются, и способы их решения.

Во второй части мероприятия состоится панельная дискуссия, где эксперты и участники смогут обсудить ключевые вопросы, посвященные следующим темам:
▫️ Технологии и методы
— Возможности российских вендоров и open-source решений для разработки и отладки оптимизационных моделей.
— Выбор оптимальной стратегии для решения задач: классические методы, метаэвристики или имитационное моделирование, их преимущества и ограничения в различных сценариях.
— Актуальные потребности бизнеса в готовых программных продуктах на базе математической оптимизации, включая решения для логистики, графикования, интегрированного планирования и других задач в области управления цепями поставок.
▫️ Продуктивизация
— Учет жестких временных ограничений на принятие решений в реальных системах и другие вопросы системного дизайна промышленных сервисов на основе математической оптимизации.
— Способы, фреймворки и метрики для эффективного взаимодействия с бизнес-заказчиками, не обладающими глубокими знаниями в области математической оптимизации.
— Особенности управления модельным риском в случае оптимизационного и имитационного моделирования.
▫️ Кадры и обучение
— Вход в профессию: роль академического образования и самообучения в подготовке специалистов.
— Способы повышения квалификации и профессионального роста в области исследования операций.
— Взаимодействие академической среды и индустрии не только в области образования, но и для совместного решения прикладных и научных задач.
▫️ Тренды
— Интеграция ИИ в настройку оптимизационных солверов.
— Новые инструменты и подходы при решении из области исследования операций.
— Личные наблюдения участников и глобальные тенденции.

После официальной части в каком нибудь пабе неподалеку можно будет более плотно обсудить насущные вопросы;)

Мероприятие организовано при поддержке Optimacros и GlowByte.
NoML Recap — доклады экспертов круглого стола

Почти все эксперты завтрашней встречи выступали у нас ранее (а кто-то даже не один раз), напомним некоторые доклады:

▫️ Семён Косяченко, Решение задачи балансов на графе и поиск ошибок измерителей с помощью нейросетей, 2024. YouTube | Дзен | RuTube (~1 час 5 минут).

▫️ Василий Замолотов, Эффективное планирование шихтования и оптимизация логистики, 2023. YouTube | Дзен | RuTube (~1 час 5 минут).

▫️ Алексейс Ложкинс, Искусство математического моделирования, 2024. YouTube | Дзен | RuTube (~1 час 30 минут).

▫️ Алексей Тарасов, Алгоритм огранки бриллиантов на основе методов нелинейной оптимизации, 2024. YouTube | Дзен | RuTube (~1 час 20 минут).

▫️ Максим Гончаров, Введение в прикладную математическую оптимизацию, 2023. YouTube | Дзен | RuTube (~1 час 35 минут).

Приходите завтра на нашу встречу сообщества, познакомимся в офлайне.
Запись встречи-дискуссии

▫️ Математическая оптимизация: подходы, технологии, бизнес задачи и тренды. YouTube | Дзен | RuTube (~1 час 55 минут).
Семинар про Influence Maximization

▫️ 18 декабря (среда), 17:00 МСК
▫️ Подключение→

Выступает: Александр Гавриков, Senior Researcher R&D центра Т-Банка

Тема: Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований

Аннотация
Задача Influence Maximization занимает ключевое место в сфере анализа социальных сетей и мессенджеров, где основная цель заключается в определении узлов, способных максимально эффективно распространять информацию среди пользователей. В докладе рассматриваются современные исследования и разработки алгоритмов, освещаются текущие тренды и методы решения, их достоинства, недостатки и ограничения. Презентация включает в себя как теоретические обзоры, так и практические примеры применения данных методов в различных индустриях, что делает её актуальной для специалистов в областях дискретной математики и Computer Science.

Уровень сложности: продвинутый, для понимания доклада требуются базовые знания дискретной математики, теории вероятностей, теории графов и временной сложности алгоритмов

Ключевые слова: Influence Maximization, Influence propagation models, Independent cascade, Linear Threshold, CELF, TIM+, IMM, CoFIM, Community-based models
Запись семинара

Александр Гавриков (Т-Банк), Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований. YouTube | Дзен | RuTube (~55 минут).
Семинар не только про ML

▫️ 25 декабря (среда), 17:00 МСК
▫️ Подключение→

Выступают: Максим Гончаров, Павел Снурницын (GlowByte Advanced Analytics)

Тема: Not only ML или Почему в эру ИИ не стоит забывать о классических методах мат. моделирования

Аннотация
На заключительном в этом году семинаре поговорим не только про ML) Подведём итоги не только этого года но и вообще последних лет существования сообщества NoML и нашей команды в GlowByte AA.
▫️ Разберём таксономию современных прикладных аналитических методов, включая прогнозную, описательную и предписательную аналитику. Обсудим, где место последним нашумевшим технологиям, таким как LLM и GenAI, в этой структуре.
▫️ Рассмотрим также применение методов имитационного моделирования, дизайна экспериментов, обучения с подкреплением, динамического программирования и причинно-следственного анализа для решения сложных бизнес-задач.
▫️ Пройдемся по практическим кейсам применения прогнозных, оптимизационных и имитационных моделей для решения бизнес-задач в различных отраслях, таких как производство, логистика, ритейл, финансовый сектор и др. Обсудим, как совместное использование разнообразных методов и подходов помогает получать результаты принципиально другого характера.
▫️ Обсудим текущий ландшафт технологий для оптимизации и исследования операций, включая вызовы, связанные с импортозамещением. В заключение поговорим про системный дизайн, модельный риск и вопросы доверенного ИИ.

Уровень сложности: начинающий, семинар носит обзорный (а может быть даже и программный характер) и ориентирован на слушателей имеющих практический опыт работы в проектах на стыке анализа данных, мат. оптимизации и исследования операций.

Ключевые слова: прогнозная, описательная и предписательная аналитика, математическая оптимизация, имитационное моделирование, исследование операций, причинно-следственный анализ, модельный риск, доверенный ИИ.
Запись семинара

Запись семинара прошедшего 25 декабря:
Максим Гончаров, Павел Снурницын (GlowByte), Not only ML или Почему в эру ИИ не стоит забывать о классических методах мат. моделирования. YouTube | Дзен | RuTube (~1 час 55 минут).

Продолжим наши еженедельные мероприятиям в конце января / начале февраля.
Мероприятия NoML в феврале

План семинаров на ближайший месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:

▫️ 05.02 | Дмитрий Васильков (QuSolve), Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet;

▫️ 12.02 | Егор Дудырев (НИУ ВШЭ, Университет Лотарингии), Кластеризация на правилах или как найти кластеризации, которые легко объяснить;

▫️ 19.02 | Алан-Барсаг Газзаев (MTS AI, ИТМО), Обучение языковой модели Cotype Nano;

▫️ 26.02 | Ярослав Шмулев (R77 AI), Рекомендательная система для завода по оптимизации процесса производства стали;

Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются детали предстоящих докладов и ссылки для подключения.
Семинар про интерпретируемый ИИ и солвер OptJet

▫️ 5 февраля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Дмитрий Васильков, генеральный директор QuSolve

Тема: Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet

Аннотация
ML-модели и ИИ в целом все шире используются в областях, где цена ошибки при принятии решения высока (например, в медицине или финансах). В связи с этим активно развиваются методы объяснения и проверки тех или иных решений, принимаемых ИИ-системами. Эта область знаний получила название “интерпретируемый ИИ” (Explainable AI, XAI). Существующие методы XAI можно подразделить на эвристические и строгие: первые простые и быстрые, зато вторые точные и надежные. Один из эффективных строгих методов — представление ML-модели в виде множества логических высказываний и использование аппарата формальной логики и созданных на его основе вычислительных алгоритмов для поиска минимального набора критериев, на основе которых исследуемая ML-модель принимает то или иное решение. В докладе расскажем об использовании алгоритма MaxSAT, реализованного в солвере OptJet, для интерпретации ансамблевых ML-моделей.

Уровень сложности: начинающий/средний, для понимания доклада будет достаточно базовых знаний по DS/ML и математической оптимизации.

Ключевые слова: интерпретация ML-моделей, интерпретируемый ИИ (XAI), математическая оптимизация, MaxSAT, SAT, оптимизационные решатели/солверы.
Запись семинара

Дмитрий Васильков (QuSolve), Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet. YouTube | Дзен | RuTube (~1 час 10 минут).
Семинар про кластеризацию на базе анализа формальных понятий

▫️ 12 февраля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Егор Дудырев (НИУ ВШЭ, Университет Лотарингии)

Тема: Кластеризация на правилах или как найти кластеризации, которые легко объяснить

Аннотация
В этом докладе мы рассмотрим пайплайн кластеризации на правилах, где каждый кластер задаётся простым, легко читаем условием. В случае с числовыми данными, такие условия будут выглядеть как: "объект x находится в кластере y если значение его 1-го признака x1 лежит в интервале [a, b], а значение десятого признака x10 – в интервале [c, d]".

Предложенный пайплайн ставится в противовес к "традиционному" подходу к кластеризации – где всё внимание уделяется расстоянию между объектами из разных кластеров. Из-за чего появляются кластера, которые трудно интерпретировать. Ведь даже чтобы объяснить, почему объект х лежит в кластере y, нужно нужно сначала посчитать расстояние в многомерном (часто, масштабированном) пространстве между x и всеми кластерами.

Семинар будет построен на основе статьи "Clustering with Stable Pattern Concepts" (предварительная публикация) представленной на воркшопе FCA4AI проходившем в рамках Европейской Конференции по ИИ (ECAI) в октябре 2024 года.

Мы рассмотрим пайплайн состоящий из трёх шагов:
1. как найти хорошие "стабильные" паттерны в данных, которые могут использованы в качестве описаний кластеров;
2. как объединить отдельные кластеры в кластеризации: т.е. как скомбинировать кластеры так, чтобы они покрывали (почти) все данные и при этом (почти) не пересекались;
3. и как из множества найденных кластеризаций выбрать одну наилучшую.

Вторая часть доклада будет посвящена обсуждению алгоритма комбинирования кластеров из шага 2: этот алгоритм получился довольно простым, при этом он содержит множество техник, эффективных для решения комбинаторных задач на бинарных данных.

Уровень сложности: продвинутый, для понимания доклада необходимо базовое представления о задаче кластеризации. В ходе доклада будут использованы термины из областей Frequent Itemset Mining и Subgroup Discovery, поэтому знакомство с этими областями может помочь, но совсем не обязательно. Наконец, рассматриваемый алгоритм является оптимизированной версией обхода графа в ширину, так что он будет полезен людям, знающим базу теории графов.

Ключевые слова: Clustering, Formal Concept Analysis, Pattern Structures, Rare Itemset Mining.
2025/10/15 21:04:15
Back to Top
HTML Embed Code: