Вместо семинара
На этой неделе у нас не случился доклад про солвер COPT, но можно вспомнить наш старый доклад по этой теме:
▫️ Александр Собенников - Решение оптимизационных задач в новых реалиях, 2022 (1 час).
А если есть сомнения в перспективах вендорского солвера, можно вспмонить наш недавний доклад про разгон опенсорса:
▫️ Максим Гончаров, Алексей Никоноров - Опыт по ускорению оптимизационных open source солверов на примере решения задачи NBO, 2024 (1 час 45 минут).
На этой неделе у нас не случился доклад про солвер COPT, но можно вспомнить наш старый доклад по этой теме:
▫️ Александр Собенников - Решение оптимизационных задач в новых реалиях, 2022 (1 час).
А если есть сомнения в перспективах вендорского солвера, можно вспмонить наш недавний доклад про разгон опенсорса:
▫️ Максим Гончаров, Алексей Никоноров - Опыт по ускорению оптимизационных open source солверов на примере решения задачи NBO, 2024 (1 час 45 минут).
Семинар про SAT солверы
▫️ 22 мая (среда), 17:00 МСК
▫️ Подключение→
Выступает: Александр Андреев (GlowByte AA, ИТМО)*
Тема: Алгоритмы решения SAT: теоретические и практические аспекты
Аннотация
В ходе доклада мы рассмотрим задачу SAT, её сложность и практическую важность. Погрузимся в идеологию и методы работы SAT-решателей и изучим передовые алгоритмы для решения этой задачи. Также мы обсудим, как эти алгоритмы применяются в реальной жизни. Структура доклада:
▫️ Введение в SAT: примеры SAT-задачи, идеология SAT-решателей, поиск нескольких решений, сложность SAT, доказательство для UNSAT, теорема о полноте и корректности метода резолюции, пример использования метода резолюции;
▫️ Алгоритмы решения SAT: DPP/DPLL, Conflict-Driven Clause Learning (CDCL), SAT Competitions;
▫️ Приложения SAT: проблема Хадвигера-Нельсона (1950), Equivalence Checking, задачи верификации, другие интересные приложения и полезные ссылки.
*Доклад подготовлен совместно с коллективом лаборатории "Дискретной оптимизации и формальных методов" университета ИТМО (CT Lab). Данный коллектив активно публикуется на ведущих конференция (A, A*). В 2019 ими был разработан SAT-солвер, который стал победителем SAT Race сразу в двух категориях.
▫️ 22 мая (среда), 17:00 МСК
▫️ Подключение→
Выступает: Александр Андреев (GlowByte AA, ИТМО)*
Тема: Алгоритмы решения SAT: теоретические и практические аспекты
Аннотация
В ходе доклада мы рассмотрим задачу SAT, её сложность и практическую важность. Погрузимся в идеологию и методы работы SAT-решателей и изучим передовые алгоритмы для решения этой задачи. Также мы обсудим, как эти алгоритмы применяются в реальной жизни. Структура доклада:
▫️ Введение в SAT: примеры SAT-задачи, идеология SAT-решателей, поиск нескольких решений, сложность SAT, доказательство для UNSAT, теорема о полноте и корректности метода резолюции, пример использования метода резолюции;
▫️ Алгоритмы решения SAT: DPP/DPLL, Conflict-Driven Clause Learning (CDCL), SAT Competitions;
▫️ Приложения SAT: проблема Хадвигера-Нельсона (1950), Equivalence Checking, задачи верификации, другие интересные приложения и полезные ссылки.
*Доклад подготовлен совместно с коллективом лаборатории "Дискретной оптимизации и формальных методов" университета ИТМО (CT Lab). Данный коллектив активно публикуется на ведущих конференция (A, A*). В 2019 ими был разработан SAT-солвер, который стал победителем SAT Race сразу в двух категориях.
Запись семинара
▫️ Александр Андреев - Алгоритмы решения SAT: теоретические и практические аспекты (55 минут).
▫️ Презентация в базе знаний→
▫️ Александр Андреев - Алгоритмы решения SAT: теоретические и практические аспекты (55 минут).
▫️ Презентация в базе знаний→
Семинар про анализ формальных понятий
▫️ 29 мая (среда), 17:00 МСК
▫️ Подключение→
Выступает: Егор Дудырев, аспирант НИУ ВШЭ и Университета Лотарингии
Тема: Неформальное введение в Анализ Формальных Понятий
Аннотация
На семинаре поговорим как можно искать стабильные паттерны и импликации в данных с помощью Анализа Формальных Понятий (АФП). АФП - это математический формализм, базирующийся на Теории множеств и Теории решёток. Но в данной презентации мы опустим формальные определения и сконцентрируемся на семантике АФП, вдохновляющейся тем, как люди воспринимают мир (и данные).
Мы рассмотрим несколько датасетов и две Python библиотеки для работы с АФП. Так, мы найдём импликации в данных, вида: "если значения численного столбца лежат в интервале X, а значения категориального столбца принадлежат множеству Y, то все значения текстового столбца содержат n-граммы Z".
Надеюсь, что представленные техники помогут вам в вашем повседневном анализе табличных данных. А ваши обратная связь и истории успеха помогут нам развивать и рекламировать наши техники.
▫️ 29 мая (среда), 17:00 МСК
▫️ Подключение→
Выступает: Егор Дудырев, аспирант НИУ ВШЭ и Университета Лотарингии
Тема: Неформальное введение в Анализ Формальных Понятий
Аннотация
На семинаре поговорим как можно искать стабильные паттерны и импликации в данных с помощью Анализа Формальных Понятий (АФП). АФП - это математический формализм, базирующийся на Теории множеств и Теории решёток. Но в данной презентации мы опустим формальные определения и сконцентрируемся на семантике АФП, вдохновляющейся тем, как люди воспринимают мир (и данные).
Мы рассмотрим несколько датасетов и две Python библиотеки для работы с АФП. Так, мы найдём импликации в данных, вида: "если значения численного столбца лежат в интервале X, а значения категориального столбца принадлежат множеству Y, то все значения текстового столбца содержат n-граммы Z".
Надеюсь, что представленные техники помогут вам в вашем повседневном анализе табличных данных. А ваши обратная связь и истории успеха помогут нам развивать и рекламировать наши техники.
Небольшой NoML Recap
Запись вчерашнего семинара скоро будет, а пока вспомним прошлый доклад Егора про один из вариантов применения анализа формальных понятий на практике. Егор тогда рассказал, как мы можем эффективно находить так называемые «Модели Человеческих Знаний» в данных: настолько тривиальные правила, что они будут понятны любому человеку, и настолько оптимальные правила, что иногда они соперничают с продвинутыми методами ML.
▫️ Егор Дудырев - Модели человеческих знаний, или Когда простейшие правила работают на уровне градиентных бустингов, 2023 (1 час 10 минут).
Запись вчерашнего семинара скоро будет, а пока вспомним прошлый доклад Егора про один из вариантов применения анализа формальных понятий на практике. Егор тогда рассказал, как мы можем эффективно находить так называемые «Модели Человеческих Знаний» в данных: настолько тривиальные правила, что они будут понятны любому человеку, и настолько оптимальные правила, что иногда они соперничают с продвинутыми методами ML.
▫️ Егор Дудырев - Модели человеческих знаний, или Когда простейшие правила работают на уровне градиентных бустингов, 2023 (1 час 10 минут).
Запись семинара
▫️ Егор Дудырев - Неформальное введение в Анализ Формальных Понятий (1 час 30 минут).
▫️ Презентация в базе знаний→
▫️ Егор Дудырев - Неформальное введение в Анализ Формальных Понятий (1 час 30 минут).
▫️ Презентация в базе знаний→
Мероприятия NoML в июне
Летом снизим интенсивность наших мероприятий. Ближайший раз соберемся 19 июня:
▫️ 19 июня (среда) 17:00 МСК | семинар | Сергей Усманов (QBoard) - Квантово-вдохновленные алгоритмы оптимизации для прикладных задач;
▫️ 26 июня (среда) 17:00 МСК | семинар | Мария Жмылёва (GlowByte), Тимофей Прибылев (GlowByte) - Введение в Process Mining: методы, платформы и кейсы.
Ссылка для подключения пока та же: Google Meet→, следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.
Летом снизим интенсивность наших мероприятий. Ближайший раз соберемся 19 июня:
▫️ 19 июня (среда) 17:00 МСК | семинар | Сергей Усманов (QBoard) - Квантово-вдохновленные алгоритмы оптимизации для прикладных задач;
▫️ 26 июня (среда) 17:00 МСК | семинар | Мария Жмылёва (GlowByte), Тимофей Прибылев (GlowByte) - Введение в Process Mining: методы, платформы и кейсы.
Ссылка для подключения пока та же: Google Meet→, следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.
Про анализ формальных понятий
Крайний семинар у нас был 29 мая по теме АФП. Пусть будет тут подборка материалов от докладчика Егора Дудырева @edudyrev.
Доклады:
▫️ Easy: B. Ganter - Formal Concept Analysis: A Useful Example of Modern Mathematics, 2015 (1 час 25 минут);
▫️ Medium: С.О. Кузнецов - Понятия, таксономии и зависимости в данных, 2023 (55 минут);
▫️ Hard: С.О. Кузнецов - Решётки замкнутых множеств: понятия и импликативные зависимости, 2023 (1 час 35 минут);
Книги:
▫️ B. Ganter, R. Wille - Formal Concept Analysis: Mathematical Foundations, 1999 (284 стр.);
▫️ B. Ganter, S. Obiedkov - Conceptual Exploration, 2016 (332 стр.)
Крайний семинар у нас был 29 мая по теме АФП. Пусть будет тут подборка материалов от докладчика Егора Дудырева @edudyrev.
Доклады:
▫️ Easy: B. Ganter - Formal Concept Analysis: A Useful Example of Modern Mathematics, 2015 (1 час 25 минут);
▫️ Medium: С.О. Кузнецов - Понятия, таксономии и зависимости в данных, 2023 (55 минут);
▫️ Hard: С.О. Кузнецов - Решётки замкнутых множеств: понятия и импликативные зависимости, 2023 (1 час 35 минут);
Книги:
▫️ B. Ganter, R. Wille - Formal Concept Analysis: Mathematical Foundations, 1999 (284 стр.);
▫️ B. Ganter, S. Obiedkov - Conceptual Exploration, 2016 (332 стр.)
Семинар про квантово-вдохновленные методы оптимизации
▫️ 19 июня (среда), 17:00 МСК
▫️ Подключение→
Выступает: Сергей Усманов, разработчик-алгоритмист, QBoard
Тема: Квантово-вдохновленные алгоритмы оптимизации для прикладных задач;
Аннотация
Одним из направлений потенциального применения квантовых вычислений считаются задачи математической оптимизации. С одной стороны, в данном направлении уже предложено достаточно много различных теоретических задач и подходов к их решению. С другой — в настоящее время не существует квантовых вычислителей, достаточных для решения реального, а часто и приближенного размера прикладных задач.
В связи с этим, актуальными становятся квантово-вдохновленные подходы к решению задач оптимизации, то есть алгоритмы, использующие идеи из квантовых вычислений и работающие на обычных компьютерах. В ходе доклада ознакомимся с текущим состоянием данного направления, обсудим основные классы алгоритмов и обозначим ключевые проблемы, связанные с их применением.
▫️ 19 июня (среда), 17:00 МСК
▫️ Подключение→
Выступает: Сергей Усманов, разработчик-алгоритмист, QBoard
Тема: Квантово-вдохновленные алгоритмы оптимизации для прикладных задач;
Аннотация
Одним из направлений потенциального применения квантовых вычислений считаются задачи математической оптимизации. С одной стороны, в данном направлении уже предложено достаточно много различных теоретических задач и подходов к их решению. С другой — в настоящее время не существует квантовых вычислителей, достаточных для решения реального, а часто и приближенного размера прикладных задач.
В связи с этим, актуальными становятся квантово-вдохновленные подходы к решению задач оптимизации, то есть алгоритмы, использующие идеи из квантовых вычислений и работающие на обычных компьютерах. В ходе доклада ознакомимся с текущим состоянием данного направления, обсудим основные классы алгоритмов и обозначим ключевые проблемы, связанные с их применением.
Запись семинара
▫️ Сергей Усманов - Квантово-вдохновленные алгоритмы оптимизации для прикладных задач (1 час 25 минут).
▫️ Презентация в базе знаний→
▫️ Сергей Усманов - Квантово-вдохновленные алгоритмы оптимизации для прикладных задач (1 час 25 минут).
▫️ Презентация в базе знаний→
Про квантовые вычисления
По мотивам семинара на этой неделе, подборка про квантовые вычисления и алгоритмы от докладчика Сергея Усманова:
▫️ Научно популярное введение в тему: S. Aaronson - Quantum Computing Since Democritus (есть перевод), 2013 (~400 стр.);
▫️ Канонический учебник по квантовым вычислениям: M.A. Nielsen, I.L. Chuang - Quantum Computation and Quantum Information (перевод тоже где-то есть), 2010 (~700 стр.);
▫️ Современный обзор приложений и алгоритмов (главы 4 и 5 - про комбинаторную и непрерывную квантовую оптимизацию, глава 9 - про квантовый ML): A.M. Dalzell et al. - Quantum algorithms: A survey of applications and end-to-end complexities, 2023 (~330 стр.);
▫️ Ресурс с каталогом квантовых алгоритмов: Quantum Algorithm Zoo;
▫️ Ландшафт рынка в области квантовых вычислений: Quantum Computing Companies: A Full 2024 List.
P.S.:
С автором книги “Квантовые вычисления со времен Демокрита” Скоттом Ааронсоном есть два выпуска подкаста Лекса Фридмана:
▫️ Scott Aaronson: Quantum Computing, 2020 (1 час 35 минут);
▫️ Scott Aaronson: Computational Complexity and Consciousness, 2020 (1 час 50 минут).
P.P.S: Материалы по теме от других участников сообщества:
▫️ @Yah179 - учебник А. Китаев, А. Шень, М. Вялый - Классические и квантовые вычисления, 1999 (~190 стр.);
▫️ @Alex15785 - статья на Хабре: Механический квантовый компьютер, 2024 (15 минут);
▫️ @kirill_chizhov - библиотека от IBM: Qiskit Optimization: A library for optimization applications using quantum computing.
Кстати, в блогах Qiskit много постов про квантовые вычисления и оптимизацию простыми словами, например:
▫️ A Walkthrough of Qiskit’s New Optimization Module, 2020 (6 минут);
▫️ Cutting Through the Hype of Quantum Optimization, 2021 (13 минут).
По мотивам семинара на этой неделе, подборка про квантовые вычисления и алгоритмы от докладчика Сергея Усманова:
▫️ Научно популярное введение в тему: S. Aaronson - Quantum Computing Since Democritus (есть перевод), 2013 (~400 стр.);
▫️ Канонический учебник по квантовым вычислениям: M.A. Nielsen, I.L. Chuang - Quantum Computation and Quantum Information (перевод тоже где-то есть), 2010 (~700 стр.);
▫️ Современный обзор приложений и алгоритмов (главы 4 и 5 - про комбинаторную и непрерывную квантовую оптимизацию, глава 9 - про квантовый ML): A.M. Dalzell et al. - Quantum algorithms: A survey of applications and end-to-end complexities, 2023 (~330 стр.);
▫️ Ресурс с каталогом квантовых алгоритмов: Quantum Algorithm Zoo;
▫️ Ландшафт рынка в области квантовых вычислений: Quantum Computing Companies: A Full 2024 List.
P.S.:
С автором книги “Квантовые вычисления со времен Демокрита” Скоттом Ааронсоном есть два выпуска подкаста Лекса Фридмана:
▫️ Scott Aaronson: Quantum Computing, 2020 (1 час 35 минут);
▫️ Scott Aaronson: Computational Complexity and Consciousness, 2020 (1 час 50 минут).
P.P.S: Материалы по теме от других участников сообщества:
▫️ @Yah179 - учебник А. Китаев, А. Шень, М. Вялый - Классические и квантовые вычисления, 1999 (~190 стр.);
▫️ @Alex15785 - статья на Хабре: Механический квантовый компьютер, 2024 (15 минут);
▫️ @kirill_chizhov - библиотека от IBM: Qiskit Optimization: A library for optimization applications using quantum computing.
Кстати, в блогах Qiskit много постов про квантовые вычисления и оптимизацию простыми словами, например:
▫️ A Walkthrough of Qiskit’s New Optimization Module, 2020 (6 минут);
▫️ Cutting Through the Hype of Quantum Optimization, 2021 (13 минут).
Семинар про Process Mining
▫️ 26 июня (среда), 17:00 МСК
▫️ Подключение→
Выступают: Тимофей Прибылев (GlowByte), Альфия Ибрагимова (GlowByte)
Тема: Введение в Process Mining: методы, платформы и кейсы
Аннотация
Process Mining (PM) — основанный на данных подход к анализу и оптимизации бизнес-процессов организации. На семинаре познакомимся с этой областью подробнее, структура доклада:
▫️ Введение в PM, преимущества и области применения;
▫️ Особенности подготовки данных для PM (работа с логами событий);
▫️ Подходы и метрики оценки процессов;
▫️ Основные алгоритмы майнинга в PM;
▫️ Примеры вызовов и решений задач оптимизации бизнес-процессов при помощи PM;
▫️ Применение методов DS/ML в PM.
▫️ 26 июня (среда), 17:00 МСК
▫️ Подключение→
Выступают: Тимофей Прибылев (GlowByte), Альфия Ибрагимова (GlowByte)
Тема: Введение в Process Mining: методы, платформы и кейсы
Аннотация
Process Mining (PM) — основанный на данных подход к анализу и оптимизации бизнес-процессов организации. На семинаре познакомимся с этой областью подробнее, структура доклада:
▫️ Введение в PM, преимущества и области применения;
▫️ Особенности подготовки данных для PM (работа с логами событий);
▫️ Подходы и метрики оценки процессов;
▫️ Основные алгоритмы майнинга в PM;
▫️ Примеры вызовов и решений задач оптимизации бизнес-процессов при помощи PM;
▫️ Применение методов DS/ML в PM.
Запись семинара
▫️ Альфия Ибрагимова, Тимофей Прибылев - Введение в Process Mining: методы, платформы и кейсы (1 час 30 минут).
▫️ Презентация в базе знаний→
▫️ Альфия Ибрагимова, Тимофей Прибылев - Введение в Process Mining: методы, платформы и кейсы (1 час 30 минут).
▫️ Презентация в базе знаний→
Про Process Mining
Если интересуетесь направлением PM и хотите знать больше про бизнес-кейсы, технологии и тренды, добавляйтесь в сообщество Процесс-бар от команды Process Intelligence GlowByte:
▫️ Телеграм-канал @processbar.
Если хотите погрузится в область PM более фундаментально, то есть книга и курс от крёстного отца PM Вина ван дер Алста:
▫️ W. van der Aalst - Process Mining, 2016 (~480 стр.);
▫️ Process Mining: Data science in Action (Coursera).
Также обещали раскрыть тему платформ. Если говорить про мировой ландшафт решений и инструментов, в отличии от DS/ML, Gartner MQ для PM живёт:
▫️ Подробный отчёт можно найти, например, на сайте Celonis: 2024 Gartner Magic Quadrant for Process Mining Platforms (~1 час 10 минут);
▫️ Либо можно почитать какой-нибудь короткий пост с комментариями на отчет Gartner, например, вот этот: A summary of Gartner’s 2024 Magic Quadrant for Process Mining Solutions (~10 минут).
Из отечественных инструментов на семинаре отмечали следующие:
▫️ VK Process Mining;
▫️ Infomaximum Proceset;
▫️ Sber Process Mining;
▫️ Promease;
▫️ PIX PM;
▫️ … (более полный список, а также результаты опроса об использовании инструментов — в канале Процесс-бар→)
Ну и куда же мы без опенсорса:
▫️ ProM — распространенный открытый фреймворк, ван дер Алст его часто упоминает в своих статьях, написан на Java;
▫️ PM4Py — библиотека на Python;
▫️ BupaR — для любителей R.
Если интересуетесь направлением PM и хотите знать больше про бизнес-кейсы, технологии и тренды, добавляйтесь в сообщество Процесс-бар от команды Process Intelligence GlowByte:
▫️ Телеграм-канал @processbar.
Если хотите погрузится в область PM более фундаментально, то есть книга и курс от крёстного отца PM Вина ван дер Алста:
▫️ W. van der Aalst - Process Mining, 2016 (~480 стр.);
▫️ Process Mining: Data science in Action (Coursera).
Также обещали раскрыть тему платформ. Если говорить про мировой ландшафт решений и инструментов, в отличии от DS/ML, Gartner MQ для PM живёт:
▫️ Подробный отчёт можно найти, например, на сайте Celonis: 2024 Gartner Magic Quadrant for Process Mining Platforms (~1 час 10 минут);
▫️ Либо можно почитать какой-нибудь короткий пост с комментариями на отчет Gartner, например, вот этот: A summary of Gartner’s 2024 Magic Quadrant for Process Mining Solutions (~10 минут).
Из отечественных инструментов на семинаре отмечали следующие:
▫️ VK Process Mining;
▫️ Infomaximum Proceset;
▫️ Sber Process Mining;
▫️ Promease;
▫️ PIX PM;
▫️ … (более полный список, а также результаты опроса об использовании инструментов — в канале Процесс-бар→)
Ну и куда же мы без опенсорса:
▫️ ProM — распространенный открытый фреймворк, ван дер Алст его часто упоминает в своих статьях, написан на Java;
▫️ PM4Py — библиотека на Python;
▫️ BupaR — для любителей R.
Process Mining: дополнительные главы
На прошедшем семинаре также обсуждали несколько вопросов формата PM + X, где X — какая-то технология или метод.
PM + SM. SM — Simulation Modelling / имитационное моделирование (ИМ).
▫️ Простыми словами про связку, здесь же пара слов о цифровых двойниках, о которых также кратко вспоминали на семинаре: Simulation analysis in process mining: Definition, applications and techniques, 2023 (~6 минут);
▫️ Говорят, что каждое четвертое предприятие активно использует PM в связке с SM: Why the real value of process mining lies in simulation, 2021 (~3 минуты);
▫️ Вот здесь в начале статьи хорошо концептуально описаны подходы совместного использования PM и SM: W. van der Aalst - Process Mining and Simulation: A Match Made in Heaven! 2018 (~25 минут);
▫️ А вот здесь практический кейс в сторону того, что мы сказали на семинаре: PM используется для сбора данных и описания работы системы, а далее — дискретно-событийное ИМ. Сам кейс — оптимизация потока приема пациентов скорой помощи: W. Abohamad, A. Ramy, A. Arisha - A hybrid process-mining approach for simulation modeling, 2017 (~20 минут);
▫️ И еще один медицинский кейс, уже про полный процесс лечения одного заболевания: O. Tamburis, C. Esposito - Process Mining as support to Simulation modelling: a hospital–based case study, 2020 (~20 минут).
PM + GenAI. Есть неутешительный тренд, что термин ML/AI теперь синонимизируется с GenAI, в силу хайпа последнего (в том же отчете Gartner MQ слово GenAI встречается 28 раз, не всегда по делу). Есть большое количество постов, в том числе в блогах вендоров PM, в названии которых есть слово LLM/GenAI, а в содержании — рассказ про выявление аномалий, предсказание событий процесса и т.п.
▫️ На этом фоне сильно выделяется пост ван дер Алста на LinkedIn, все по делу, в явном виде Generative vs. Predictive AI и логичные утверждения, что толку от generic LLM не будет: Process Management after ChatGPT: How Generative and Predictive AI Relate to Process Mining, 2023 (~10 минут);
▫️ Также есть небольшой отчет Gartner по теме, правда не такой хороший как пост выше: The Impact of Generative AI on Process Mining, 2023 (~10 минут).
PM + Энтропия. В конце семинара у нас возникли слова термодинамика и энтропия, в принципе информационная энтропия давно возникает в контексте разных задач PM:
▫️ Энтропия как мера вариативности логов для целей определения наиболее подходящего класса алгоритмов PM (декларативные/императивные): C. Back, S. Debois, T. Slaats - Entropy as a Measure of Log Variability, 2019 (28 стр., ~50 минут);
▫️ Энтропия для задач проверки соответствия: Artem Polyvyanyy - Entropy-Based Conformance Checking Between Designed and Real-World Processes (доклад на семинаре лаборатории процессно-ориентированных информационных систем ФКН ВШЭ), 2021 (~1 час 35 минут);
▫️ Энтропия в задаче trace alignment в диагностике процесса: R.P.J.C. Bose, W. van der Aalst - Trace alignment in process mining: Opportunities for process diagnostics, 2010 (~30 минут);
▫️ Энтропия в задаче выявления дрейфа процесса: R.P.J.C. Bose, W. van der Aalst, I. Žliobaite, M. Pechenizkiy - Handling concept drift in process mining, 2011 (~30 минут);
▫️ Принцип максимума энтропии для задачи выбора порога устранения шума в алгоритмах PM. W. Li et al. - A Self-Adaptive Process Mining Algorithm Based on Information Entropy to Deal With Uncertain Data, 2019 (~30 минут).
PM + FCA. Ну и напоследок, готовил эту подборку и наткнулся на такую пару статей:
▫️ M. Ikeda, K. Otaki, A. Yamamoto - Formal Concept Analysis for Process Enhancement Based on a Pair of Perspectives, 2014 (~25 минут);
▫️ S.E. Boukhetta, M. Trabelsi - Formal Concept Analysis for Trace Clustering, 2023 (15 стр.);
▫️ Для тех, кто не слышал раньше про термин FCA, рекомендуем наш недавний семинар: Егор Дудырев - Неформальное введение в Анализ Формальных Понятий, 2024 (~1 час 30 минут).
На прошедшем семинаре также обсуждали несколько вопросов формата PM + X, где X — какая-то технология или метод.
PM + SM. SM — Simulation Modelling / имитационное моделирование (ИМ).
▫️ Простыми словами про связку, здесь же пара слов о цифровых двойниках, о которых также кратко вспоминали на семинаре: Simulation analysis in process mining: Definition, applications and techniques, 2023 (~6 минут);
▫️ Говорят, что каждое четвертое предприятие активно использует PM в связке с SM: Why the real value of process mining lies in simulation, 2021 (~3 минуты);
▫️ Вот здесь в начале статьи хорошо концептуально описаны подходы совместного использования PM и SM: W. van der Aalst - Process Mining and Simulation: A Match Made in Heaven! 2018 (~25 минут);
▫️ А вот здесь практический кейс в сторону того, что мы сказали на семинаре: PM используется для сбора данных и описания работы системы, а далее — дискретно-событийное ИМ. Сам кейс — оптимизация потока приема пациентов скорой помощи: W. Abohamad, A. Ramy, A. Arisha - A hybrid process-mining approach for simulation modeling, 2017 (~20 минут);
▫️ И еще один медицинский кейс, уже про полный процесс лечения одного заболевания: O. Tamburis, C. Esposito - Process Mining as support to Simulation modelling: a hospital–based case study, 2020 (~20 минут).
PM + GenAI. Есть неутешительный тренд, что термин ML/AI теперь синонимизируется с GenAI, в силу хайпа последнего (в том же отчете Gartner MQ слово GenAI встречается 28 раз, не всегда по делу). Есть большое количество постов, в том числе в блогах вендоров PM, в названии которых есть слово LLM/GenAI, а в содержании — рассказ про выявление аномалий, предсказание событий процесса и т.п.
▫️ На этом фоне сильно выделяется пост ван дер Алста на LinkedIn, все по делу, в явном виде Generative vs. Predictive AI и логичные утверждения, что толку от generic LLM не будет: Process Management after ChatGPT: How Generative and Predictive AI Relate to Process Mining, 2023 (~10 минут);
▫️ Также есть небольшой отчет Gartner по теме, правда не такой хороший как пост выше: The Impact of Generative AI on Process Mining, 2023 (~10 минут).
PM + Энтропия. В конце семинара у нас возникли слова термодинамика и энтропия, в принципе информационная энтропия давно возникает в контексте разных задач PM:
▫️ Энтропия как мера вариативности логов для целей определения наиболее подходящего класса алгоритмов PM (декларативные/императивные): C. Back, S. Debois, T. Slaats - Entropy as a Measure of Log Variability, 2019 (28 стр., ~50 минут);
▫️ Энтропия для задач проверки соответствия: Artem Polyvyanyy - Entropy-Based Conformance Checking Between Designed and Real-World Processes (доклад на семинаре лаборатории процессно-ориентированных информационных систем ФКН ВШЭ), 2021 (~1 час 35 минут);
▫️ Энтропия в задаче trace alignment в диагностике процесса: R.P.J.C. Bose, W. van der Aalst - Trace alignment in process mining: Opportunities for process diagnostics, 2010 (~30 минут);
▫️ Энтропия в задаче выявления дрейфа процесса: R.P.J.C. Bose, W. van der Aalst, I. Žliobaite, M. Pechenizkiy - Handling concept drift in process mining, 2011 (~30 минут);
▫️ Принцип максимума энтропии для задачи выбора порога устранения шума в алгоритмах PM. W. Li et al. - A Self-Adaptive Process Mining Algorithm Based on Information Entropy to Deal With Uncertain Data, 2019 (~30 минут).
PM + FCA. Ну и напоследок, готовил эту подборку и наткнулся на такую пару статей:
▫️ M. Ikeda, K. Otaki, A. Yamamoto - Formal Concept Analysis for Process Enhancement Based on a Pair of Perspectives, 2014 (~25 минут);
▫️ S.E. Boukhetta, M. Trabelsi - Formal Concept Analysis for Trace Clustering, 2023 (15 стр.);
▫️ Для тех, кто не слышал раньше про термин FCA, рекомендуем наш недавний семинар: Егор Дудырев - Неформальное введение в Анализ Формальных Понятий, 2024 (~1 час 30 минут).
Семинар про генеративный дизайн
▫️ 3 июля (среда), 17:00 МСК
▫️ Подключение→
Выступает: Глеб Соловьев, Исследовательский центр Сильный ИИ в промышленности, ИТМО
Тема: Генеративный дизайн с помощью технологий ИИ: модели, примеры, опенсорс
Аннотация
Сегодня в таких прикладных областях как химия и инженерия существует потребность в оптимизации процесса создания и поиска прототипов искомых объектов. Для решения данной задачи могут быть использованы методы машинного обучени как для поиска новых объектов, так и оптимизации существующих. В данном докладе будут освещены методы и примеры практического применения опенсорс генеративных инструментов, основанных на нейронных сетях, машинном обучении и эволюционной оптимизации.
▫️ 3 июля (среда), 17:00 МСК
▫️ Подключение→
Выступает: Глеб Соловьев, Исследовательский центр Сильный ИИ в промышленности, ИТМО
Тема: Генеративный дизайн с помощью технологий ИИ: модели, примеры, опенсорс
Аннотация
Сегодня в таких прикладных областях как химия и инженерия существует потребность в оптимизации процесса создания и поиска прототипов искомых объектов. Для решения данной задачи могут быть использованы методы машинного обучени как для поиска новых объектов, так и оптимизации существующих. В данном докладе будут освещены методы и примеры практического применения опенсорс генеративных инструментов, основанных на нейронных сетях, машинном обучении и эволюционной оптимизации.
Мероприятия NoML в июле
Полный план онлайн семинаров на этот месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 03.07 | Глеб Соловьев (ИТМО) — Генеративный дизайн с помощью технологий ИИ: модели, примеры, опенсорс;
▫️ 17.07 | Юрий Дорн (МГУ, МФТИ, ШАД) — Bandits with something: бандиты с бюджетами (bandits with knapsacks) и бандиты с тяжелыми хвостами (bandits with heavy tails);
▫️ 24.07 | Евгений Попов (Yandex Cloud), Никита Лазарев (ИСП РАН), Юрий Маркин (ИСП РАН) — Практический опыт применения FL в медицине на примере обучения модели по классификации ЭКГ-синдромов;
▫️ 31.07 | Нобатов Ишан (МГТУ, GlowByte) — Импульсные нейросети и метод обучения STDP.
Ссылка для подключения та же: Google Meet→
На всякий случай следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.
Полный план онлайн семинаров на этот месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:
▫️ 03.07 | Глеб Соловьев (ИТМО) — Генеративный дизайн с помощью технологий ИИ: модели, примеры, опенсорс;
▫️ 17.07 | Юрий Дорн (МГУ, МФТИ, ШАД) — Bandits with something: бандиты с бюджетами (bandits with knapsacks) и бандиты с тяжелыми хвостами (bandits with heavy tails);
▫️ 24.07 | Евгений Попов (Yandex Cloud), Никита Лазарев (ИСП РАН), Юрий Маркин (ИСП РАН) — Практический опыт применения FL в медицине на примере обучения модели по классификации ЭКГ-синдромов;
▫️ 31.07 | Нобатов Ишан (МГТУ, GlowByte) — Импульсные нейросети и метод обучения STDP.
Ссылка для подключения та же: Google Meet→
На всякий случай следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.
Запись семинара
▫️ Глеб Соловьев - Генеративный дизайн с помощью технологий ИИ: модели, примеры, опенсорс (1 час 20 минут).
▫️ Презентация в базе знаний→
▫️ Глеб Соловьев - Генеративный дизайн с помощью технологий ИИ: модели, примеры, опенсорс (1 час 20 минут).
▫️ Презентация в базе знаний→
Про новые интенсивы A2nced
В этом году под брендом A2nced мы запускаем два новых направления обучения: «Введение в причинно-следственный анализ» и «Задачи uplift-моделирования». У вас есть уникальная возможность перенять опыт экспертов команды Advanced Analytics GlowByte;)
Даты курсов уже определены, ведется сбор заявок.
Онлайн-интенсив «Введение в причинно-следственный анализ» | 10-24 сентября 2024 г.
На интенсиве коллеги из GlowByte AA расскажут об основных аспектах причинно-следственного анализа:
▫️ Где применяется причинно-следственный анализ;
▫️ Основные подходы к построению причинно-следственных графов;
▫️ Критерии для определения необходимого набора переменных для оценки эффекта;
▫️ Виды эффектов и модели для их оценки;
▫️ Валидация оценки эффекта.
Слушатели смогут применить все полученные в рамках курса знания на примере модельной задачи, презентовать свои решения и обсудить вопросы.
▫️ Даты обучения: 10-24 сентября 2024 г.
▫️ Формат: онлайн
Интенсив будет полезен:
▫️ Аналитикам и специалистам DS/ML, желающим разобраться в том, как использовать причинно-следственный анализ в индустриальных кейсах;
▫️ Руководителям DS подразделений для понимания ограничений классического ML и возможностей их преодоления методами причинно-следственного анализа.
Онлайн-интенсив «Задачи uplift-моделирования» | 15-17 октября 2024 г.
На интенсиве обсудим постановку задачи uplift-моделирования, разберем теорию методов построения моделей, а так же на практике в рамках семинаров применим эти методы и оценим качество построенных uplift-моделей.
А в рамках практической части на реальных данных:
▫️ Научимся использовать базовые и продвинутые алгоритмы;
▫️ Осуществим подбор гиперпараметров;
▫️ Обсудим возникающие подводные камни, касающиеся валидации и стабильности алгоритмов.
▫️ Даты обучения: 15-17 октября 2024 г.
▫️ Формат: онлайн
Интенсив будет полезен:
▫️ Аналитикам и специалистам DS/ML, желающим разобраться в том, как использовать uplift-моделирование в индустриальных кейсах;
▫️ Руководителям DS подразделений для понимания достоинств и недостатков uplift-моделирования для определения сегментов для таргетированных акций.
На интенсивах вас ждет:
▫️ живая беседа в формате вопрос-ответ в период обучения с преподавателями;
▫️ практические задания по пройденному материалу;
▫️ (широко известный в узких кругах) сертификат от A2nced x GlowByte.
Преподаватели:
Вадим Порватов, Старший бизнес-аналитик практики GlowByte Advanced Analytics.
Специализируется на задачах предиктивной аналитики в области графов, причинно-следственному анализу, федеративному обучению; автор публикаций в областях computer vision и graph deep learning.
Владимир Селиверстов, Бизнес-аналитик практики GlowByte Advanced Analytics
Специализируется на задачах по uplift-моделированию и причинно-следственному анализу.
Полина Окунева, Руководитель группы аналитики и моделирования в финансах и рисках
Имеет обширный опыт проектов с применением методики A/B тестирования в различных отраслях. Осуществила методологическую разработку курса по А/B тестированию. Куратор курсов по uplift-моделированию и причинно-следственному анализу.
Курс платный, узнать больше и записаться можно у Эльвиры Бегишевой @elvibeg.
Подробнее о программах интенсивов — на сайте a2nced.ai.
В этом году под брендом A2nced мы запускаем два новых направления обучения: «Введение в причинно-следственный анализ» и «Задачи uplift-моделирования». У вас есть уникальная возможность перенять опыт экспертов команды Advanced Analytics GlowByte;)
Даты курсов уже определены, ведется сбор заявок.
Онлайн-интенсив «Введение в причинно-следственный анализ» | 10-24 сентября 2024 г.
На интенсиве коллеги из GlowByte AA расскажут об основных аспектах причинно-следственного анализа:
▫️ Где применяется причинно-следственный анализ;
▫️ Основные подходы к построению причинно-следственных графов;
▫️ Критерии для определения необходимого набора переменных для оценки эффекта;
▫️ Виды эффектов и модели для их оценки;
▫️ Валидация оценки эффекта.
Слушатели смогут применить все полученные в рамках курса знания на примере модельной задачи, презентовать свои решения и обсудить вопросы.
▫️ Даты обучения: 10-24 сентября 2024 г.
▫️ Формат: онлайн
Интенсив будет полезен:
▫️ Аналитикам и специалистам DS/ML, желающим разобраться в том, как использовать причинно-следственный анализ в индустриальных кейсах;
▫️ Руководителям DS подразделений для понимания ограничений классического ML и возможностей их преодоления методами причинно-следственного анализа.
Онлайн-интенсив «Задачи uplift-моделирования» | 15-17 октября 2024 г.
На интенсиве обсудим постановку задачи uplift-моделирования, разберем теорию методов построения моделей, а так же на практике в рамках семинаров применим эти методы и оценим качество построенных uplift-моделей.
А в рамках практической части на реальных данных:
▫️ Научимся использовать базовые и продвинутые алгоритмы;
▫️ Осуществим подбор гиперпараметров;
▫️ Обсудим возникающие подводные камни, касающиеся валидации и стабильности алгоритмов.
▫️ Даты обучения: 15-17 октября 2024 г.
▫️ Формат: онлайн
Интенсив будет полезен:
▫️ Аналитикам и специалистам DS/ML, желающим разобраться в том, как использовать uplift-моделирование в индустриальных кейсах;
▫️ Руководителям DS подразделений для понимания достоинств и недостатков uplift-моделирования для определения сегментов для таргетированных акций.
На интенсивах вас ждет:
▫️ живая беседа в формате вопрос-ответ в период обучения с преподавателями;
▫️ практические задания по пройденному материалу;
▫️ (широко известный в узких кругах) сертификат от A2nced x GlowByte.
Преподаватели:
Вадим Порватов, Старший бизнес-аналитик практики GlowByte Advanced Analytics.
Специализируется на задачах предиктивной аналитики в области графов, причинно-следственному анализу, федеративному обучению; автор публикаций в областях computer vision и graph deep learning.
Владимир Селиверстов, Бизнес-аналитик практики GlowByte Advanced Analytics
Специализируется на задачах по uplift-моделированию и причинно-следственному анализу.
Полина Окунева, Руководитель группы аналитики и моделирования в финансах и рисках
Имеет обширный опыт проектов с применением методики A/B тестирования в различных отраслях. Осуществила методологическую разработку курса по А/B тестированию. Куратор курсов по uplift-моделированию и причинно-следственному анализу.
Курс платный, узнать больше и записаться можно у Эльвиры Бегишевой @elvibeg.
Подробнее о программах интенсивов — на сайте a2nced.ai.
Про магистратуру ФКИ МГУ
Периодически пересекаюсь с коллегами с ФКИ МГУ (ФКИ — Факультет Космических Исследований). У коллег сейчас идет набор в магистратуру. Если вы когда-нибудь задумывались о том, чтобы связать свою жизнь с космосом, самое время воплотить мечты в реальность;)
Сейчас открыты 7 магистерских программ: от "Дистанционного зондирования Земли" до "Государственного управления в космической отрасли" и "Космических медико-биологических исследований". Есть бюджетные места, выпускники бакалавриата или "старого" 5-летнего специалитета могут сдать экзамены и пройти по конкурсу.
Выпускники ФКИ МГУ работают не только в аэрокосмической индустрии, но и, например, успешно занимаются построением ITшных космолётов на Земле. Есть курсы по базам данных, машинному обучению и методам математической оптимизации (коллеги, кстати, активно занимаются исследованиями в области нашего любимого мультиагентного моделирования).
В общем, если космос — это то, чем вы мечтали заниматься, но всегда откладывали, то вы можете:
▫️ прочитать подробности на сайте;
▫️ посмотреть ролик о магистерской программе "Дистанционное зондирование Земли";
▫️ и подать документы прямо сейчас→
Сроки подачи документов — до 20 июля 2024 г.
По всем вопросам можно обратиться к @morozovss.
Периодически пересекаюсь с коллегами с ФКИ МГУ (ФКИ — Факультет Космических Исследований). У коллег сейчас идет набор в магистратуру. Если вы когда-нибудь задумывались о том, чтобы связать свою жизнь с космосом, самое время воплотить мечты в реальность;)
Сейчас открыты 7 магистерских программ: от "Дистанционного зондирования Земли" до "Государственного управления в космической отрасли" и "Космических медико-биологических исследований". Есть бюджетные места, выпускники бакалавриата или "старого" 5-летнего специалитета могут сдать экзамены и пройти по конкурсу.
Выпускники ФКИ МГУ работают не только в аэрокосмической индустрии, но и, например, успешно занимаются построением ITшных космолётов на Земле. Есть курсы по базам данных, машинному обучению и методам математической оптимизации (коллеги, кстати, активно занимаются исследованиями в области нашего любимого мультиагентного моделирования).
В общем, если космос — это то, чем вы мечтали заниматься, но всегда откладывали, то вы можете:
▫️ прочитать подробности на сайте;
▫️ посмотреть ролик о магистерской программе "Дистанционное зондирование Земли";
▫️ и подать документы прямо сейчас→
Сроки подачи документов — до 20 июля 2024 г.
По всем вопросам можно обратиться к @morozovss.