Telegram Web
Семинар про Process Mining

▫️ 26 июня (среда), 17:00 МСК
▫️ Подключение→

Выступают: Тимофей Прибылев (GlowByte), Альфия Ибрагимова (GlowByte)

Тема: Введение в Process Mining: методы, платформы и кейсы

Аннотация
Process Mining (PM) — основанный на данных подход к анализу и оптимизации бизнес-процессов организации. На семинаре познакомимся с этой областью подробнее, структура доклада:
▫️ Введение в PM, преимущества и области применения;
▫️ Особенности подготовки данных для PM (работа с логами событий);
▫️ Подходы и метрики оценки процессов;
▫️ Основные алгоритмы майнинга в PM;
▫️ Примеры вызовов и решений задач оптимизации бизнес-процессов при помощи PM;
▫️ Применение методов DS/ML в PM.
Про Process Mining

Если интересуетесь направлением PM и хотите знать больше про бизнес-кейсы, технологии и тренды, добавляйтесь в сообщество Процесс-бар от команды Process Intelligence GlowByte:
▫️ Телеграм-канал @processbar.

Если хотите погрузится в область PM более фундаментально, то есть книга и курс от крёстного отца PM Вина ван дер Алста:
▫️ W. van der Aalst - Process Mining, 2016 (~480 стр.);
▫️ Process Mining: Data science in Action (Coursera).

Также обещали раскрыть тему платформ. Если говорить про мировой ландшафт решений и инструментов, в отличии от DS/ML, Gartner MQ для PM живёт:
▫️ Подробный отчёт можно найти, например, на сайте Celonis: 2024 Gartner Magic Quadrant for Process Mining Platforms (~1 час 10 минут);
▫️ Либо можно почитать какой-нибудь короткий пост с комментариями на отчет Gartner, например, вот этот: A summary of Gartner’s 2024 Magic Quadrant for Process Mining Solutions (~10 минут).

Из отечественных инструментов на семинаре отмечали следующие:
▫️ VK Process Mining;
▫️ Infomaximum Proceset;
▫️ Sber Process Mining;
▫️ Promease;
▫️ PIX PM;
▫️ … (более полный список, а также результаты опроса об использовании инструментов — в канале Процесс-бар→)

Ну и куда же мы без опенсорса:
▫️ ProM — распространенный открытый фреймворк, ван дер Алст его часто упоминает в своих статьях, написан на Java;
▫️ PM4Py — библиотека на Python;
▫️ BupaR — для любителей R.
Process Mining: дополнительные главы

На прошедшем семинаре также обсуждали несколько вопросов формата PM + X, где X — какая-то технология или метод.

PM + SM. SM — Simulation Modelling / имитационное моделирование (ИМ).
▫️ Простыми словами про связку, здесь же пара слов о цифровых двойниках, о которых также кратко вспоминали на семинаре: Simulation analysis in process mining: Definition, applications and techniques, 2023 (~6 минут);
▫️ Говорят, что каждое четвертое предприятие активно использует PM в связке с SM: Why the real value of process mining lies in simulation, 2021 (~3 минуты);
▫️ Вот здесь в начале статьи хорошо концептуально описаны подходы совместного использования PM и SM: W. van der Aalst - Process Mining and Simulation: A Match Made in Heaven! 2018 (~25 минут);
▫️ А вот здесь практический кейс в сторону того, что мы сказали на семинаре: PM используется для сбора данных и описания работы системы, а далее — дискретно-событийное ИМ. Сам кейс — оптимизация потока приема пациентов скорой помощи: W. Abohamad, A. Ramy, A. Arisha - A hybrid process-mining approach for simulation modeling, 2017 (~20 минут);
▫️ И еще один медицинский кейс, уже про полный процесс лечения одного заболевания: O. Tamburis, C. Esposito - Process Mining as support to Simulation modelling: a hospital–based case study, 2020 (~20 минут).

PM + GenAI. Есть неутешительный тренд, что термин ML/AI теперь синонимизируется с GenAI, в силу хайпа последнего (в том же отчете Gartner MQ слово GenAI встречается 28 раз, не всегда по делу). Есть большое количество постов, в том числе в блогах вендоров PM, в названии которых есть слово LLM/GenAI, а в содержании — рассказ про выявление аномалий, предсказание событий процесса и т.п.
▫️ На этом фоне сильно выделяется пост ван дер Алста на LinkedIn, все по делу, в явном виде Generative vs. Predictive AI и логичные утверждения, что толку от generic LLM не будет: Process Management after ChatGPT: How Generative and Predictive AI Relate to Process Mining, 2023 (~10 минут);
▫️ Также есть небольшой отчет Gartner по теме, правда не такой хороший как пост выше: The Impact of Generative AI on Process Mining, 2023 (~10 минут).

PM + Энтропия. В конце семинара у нас возникли слова термодинамика и энтропия, в принципе информационная энтропия давно возникает в контексте разных задач PM:
▫️ Энтропия как мера вариативности логов для целей определения наиболее подходящего класса алгоритмов PM (декларативные/императивные): C. Back, S. Debois, T. Slaats - Entropy as a Measure of Log Variability, 2019 (28 стр., ~50 минут);
▫️ Энтропия для задач проверки соответствия: Artem Polyvyanyy - Entropy-Based Conformance Checking Between Designed and Real-World Processes (доклад на семинаре лаборатории процессно-ориентированных информационных систем ФКН ВШЭ), 2021 (~1 час 35 минут);
▫️ Энтропия в задаче trace alignment в диагностике процесса: R.P.J.C. Bose, W. van der Aalst - Trace alignment in process mining: Opportunities for process diagnostics, 2010 (~30 минут);
▫️ Энтропия в задаче выявления дрейфа процесса: R.P.J.C. Bose, W. van der Aalst, I. Žliobaite, M. Pechenizkiy - Handling concept drift in process mining, 2011 (~30 минут);
▫️ Принцип максимума энтропии для задачи выбора порога устранения шума в алгоритмах PM. W. Li et al. - A Self-Adaptive Process Mining Algorithm Based on Information Entropy to Deal With Uncertain Data, 2019 (~30 минут).

PM + FCA. Ну и напоследок, готовил эту подборку и наткнулся на такую пару статей:
▫️ M. Ikeda, K. Otaki, A. Yamamoto - Formal Concept Analysis for Process Enhancement Based on a Pair of Perspectives, 2014 (~25 минут);
▫️ S.E. Boukhetta, M. Trabelsi - Formal Concept Analysis for Trace Clustering, 2023 (15 стр.);
▫️ Для тех, кто не слышал раньше про термин FCA, рекомендуем наш недавний семинар: Егор Дудырев - Неформальное введение в Анализ Формальных Понятий, 2024 (~1 час 30 минут).
Семинар про генеративный дизайн

▫️ 3 июля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Глеб Соловьев, Исследовательский центр Сильный ИИ в промышленности, ИТМО

Тема: Генеративный дизайн с помощью технологий ИИ: модели, примеры, опенсорс

Аннотация
Сегодня в таких прикладных областях как химия и инженерия существует потребность в оптимизации процесса создания и поиска прототипов искомых объектов. Для решения данной задачи могут быть использованы методы машинного обучени как для поиска новых объектов, так и оптимизации существующих. В данном докладе будут освещены методы и примеры практического применения опенсорс генеративных инструментов, основанных на нейронных сетях, машинном обучении и эволюционной оптимизации.
Мероприятия NoML в июле

Полный план онлайн семинаров на этот месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:

▫️ 03.07 | Глеб Соловьев (ИТМО) — Генеративный дизайн с помощью технологий ИИ: модели, примеры, опенсорс;

▫️ 17.07 | Юрий Дорн (МГУ, МФТИ, ШАД) — Bandits with something: бандиты с бюджетами (bandits with knapsacks) и бандиты с тяжелыми хвостами (bandits with heavy tails);

▫️ 24.07 | Евгений Попов (Yandex Cloud), Никита Лазарев (ИСП РАН), Юрий Маркин (ИСП РАН) — Практический опыт применения FL в медицине на примере обучения модели по классификации ЭКГ-синдромов;

▫️ 31.07 | Нобатов Ишан (МГТУ, GlowByte) — Импульсные нейросети и метод обучения STDP.

Ссылка для подключения та же: Google Meet→
На всякий случай следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются более детальные анонсы предстоящих докладов.
Про новые интенсивы A2nced

В этом году под брендом A2nced мы запускаем два новых направления обучения: «Введение в причинно-следственный анализ» и «Задачи uplift-моделирования». У вас есть уникальная возможность перенять опыт экспертов команды Advanced Analytics GlowByte;)
Даты курсов уже определены, ведется сбор заявок.


Онлайн-интенсив «Введение в причинно-следственный анализ» | 10-24 сентября 2024 г.
На интенсиве коллеги из GlowByte AA расскажут об основных аспектах причинно-следственного анализа:
▫️ Где применяется причинно-следственный анализ;
▫️ Основные подходы к построению причинно-следственных графов;
▫️ Критерии для определения необходимого набора переменных для оценки эффекта;
▫️ Виды эффектов и модели для их оценки;
▫️ Валидация оценки эффекта.

Слушатели смогут применить все полученные в рамках курса знания на примере модельной задачи, презентовать свои решения и обсудить вопросы.

▫️ Даты обучения: 10-24 сентября 2024 г.
▫️ Формат: онлайн

Интенсив будет полезен:
▫️ Аналитикам и специалистам DS/ML, желающим разобраться в том, как использовать причинно-следственный анализ в индустриальных кейсах;
▫️ Руководителям DS подразделений для понимания ограничений классического ML и возможностей их преодоления методами причинно-следственного анализа.


Онлайн-интенсив
«Задачи uplift-моделирования» | 15-17 октября 2024 г.
На интенсиве обсудим постановку задачи uplift-моделирования, разберем теорию методов построения моделей, а так же на практике в рамках семинаров применим эти методы и оценим качество построенных uplift-моделей.

А в рамках практической части на реальных данных:
▫️ Научимся использовать базовые и продвинутые алгоритмы;
▫️ Осуществим подбор гиперпараметров;
▫️ Обсудим возникающие подводные камни, касающиеся валидации и стабильности алгоритмов.

▫️ Даты обучения: 15-17 октября 2024 г.
▫️ Формат: онлайн

Интенсив будет полезен:
▫️ Аналитикам и специалистам DS/ML, желающим разобраться в том, как использовать uplift-моделирование в индустриальных кейсах;
▫️ Руководителям DS подразделений для понимания достоинств и недостатков uplift-моделирования для определения сегментов для таргетированных акций.

На интенсивах вас ждет:

▫️ живая беседа в формате вопрос-ответ в период обучения с преподавателями;
▫️ практические задания по пройденному материалу;
▫️ (широко известный в узких кругах) сертификат от A2nced x GlowByte.


Преподаватели:

Вадим Порватов, Старший бизнес-аналитик практики GlowByte Advanced Analytics.
Специализируется на задачах предиктивной аналитики в области графов, причинно-следственному анализу, федеративному обучению; автор публикаций в областях computer vision и graph deep learning.

Владимир Селиверстов, Бизнес-аналитик практики GlowByte Advanced Analytics
Специализируется на задачах по uplift-моделированию и причинно-следственному анализу.

Полина Окунева
, Руководитель группы аналитики и моделирования в финансах и рисках
Имеет обширный опыт проектов с применением методики A/B тестирования в различных отраслях. Осуществила методологическую разработку курса по А/B тестированию. Куратор курсов по uplift-моделированию и причинно-следственному анализу.

Курс платный, узнать больше и записаться можно у Эльвиры Бегишевой @elvibeg.
Подробнее о программах интенсивов — на сайте a2nced.ai.
Про магистратуру ФКИ МГУ

Периодически пересекаюсь с коллегами с ФКИ МГУ (ФКИ — Факультет Космических Исследований). У коллег сейчас идет набор в магистратуру. Если вы когда-нибудь задумывались о том, чтобы связать свою жизнь с космосом, самое время воплотить мечты в реальность;)

Сейчас открыты 7 магистерских программ: от "Дистанционного зондирования Земли" до "Государственного управления в космической отрасли" и "Космических медико-биологических исследований". Есть бюджетные места, выпускники бакалавриата или "старого" 5-летнего специалитета могут сдать экзамены и пройти по конкурсу.

Выпускники ФКИ МГУ работают не только в аэрокосмической индустрии, но и, например, успешно занимаются построением ITшных космолётов на Земле. Есть курсы по базам данных, машинному обучению и методам математической оптимизации (коллеги, кстати, активно занимаются исследованиями в области нашего любимого мультиагентного моделирования).

В общем, если космос — это то, чем вы мечтали заниматься, но всегда откладывали, то вы можете:
▫️ прочитать подробности на сайте;
▫️ посмотреть ролик о магистерской программе "Дистанционное зондирование Земли";
▫️ и подать документы прямо сейчас→

Сроки подачи документов — до 20 июля 2024 г.
По всем вопросам можно обратиться к @morozovss.
Про генеративный дизайн в NSS Lab ИТМО

Открытие инструменты для генеративного дизайна (ГД) от NSS Lab (Natural System Simulation) ИТМО:
▫️ GEFEST (Generative Evolution For Encoded STructures)
▫️ GOLEM (Graph Optimization and Learning by Evolutionary Methods)

Пост на Хабре про открытые библиотеки ИТМО, включая GEFEST и GOLEM:
▫️ Open-source библиотеки от команд ИТМО: оптимизация графовых структур, генеративный дизайн, оптимизация гиперпараметров, 2023 (~7 мин.)

Публикации NSS Lab про ГД:
▫️ N.O. Starodubcev et al. — Generative Design of Physical Objects using Modular Framework, 2023 (19 стр., ~60 мин.)
▫️ G.V. Solovev et al. — AI Framework for Generative Design of Computational Experiments with Structures in Physical Environment, 2023 (8 стр., ~20 мин.)
▫️ G.V. Grigorev et al. — Single Red Blood Cell Hydrodynamic Traps Via the Generative Design, 2022 (10 стр., ~25 мин.)
▫️ N.O. Starodubcev, N.O. Nikitin, A.V. Kalyuzhnaya — Surrogate-Assisted Evolutionary Generative Design Of Breakwaters Using Deep Convolutional Networks, 2022 (8 стр., ~20 мин.)
▫️ N.O. Nikitin, I.S. Polonskaia, A.V. Kalyuzhnaya, A.V. Boukhanovsky — The multi-objective optimisation of breakwaters using evolutionary approach, 2021 (13 стр., ~20 мин.)
▫️ N.O. Nikitin et al. — Generative design of microfluidic channel geometry using evolutionary approach, 2021 (2 стр. ~7 мин.)

Ресурсы NSS Lab:
▫️ Телеграм канал: @NSS_group
▫️ Страница про команду, проекты и публикации: NSSLab→

Телеграм-чат Open-source сообщества ИТМО:
▫️ @itmo_opensource
Опрос ИТМО

Кстати, Центр научной коммуникации Университета ИТМО проводит анализ профессионального сообщества DS/ML-специалистов в России. Несколько вопросов про лидеров рынка и мнений, а также про особенности коммуникации и распространения информации в нашей области. Можно просто заполнить анкету (займет 5-10 минут), а можно напроситься на более подробное интервью)

Ссылка на опрос→
NoML — канал или чат

Напоминаю, что у нас есть и канал @noml_digest, и чат @noml_community. При этом есть смысл добавиться или в канал, или в чат, 95% информации дублируется и туда, и туда. Полезные ссылки от других участников сообщества из чата рано или поздно доезжают до канала.

А еще напоминаю, что записи мы сейчас выкладываем и на YouTube, и на Rutube (когда-нибудь дойдём до VK и Дзена).

Ну и еще напомню, что есть база знаний в Notion (можно запомнить короткий адрес noml.club). Вся информация по нашим мероприятиям там (только сейчас оно как-то не очень открывается, видимо кто-то что-то заблокировал).


P.S.: На этой неделе семинаров или созвонов нет, продолжим на следующей.
Два доклада коллег из GlowByte AA

Чтобы вы на этой неделе не скучали, вот записи двух недавних докладов коллег из команды Advanced Analytics GlowByte.

17 мая на конференция МТС True Tech Day Полина Окунева выступила c докладом про один интересный кейс применения причинно-следственного анализа:
▫️ Полина Окунева - Causal Inference на примере оценки эффекта от нетаргетированной кампании (~25 минут)

31 мая в рамках DataFest 2024 на секции GeoML Вадим Порватов рассказал про применение графовых нейронных сетей в задаче предсказания времени прибытия:
▫️ Вадим Порватов - Предсказание времени прибытия наземного транспорта (~20 минут)
Про магистратуру ВМК МГУ по направлениям ИБ

Мы тут с вами периодически поднимаем темы федеративного обучения, конфиденциальных вычислений и в целом информационной безопасности в области анализа данных. Вопросы на стыке ИБ и ИИ безусловно продолжают набирать обороты.

На ВМК МГУ есть несколько программ магистратуры, и по ИБ, и на стыке ИБ и ИИ:
▫️ "Информационная безопасность компьютерных систем”
▫️ "Искусственный интеллект в кибербезопасности"
▫️ "Кибербезопасность" (совместная магистратура ВМК МГУ и Сбера)

До 20 июля идет приём документов на поступление. Если вы вдруг еще не решили, какой области себя посвятить после бакалавриата, или уже давно имеете высшее образование и как раз задумываетесь о том, чтобы углубить и систематизировать свои познания и опыт, то рекомендую подумать про тему ИБ.

Программы обучения магистратур ВМК покрывают следующие направления:
▫️ современные методы защиты информации и криптографии, включая постквантовую криптографию;
▫️ современные методы машинного обучения и анализа данных, а также принципы разработки систем принятия решений на базе ML/AI;
▫️ принципы и практики оценки угроз, поиска уязвимостей и анализа защищенности информационных систем;
▫️ подходы защиты систем машинного обучения и искусственного интеллекта от всевозможных атак, методы обеспечения надежности и робастности моделей ML;
▫️ практики применения методов ML/AI в задачах обеспечения информационной безопасности IT систем.

Поступить могут все, у кого есть диплом бакалавра или "старого" 5-летнего специалиста, а также знания по математике и информатике.
▫️ Приём документов продлится до 20 июля
▫️ Подать документы можно дистанционно→
▫️ Страница приёмной комиссии ВМК→
▫️ По всем вопросам можно обратиться к @katestroeva
Семинар про бандитов с чем-то

▫️ 17 июля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Юрий Дорн, руководитель научной группы "Онлайн-оптимизация и приложения" и образовательной программы AI Masters Института ИИ МГУ, с.н.с. МГУ/МФТИ, преподаватель ШАД

Тема: Bandits with something

Аннотация
Этот рассказ будет посвящён нестандартным, но полезным и красивым постановкам задачи о многоруких бандитах. В частности, бандитам с бюджетами (bandits with knapsacks) и бандитам с тяжелыми хвостами (bandits with heavy tails). Это два небольших сюжета, каждый из которых полезен в своей области.
При обсуждении бандитов с бюджетами мы рассмотрим красивый трюк с аппроксимацией бандита через ЛП и матричные игры. При обсуждении алгоритмов для бандитов с тяжелыми хвостами мы затронем свежие результаты из стохастической оптимизации.
Запись семинара

Юрий Дорн (МГУ, МФТИ, ШАД) — Bandits with something: бандиты с бюджетами (bandits with knapsacks) и бандиты с тяжелыми хвостами (bandits with heavy tails)
▫️ YouTube, Дзен, RuTube (1 час 30 минут)
▫️ Презентация в базе знаний→
Про GNN и GDL

Недавно снова наткнулся на работы вот этих ребят в области графов и так называемого Geometric Deep Learning.

Графовые нейронные сети (GNN)
▫️ Короткое введение в современный взгляд на GNN с обзором работ: P. Veličković — Everything is Connected: Graph Neural Networks, 2023 (~15 минут)
▫️ Обзор темы в виде лекции: P. Veličković — Theoretical Foundations of Graph Neural Networks, 2021 (~1 час 10 минут)
▫️ Или более подробная версия в виде 3-х лекций: P. Veličković — Graph Neural Networks: Geometric, Structural and Algorithmic Perspectives (part 1, part 2, part 3), 2022 (~2 часа 40 минут)
▫️ Также снова хочется вспомнить статью про приложение экспандеров к GNN (больше по теме было тут и тут): A. Deac, M. Lackenby, P. Veličković — Expander Graph Propagation, 2022 (~35 минут)

Геометрическое глубокое обучение (GDL)
Geometric DL — это аналог Эрлангенской программы для нейронных сетей;) То есть взгляд на область с точки зрения теории групп, категорий и прочей алгебры.
▫️ По этой теме есть почти книга: M.M. Bronstein, J. Bruna, T. Cohen, P. Veličković — Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges, 2021 (~125 стр.)
▫️ Можно посмотреть вводно-обзорную лекцию (как раз в Эрлангенском университете): P. Veličković — Geometric Deep Learning, 2021 (~1 час 15 минут)
▫️ Про теорию категорий для DL можно почитать тут: B. Gavranović et al. — Categorical Deep Learning: An Algebraic Theory of Architectures, 2024 (~35 минут)
▫️ Или посмотреть 2 лекции: P. Veličković — Categorical Deep Learning (part 1, part 2), 2024 (~1 час 20 минут)
▫️ Больше информации про GDL (статьи, курс, другие лекции, блог …) можно найти на ресурсе geometricdeeplearning.com

В общем, если хотите заниматься нейронными сетями, учите нормальную алгебру;)
Семинар про FL в медицине

▫️ 24 июля (среда), 17:00 МСК
▫️ Подключение→

Выступают: Евгений Попов (Yandex Cloud), Никита Лазарев (ИСП РАН), Юрий Маркин (ИСП РАН)

Тема: Практический опыт применения FL в медицине на примере обучения модели по классификации ЭКГ-синдромов

Аннотация
На семинаре рассмотрим следующие вопросы:
▫️ Федеративное обучение (FL): основные классы решаемых задач, возможности и ограничения, обзор основных алгоритмов агрегации в FL;
▫️ Предпосылки пилота для Сеченовского Университета, особенности предметной области при обучении моделей классификации ЭКГ-синдромов;
▫️ Архитектура FL-фреймворка NVFlare, особенности настройки инфраструктуры для FL, процесс разработки FL моделей с помощью NVFlare;
▫️ Эксперимент с обучением FL модели для классификации ЭКГ, основные результаты, дальнейшие планы.
Запись семинара

Евгений Попов (Yandex Cloud), Никита Лазарев (ИСП РАН), Юрий Маркин (ИСП РАН) — Практический опыт применения FL в медицине на примере обучения модели по классификации ЭКГ-синдромов
▫️ YouTube, Дзен, RuTube (1 час 35 минут)
▫️ Презентация в базе знаний→
Семинар про импульсные нейросети

▫️ 31 июля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Ишан Нобатов (МГТУ, GlowByte)
Тема: Импульсные нейросети и метод обучения STDP.

Аннотация
Нейронные сети второго поколения, несмотря на впечатляющие результаты, сталкиваются с проблемами масштабируемости и энергопотребления, которые ограничивают их применение. Импульсные сети предлагают решение этих проблем благодаря существенно меньшему энергопотреблению при использовании нейроморфных чипов, что открывает путь к развертыванию более мощных моделей ИИ на устройствах с ограниченным энергопотреблением. На семинаре рассмотрим метод импульсного обучения STDP и несколько значимых моделей импульсных нейросетей, реализующих этот метод обучения.
2025/10/20 09:42:29
Back to Top
HTML Embed Code: