Telegram Web
Очная встреча про математическую оптимизацию

▫️ 11 декабря (среда), 17:00 МСК
▫️ Место встречи: г. Москва, Нижний Сусальный пер., д. 5 стр. 19 (БЦ Арма, офис компании GlowByte), вход свободный, ставьте 💯, если придёте очно
▫️ Онлайн-трансляция будет на нашем YouTube канале

Тема: Математическая оптимизация: подходы, технологии, бизнес задачи и тренды

Приглашенные эксперты:
▫️ Семён Косяченко, Александр Попков, Глеб Канин (Optimacros);
▫️ Василий Замолотов (Axenix);
▫️ Алексейс Ложкинс (LA Optimization / BIA Technologies);
▫️ Алексей Тарасов (Разумное Расписание);
▫️ Максим Гончаров (GlowByte Advanced Analytics).
Модератор дискуссии:
▫️ Павел Снурницын (GlowByte Advanced Analytics).

План встречи:
В первой части приглашенные эксперты расскажут о своем опыте применения методов математической оптимизации и исследования операций в реальных бизнес-задачах. Они поделятся примерами успешных проектов, обсудят актуальные проблемы и вызовы, с которыми сталкиваются, и способы их решения.

Во второй части мероприятия состоится панельная дискуссия, где эксперты и участники смогут обсудить ключевые вопросы, посвященные следующим темам:
▫️ Технологии и методы
— Возможности российских вендоров и open-source решений для разработки и отладки оптимизационных моделей.
— Выбор оптимальной стратегии для решения задач: классические методы, метаэвристики или имитационное моделирование, их преимущества и ограничения в различных сценариях.
— Актуальные потребности бизнеса в готовых программных продуктах на базе математической оптимизации, включая решения для логистики, графикования, интегрированного планирования и других задач в области управления цепями поставок.
▫️ Продуктивизация
— Учет жестких временных ограничений на принятие решений в реальных системах и другие вопросы системного дизайна промышленных сервисов на основе математической оптимизации.
— Способы, фреймворки и метрики для эффективного взаимодействия с бизнес-заказчиками, не обладающими глубокими знаниями в области математической оптимизации.
— Особенности управления модельным риском в случае оптимизационного и имитационного моделирования.
▫️ Кадры и обучение
— Вход в профессию: роль академического образования и самообучения в подготовке специалистов.
— Способы повышения квалификации и профессионального роста в области исследования операций.
— Взаимодействие академической среды и индустрии не только в области образования, но и для совместного решения прикладных и научных задач.
▫️ Тренды
— Интеграция ИИ в настройку оптимизационных солверов.
— Новые инструменты и подходы при решении из области исследования операций.
— Личные наблюдения участников и глобальные тенденции.

После официальной части в каком нибудь пабе неподалеку можно будет более плотно обсудить насущные вопросы;)

Мероприятие организовано при поддержке Optimacros и GlowByte.
NoML Recap — доклады экспертов круглого стола

Почти все эксперты завтрашней встречи выступали у нас ранее (а кто-то даже не один раз), напомним некоторые доклады:

▫️ Семён Косяченко, Решение задачи балансов на графе и поиск ошибок измерителей с помощью нейросетей, 2024. YouTube | Дзен | RuTube (~1 час 5 минут).

▫️ Василий Замолотов, Эффективное планирование шихтования и оптимизация логистики, 2023. YouTube | Дзен | RuTube (~1 час 5 минут).

▫️ Алексейс Ложкинс, Искусство математического моделирования, 2024. YouTube | Дзен | RuTube (~1 час 30 минут).

▫️ Алексей Тарасов, Алгоритм огранки бриллиантов на основе методов нелинейной оптимизации, 2024. YouTube | Дзен | RuTube (~1 час 20 минут).

▫️ Максим Гончаров, Введение в прикладную математическую оптимизацию, 2023. YouTube | Дзен | RuTube (~1 час 35 минут).

Приходите завтра на нашу встречу сообщества, познакомимся в офлайне.
Запись встречи-дискуссии

▫️ Математическая оптимизация: подходы, технологии, бизнес задачи и тренды. YouTube | Дзен | RuTube (~1 час 55 минут).
Семинар про Influence Maximization

▫️ 18 декабря (среда), 17:00 МСК
▫️ Подключение→

Выступает: Александр Гавриков, Senior Researcher R&D центра Т-Банка

Тема: Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований

Аннотация
Задача Influence Maximization занимает ключевое место в сфере анализа социальных сетей и мессенджеров, где основная цель заключается в определении узлов, способных максимально эффективно распространять информацию среди пользователей. В докладе рассматриваются современные исследования и разработки алгоритмов, освещаются текущие тренды и методы решения, их достоинства, недостатки и ограничения. Презентация включает в себя как теоретические обзоры, так и практические примеры применения данных методов в различных индустриях, что делает её актуальной для специалистов в областях дискретной математики и Computer Science.

Уровень сложности: продвинутый, для понимания доклада требуются базовые знания дискретной математики, теории вероятностей, теории графов и временной сложности алгоритмов

Ключевые слова: Influence Maximization, Influence propagation models, Independent cascade, Linear Threshold, CELF, TIM+, IMM, CoFIM, Community-based models
Запись семинара

Александр Гавриков (Т-Банк), Задача Influence Maximization: открытые проблемы, тренды, перспективы исследований. YouTube | Дзен | RuTube (~55 минут).
Семинар не только про ML

▫️ 25 декабря (среда), 17:00 МСК
▫️ Подключение→

Выступают: Максим Гончаров, Павел Снурницын (GlowByte Advanced Analytics)

Тема: Not only ML или Почему в эру ИИ не стоит забывать о классических методах мат. моделирования

Аннотация
На заключительном в этом году семинаре поговорим не только про ML) Подведём итоги не только этого года но и вообще последних лет существования сообщества NoML и нашей команды в GlowByte AA.
▫️ Разберём таксономию современных прикладных аналитических методов, включая прогнозную, описательную и предписательную аналитику. Обсудим, где место последним нашумевшим технологиям, таким как LLM и GenAI, в этой структуре.
▫️ Рассмотрим также применение методов имитационного моделирования, дизайна экспериментов, обучения с подкреплением, динамического программирования и причинно-следственного анализа для решения сложных бизнес-задач.
▫️ Пройдемся по практическим кейсам применения прогнозных, оптимизационных и имитационных моделей для решения бизнес-задач в различных отраслях, таких как производство, логистика, ритейл, финансовый сектор и др. Обсудим, как совместное использование разнообразных методов и подходов помогает получать результаты принципиально другого характера.
▫️ Обсудим текущий ландшафт технологий для оптимизации и исследования операций, включая вызовы, связанные с импортозамещением. В заключение поговорим про системный дизайн, модельный риск и вопросы доверенного ИИ.

Уровень сложности: начинающий, семинар носит обзорный (а может быть даже и программный характер) и ориентирован на слушателей имеющих практический опыт работы в проектах на стыке анализа данных, мат. оптимизации и исследования операций.

Ключевые слова: прогнозная, описательная и предписательная аналитика, математическая оптимизация, имитационное моделирование, исследование операций, причинно-следственный анализ, модельный риск, доверенный ИИ.
Запись семинара

Запись семинара прошедшего 25 декабря:
Максим Гончаров, Павел Снурницын (GlowByte), Not only ML или Почему в эру ИИ не стоит забывать о классических методах мат. моделирования. YouTube | Дзен | RuTube (~1 час 55 минут).

Продолжим наши еженедельные мероприятиям в конце января / начале февраля.
Мероприятия NoML в феврале

План семинаров на ближайший месяц, все доклады по средам в 17:00 МСК, сохраняйте релевантные темы в свои календари:

▫️ 05.02 | Дмитрий Васильков (QuSolve), Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet;

▫️ 12.02 | Егор Дудырев (НИУ ВШЭ, Университет Лотарингии), Кластеризация на правилах или как найти кластеризации, которые легко объяснить;

▫️ 19.02 | Алан-Барсаг Газзаев (MTS AI, ИТМО), Обучение языковой модели Cotype Nano;

▫️ 26.02 | Ярослав Шмулев (R77 AI), Рекомендательная система для завода по оптимизации процесса производства стали;

Следите за обновлениями в наших канале @noml_digest и чате @noml_community, там же публикуются детали предстоящих докладов и ссылки для подключения.
Семинар про интерпретируемый ИИ и солвер OptJet

▫️ 5 февраля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Дмитрий Васильков, генеральный директор QuSolve

Тема: Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet

Аннотация
ML-модели и ИИ в целом все шире используются в областях, где цена ошибки при принятии решения высока (например, в медицине или финансах). В связи с этим активно развиваются методы объяснения и проверки тех или иных решений, принимаемых ИИ-системами. Эта область знаний получила название “интерпретируемый ИИ” (Explainable AI, XAI). Существующие методы XAI можно подразделить на эвристические и строгие: первые простые и быстрые, зато вторые точные и надежные. Один из эффективных строгих методов — представление ML-модели в виде множества логических высказываний и использование аппарата формальной логики и созданных на его основе вычислительных алгоритмов для поиска минимального набора критериев, на основе которых исследуемая ML-модель принимает то или иное решение. В докладе расскажем об использовании алгоритма MaxSAT, реализованного в солвере OptJet, для интерпретации ансамблевых ML-моделей.

Уровень сложности: начинающий/средний, для понимания доклада будет достаточно базовых знаний по DS/ML и математической оптимизации.

Ключевые слова: интерпретация ML-моделей, интерпретируемый ИИ (XAI), математическая оптимизация, MaxSAT, SAT, оптимизационные решатели/солверы.
Запись семинара

Дмитрий Васильков (QuSolve), Интерпретируемый ИИ: рынок, теория и практическая реализация с применением MaxSAT-солвера OptJet. YouTube | Дзен | RuTube (~1 час 10 минут).
Семинар про кластеризацию на базе анализа формальных понятий

▫️ 12 февраля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Егор Дудырев (НИУ ВШЭ, Университет Лотарингии)

Тема: Кластеризация на правилах или как найти кластеризации, которые легко объяснить

Аннотация
В этом докладе мы рассмотрим пайплайн кластеризации на правилах, где каждый кластер задаётся простым, легко читаем условием. В случае с числовыми данными, такие условия будут выглядеть как: "объект x находится в кластере y если значение его 1-го признака x1 лежит в интервале [a, b], а значение десятого признака x10 – в интервале [c, d]".

Предложенный пайплайн ставится в противовес к "традиционному" подходу к кластеризации – где всё внимание уделяется расстоянию между объектами из разных кластеров. Из-за чего появляются кластера, которые трудно интерпретировать. Ведь даже чтобы объяснить, почему объект х лежит в кластере y, нужно нужно сначала посчитать расстояние в многомерном (часто, масштабированном) пространстве между x и всеми кластерами.

Семинар будет построен на основе статьи "Clustering with Stable Pattern Concepts" (предварительная публикация) представленной на воркшопе FCA4AI проходившем в рамках Европейской Конференции по ИИ (ECAI) в октябре 2024 года.

Мы рассмотрим пайплайн состоящий из трёх шагов:
1. как найти хорошие "стабильные" паттерны в данных, которые могут использованы в качестве описаний кластеров;
2. как объединить отдельные кластеры в кластеризации: т.е. как скомбинировать кластеры так, чтобы они покрывали (почти) все данные и при этом (почти) не пересекались;
3. и как из множества найденных кластеризаций выбрать одну наилучшую.

Вторая часть доклада будет посвящена обсуждению алгоритма комбинирования кластеров из шага 2: этот алгоритм получился довольно простым, при этом он содержит множество техник, эффективных для решения комбинаторных задач на бинарных данных.

Уровень сложности: продвинутый, для понимания доклада необходимо базовое представления о задаче кластеризации. В ходе доклада будут использованы термины из областей Frequent Itemset Mining и Subgroup Discovery, поэтому знакомство с этими областями может помочь, но совсем не обязательно. Наконец, рассматриваемый алгоритм является оптимизированной версией обхода графа в ширину, так что он будет полезен людям, знающим базу теории графов.

Ключевые слова: Clustering, Formal Concept Analysis, Pattern Structures, Rare Itemset Mining.
Recap про FCA

Перед завтрашним семинаром можно посмотреть предыдущие доклады Егора:
▫️ Егор Дудырев, Неформальное введение в Анализ Формальных Понятий, 2024. YouTube | Дзен | RuTube (~1 час 30 минут);
▫️ Егор Дудырев, Модели человеческих знаний, или Когда простейшие правила работают на уровне градиентных бустингов, 2023. YouTube | Дзен | RuTube (~1 час 10 минут).

И еще вспомнить подборку про FCA.
Запись семинара

Егор Дудырев (НИУ ВШЭ, Университет Лотарингии), Кластеризация на правилах или как найти кластеризации, которые легко объяснить. YouTube | Дзен | RuTube (~1 час 30 минут).
Про FCA для кластеризации и не только

В дополнение к докладу на прошлой неделе Егор рекомендует несколько статей от других команд, работающих над схожими задачами.

Две статьи про кластеризации от коллег из Ля Рошеля, которые так же разрабатывают теорию узорных структур (eng. Pattern Structures) :
▫️ Boukhetta S., Trabelsi M., Formal Concept Analysis for Trace Clustering in Process Mining, at ICCS 2023;
▫️ Waffo Kemgne M. et al., Fuzzy and Overlapping Communities Detection: An Improved Approach Using Formal Concept Analysis, at ASONAM 2024.

Две статьи от коллег из университета Артуа, где кластеризацию и бинарную классификацию решают через SAT солверы:
▫️ Ben Hassine M. et al, On the Discovery of Conceptual Clustering Models Through Pattern Mining, at ECAI 2024;
▫️ Hidouri A. et al., On the Learning of Explainable Classification Rules through Disjunctive Patterns, at ICTAI 2024.

В этой статье можно найти подробный обзор символьных подходов к кластеризации:
▫️ Pérez-Suárez A. et al., A review of conceptual clustering algorithms, in Artificial Intelligence Review, 2018.

Напоследок, в этой статье ниже можно найти множество техник и алгоритмов для оптимизации переборов описаний на бинарных данных:
▫️ Szathmary L. et al., A fast compound algorithm for mining generators, closed itemsets, and computing links between equivalence classes, in Annals of Mathematics and AI, 2014.
Семинар про модель Cotype Nano от MTS AI

▫️ 19 февраля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Алан-Барсаг Газзаев, разработчик-исследователь в MTS AI, магистрант второго курса в ИТМО

Тема: Обучение языковой модели Cotype Nano

Аннотация
Языковые модели развиваются стремительным образом. В то же время, они занимают очень много ресурсов для обучения и для инференса. Поэтому, одним из важных трендов в NLP является тренд на уменьшение размеров языковых моделей. Современные модели размером от 0.5B параметров превосходят в производительности старые LLM размеров в 7 и 14 миллиардов параметров. И мы обучили одну из них. В докладе мы затронем процесс обучения модели Cotype Nano, который несколько месяцев был лидером в своей весовой категории, а также расскажем про квантизацию этой модели

Уровень сложности: начинающий/средний, для понимания доклада будет достаточно базовых знаний по NLP

Ключевые слова: LLM, NLP, Supervised Fine-tuning, Data Generation, Data Preparation
Запись семинара

Алан-Барсаг Газзаев (MTS AI, ИТМО), Обучение языковой модели Cotype Nano. YouTube | Дзен | RuTube (~35 минут).
Семинар про оптимизацию сталеварения

▫️ 26 февраля (среда), 17:00 МСК
▫️ Подключение→

Выступает: Ярослав Шмулев, Cofounder / CTO R77 AI (@r77_ai)

Тема: Рекомендательная система для завода по оптимизации процесса производства стали

Аннотация
На семинаре будет рассмотрен кейс оптимизация потребления ферросплавов в конвертерном цехе для снижения затрат при производстве стали высокого качества. В ходе доклада будет представлен подход реализации рекомендательного сервиса на базе моделей машинного обучения.

Уровень сложности: начинающий

Ключевые слова: предиктивная аналитика, ML, прогнозирование временных рядов, оптимизация, рекомендации, сталеварение, металлургия
Запись семинара

Ярослав Шмулев (R77 AI @r77_ai), Рекомендательная система для завода по оптимизации процесса производства стали. YouTube | Дзен | RuTube (~1 час 10 минут).
Про ML в металлургии

Статьи, которые упоминал Ярослав в докладе на прошлой неделе:
▫️ Помощник сталевара: для чего металлургам нужно машинное обучение? 2021 (~9 минут);
▫️ Про внедрение ИИ в сталелитейную компанию и борщ, 2024 (~9 минут).

Также подписывайтесь на канал коллег: @r77_ai
Семинар про интерпретацию моделей ML для нефтегазовой отрасли

▫️ 5 марта (среда), 17:00 МСК
▫️ Google Meet→
▫️ Трансляция YouTube→

Выступает: Антон Воскресенский, Founder / CEO Voskresenskii Consulting (@voskresenskiiconsulting)

Тема: Методы интерпретации моделей машинного обучения в нефтегазовой отрасли

Аннотация
На семинаре разберем кейсы интерпретации моделей машинного обучения для нефтегазовой отрасли и инженерии признаков с опорой на экспертные знания. Рассмотрим:
- Модели для прогнозирования временных рядов
- Методы заполнения пропущенных данных
- Подходы к поиску схожих объектов
Каждый метод будет представлен с вводной по предметной области.

Уровень сложности: продвинутый

Ключевые слова: интерпретация моделей ML, прогнозирование временных рядов, каротажные кривые, взаимовлияние скважин, нефтегаз
2025/06/27 03:52:07
Back to Top
HTML Embed Code: