LightAutoML framework

🔥Сегодня мы расскажем про библиотеку PyTorch-LifeStream (ссылка на видео с обзором).

Библиотека PyTorch-LifeStream содержит обширный инструментарий для создания эмбеддингов с помощью нейронных сетей на основе событийных данных. В ней есть как оригинальный алгоритм CoLES, так и модели, ранее использованные для текстов и картинок, но адаптированные для событий.

Преимущества построения эмбеддингов с использованием библиотеки PyTorch-LifeStream 💪:

✔️ Повышение качества моделей на сложных событийных данных за счет выявления скрытых признаков и связей
✔️ Меньшие затраты ИТ и человеческих ресурсов. Требуется работать с одним вектором для клиентов, что много проще и быстрее, чем работать с последовательностью сложно структурированных данных
✔️ Возможность работы с большими данными. Обучение эмбеддингов для миллионов клиентов с использованием миллиардов событий
✔️ Обезличивание. Можно работать с конфиденциальными данными без утечек, так как по эмбеддингу нельзя восстановить исходную информацию
✔️ Open source библиотека с готовыми алгоритмами для бесплатного использования
✔️ Гибкость и удобство использования. Есть готовые алгоритмы и инструменты, которые легко применить для новых данных. Можно создать единый пайплайн работ, кастомизировать модели, сравнивать результаты

YouTube

Обзор на PyTorch-LifeStream

При управлении бизнесом возникает множество задач, для решения которых может быть использовано машинное обучение. В каждой такой задаче требуется быстро исследовать много данных, в том числе событийных.

Библиотека PyTorch-LifeStream создана для работы с…

1.8K viewsOlga Plosskaya, 17:00

LightAutoML framework

Градиентный бустинг — один из самых эффективных и широко используемых алгоритмов машинного обучения на табличных данных.

Библиотека Py-Boost полностью раскрывает потенциал этого метода — благодаря широким возможностям кастомизации: кастомные лоссы на GPU, стратегии семплирования, возможность контролировать процесс обучения на любой стадии. Библиотека подходит для обучения multiclass, multilabel и multitask моделей. Чуть подробнее в этом видео

Преимущества:
✅ Быстрое обучение и применение моделей за счёт использования Python-библиотек для вычислений на GPU, например, CuPy
✅ Гибкие настройки и низкий порог входа
✅ Встроенный алгоритм SketchBoost, позволяющий значительно быстрее обучать модели бустинга с высокой точностью

Помимо замены кучи бинарных моделей на одну multilabel, фреймворк py-boost хорошо показал себя в задачах биоинформатики.

Ну и поддержка py-boost есть в gpu версии LightAutoML

GitHub

GitHub - sb-ai-lab/Py-Boost: Python based GBDT implementation on GPU. Efficient multioutput (multiclass/multilabel/multitask) training

Python based GBDT implementation on GPU. Efficient multioutput (multiclass/multilabel/multitask) training - sb-ai-lab/Py-Boost

2.3K viewsOlga Plosskaya, 08:03

LightAutoML framework

HIRING🚨
Всем приятного вечера!
Мы активно проводим поиски на вакансию AI researcher на ключевой проект по Time Series в нашу команду!

🔌 340-430 тысяч рублей + годовой бонус
📍Москва, гибридный формат

Задачи:
✅ Разработка few-shot multitask модели для временных рядов на базе трансформера без дообучения на конкретных данных
✅ Решение задач временных рядов SOTA алгоритмами, в том числе при помощи языковых LLM
✅ Участие в написании научных статей и/или разработке open-source библиотеки

Ожидаем от нового члена команды:
✅ Хорошее знание языка Python (в том числе опыт работы с ML и DL framework-ами (NumPy, SciPy, Pandas, PyTorch, Tensorflow и пр.)
✅ Глубокое понимание основ DL и классического ML, широкий кругозор в ML в целом
✅ Знание TS методов и подходов из NLP применительно к TS и желание совершенствоваться в этой области

Откликайтесь по ссылке и присоединяйтесь к команде Sber AI Lab!

По всем вопросам и рекомендациям пишите: @ekmaslennikova

2.3K viewsOlga Plosskaya, 16:03

LightAutoML framework

💥 Регистрируйся на хакатон!

Привет! Началась самая короткая рабочая неделя в году, а значит есть повод подумать, как провести лето! 🌞
До 5 июня открыта регистрация на хакатон "Лидеры цифровой трансформации 2024", само соревнование пройдет с 3 июня по 16 июня.

Одна из задач заключается в предсказании склонности клиента к покупке с помощью разработки мультимодальной модели, позволяющей прогнозировать выдачу продуктов в течение следующего месяца.

Мы предлагаем использовать библиотеку PyTorch-LifeStream в решении задачи, следите за бейзлайнами! А еще среди экспертах по этому треку будут соавторы библиотеки 🙃

Увидимся на хакатоне! 😍

i.moscow

Московский инновационный кластер

Московский инновационный кластер. Московский инновационный кластер создает экосистему продуктов и сервисов, а также условия, необходимые для эффективного развития инноваций и новых проектов. Подробнее на сайте.

2.5K viewsOlga, 06:32

LightAutoML framework

AutoML_Grand_Prix.pdf

350.1 KB

Мир, труд, май ✌️

01.05.24 на сореве Kaggle TabularPlaygroundSeries May 2024 #AutoMLGrandPrix команда "LightAutoML testers" обошла все команды Долины (H2O, Amazon, Microsoft со своими решениями - Driveless AI, AutoGluon, FLAML). Описание и код решения уже доступны в публичном доступе.

Следующие раунды соревнования пройдут 01.06.24, 01.07.24, 01.08.24 и 01.09.24 (каждый из которых продлится всего 24 часа)

Happy Kaggling 🦙

Please open Telegram to view this post

VIEW IN TELEGRAM

8.9K viewsAlex Ryzhkov, 11:04

LightAutoML framework

Коллеги, всем доброго дня!

Если вы еще не успели ткнуть ⭐️ на гитхабе на https://github.com/sb-ai-lab/LightAutoML, то самое время это сделать.

Наша глобальная текущая цель - собрать 1000 звезд и попасть в окружение Kaggle на постоянной основе!

Будем рады, если вы нас в этом поддержите ❤️

GitHub

GitHub - sb-ai-lab/LightAutoML: Fast and customizable framework for automatic ML model creation (AutoML)

Fast and customizable framework for automatic ML model creation (AutoML) - sb-ai-lab/LightAutoML

12.8K viewsAlex Ryzhkov, 08:34

LightAutoML framework

Forwarded from 🏄 Соревновательный Data Science | Kaggle | Чемпионаты

🏆

Запись стрима от 17 мая

Гость: Александр Рыжков (4️⃣

2️⃣

4️⃣

4️⃣) рассказал про применение AutoML в чемпах и свой 13-летний опыт на Kaggle.
Чемп: 🏅 TabularPlaygroundSeries May 2024 #AutoMLGrandPrix

Описание
Код решения
Kaggle Александра
Наш Youtube

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

Kaggle Grandmaster Александр Рыжков про победы с LightAutoML

Больше контента в нашем канале в телеграмме https://www.tgoop.com/data_science_winners

Гость - Александр Рыжков @RyzhkovAlex (grand master по 3 категориям из 4) рассказал про применение AutoML в чемпах и про свой 13-летний опыт на Kaggle.

Чемп: Kaggle TabularPlaygroundSeries…

1.9K viewsAlex Ryzhkov, 14:08

LightAutoML framework

Всем привет, коллеги!

Буквально сегодня ночью на Kaggle завершилось соревнование Home Credit - Credit Risk Model Stability на почти 4к команд, сутью которого было предсказать, какие клиенты с большей вероятностью не выплатят свои кредиты. Отдельным челленджем являлась задача сделать свою модель максимально стабильной во времени. По итогу это была задача кредитного скоринга на табличках (что в текущих реалиях довольно большая редкость для Kaggle).

🤖 LightAutoML показал себя в нем максимально достойно:
- Благодаря усилиям Андрея Нестерова и его ноутбуку с использованием моделей Denselight из LightAutoML можно было получить серебряную медаль и занять 40 место из 3885
- Если же использовать ноутбук с большим количеством моделей в композиции (включающим модели из LightAutoML), то можно было забраться в призы (заработать $10к 💸) и финишировать на 4-ом месте 🔥

👀(И это пока что результаты без учета решений победителей, которые еще не опубликованы)

Happy Kaggling with LightAutoML 🦙

P.S. Большое спасибо всем тем, кто помог дотолкать наш GitHub репозиторий до важной планки ⭐️1к+ - эта история позволила нам создать запрос на добавление LightAutoML в официальный Kaggle Kernel environment. При желании его тоже можно поддержать, как это уже успел сделать Самвел 🥹

Kaggle

Home Credit - Credit Risk Model Stability

Create a model measured against feature stability over time

9.0K viewsAlex Ryzhkov, 11:07

LightAutoML framework

0:56

Media is too big

VIEW IN TELEGRAM

🔥 Привет, друзья! У нас для вас интересное предложение ☺️

Хотите помочь повысить эффективность рекомендаций? Тогда залетайте к нам!

Мы предлагаем решить нашу задачу 12 — разработать предиктивную модель для рекомендации продуктов банка

🟩

Что нужно сделать
Разработать мультимодальную модель, позволяющую прогнозировать выдачу продуктов в течение следующего месяца. Обязательное условие: использование библиотеки PyTorch-LifeStream в решении задачи

🟥

Призовой фонд задачи

1 место — 1 000 000 ₽
2 место — 600 000 ₽
3 место — 400 000 ₽

Присоединяйтесь к международному хакатону! Разработка начнется уже 3 июня. Успейте зарегистрироваться до 5 июня включительно!

🟢

English version

Please open Telegram to view this post

VIEW IN TELEGRAM

2.7K viewsДаша, 14:21

LightAutoML framework

Forwarded from HypEx (Дмитрий Тихомиров)

Привет, друзья! 🎉

🌟 Есть новость, от которой у нас просто космос! Наш проект HypEx выиграл награду "Перспективный проект" в премии Гравитация! 🚀

Огромное спасибо всей нашей команде за труд и энтузиазм. Вы супер! 👩‍💻👨‍💻 И благодарим наших замечательных внешних контрибьюторов, а также пользователей за их фидбек и новые идеи. Без вас ничего бы не получилось! 🌟

Спасибо премии Гравитация за признание! Теперь мы знаем, что разные гипотезы могут действительно тянуть нас к новым вершинам (ну, или к звёздам💫). 😉

Если ещё не поставили нам звёздочку на GitHub, самое время это сделать! 🌟 Это помогает нам становиться лучше.

Двигаемся вперёд, оставайтесь с нами — многое ещё впереди!

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

2.3K viewsAlex Ryzhkov, 13:47

LightAutoML framework

Всем привет!

На прошедшем вчера третьем этапе AutoML Grand Prix на Kaggle команде Лаборатории AI "LightAutoML testers" удалось занять 3-е место, уступив только командам из H2O с решениями на базе платного решения Driveless AI и опередив коллег из Amazon, Microsoft, MLJAR и других компаний.

Полное решение с описанием будет выложено в ближайшие дни (следите за обновлениями 🤓), однако уже сейчас публично доступно сверхбыстрое решение на основе одной табличной нейронной сети из LightAutoML, способное занять 5-ое место: https://www.kaggle.com/code/simakov/lightautoml-denselight (вы знаете, что делать ⭐️)

Happy Kaggling 🦙

Please open Telegram to view this post

VIEW IN TELEGRAM

Kaggle

LightAutoML DenseLight

Explore and run machine learning code with Kaggle Notebooks | Using data from Binary Classification of Insurance Cross Selling

7.2K viewsAlex Ryzhkov, 13:30

LightAutoML framework

This media is not supported in your browser

VIEW IN TELEGRAM

И в продолжение вечера новостей хотели бы поделиться запросом от наших хороших знакомых.

Уважаемые коллеги, тех, кому интересна математика и машинное обучение, наши коллеги приглашают принять в неформальном проекте.

Минимальное требование - Вы знакомы с Питоном, и у Вас есть несколько часов свободного времени в неделю. (Альтернативно - можно не знать Питон, но хорошо знать теорию групп.)

Цель проекта - применить машинное обучение к теории групп. Результат проекта - написание статьи в хорошем журнале. Другим бонусом будет являться - работа под руководством опытных специалистов в области машинного обучения и приобретение навыков по современным методам нейронных сетей, Reinforcement Learning и т.д.

Примерный список направлений
1) Задача поиска короткого пути на графах Кэли (сборка кубика - аналог Каггл Санта23 - но для произвольных групп)
2) Оценки диаметра ("числа бога") для графов (то есть расстояние между самыми дальними точками на графах)
3) Бенчмарк эмбедингов графов на основе математических результатов о графах
4) Многое другое, что тесно связано - случайные блуждания, гипотеза Ловаса о обязательном существовании гамильтонова пути на любом графе Кэли,

Если Вам интересно участие - напишите @alexander_v_c (Александр Червов), чат для обсуждений тут .

2.3K viewsAlex Ryzhkov, 15:38

LightAutoML framework

Добрый день, коллеги!

В продолжение недавнего сообщения о нашем участии в Kaggle AutoML Grand Prix - мы-таки выложили полноценное описание своего решения на 125 моделей, построенных за 24 часа (схему можно увидеть на первой приложенной к посту фотографии) 🤖

Также доступны:

- Открытый код инференса с финальным скором

- Датасет с различными предсказаниями и обученными моделями (еще больше, чем необходимо для финального сабмита)

Вопросы, замечания, предложения, ~~лайки, share, подписки~~ приветствуются ❤️

Также хочется отметить, что на второй приложенной к посту картинке изображен текущий лидерборд Kaggle AutoML Grand Prix за 3 прошедших этапа и основной баттл за призы еще впереди - всего в 5 очках расположены 5 команд, каждая из которых может претендовать на итоговое 1-ое место и $25k 💸

4.9K viewsAlex Ryzhkov, 12:20

LightAutoML framework

Уже в конце июня закончился хакатон Лидеры цифровой трансформации 2024! 😮

Как вы уже знаете, участникам предлагалось решить 25 различных задач. При этом по каждой из задач по итогам выбирались три лучших решения команд участников

В одной из наших задач, заключающейся в разработке мультимодальной модели, позволяющей прогнозировать выдачу продуктов в течение следующего месяца, первые три места заняли команды участников, использующие библиотеку pytorch-lifestream

😌

🥰

А вот и особенности решения команд 😏:

🏆 Первое место: Magic City
🟢Модель использует все модальности и сразу обучается одной моделью под задачу предсказания следующего продукта
🟢Использование своего кастомного препроцессора данных, написанного на Polars

🏆 Второе место: Лидируй катбустируй
🟢Использование предобученной модели раннего фьюжена на всех трех модальностях
🟢Ансамбль нейросетей и ручных признаков
🟢Использование своего кастомного препроцессора данных, написанного на Polars

🏆 Третье место: AlfaWolves
🟢Использование архитектуры раннего фьюжена для всех трех модальностей
🟢Поздний фьюжен унимодальных моделей и раннего фьюжена
🟢Обучение под задачу мультилейбл с ResNet головами под каждый таргет
🟢Все эмбеддинги и табличные признаки использовались внутри бустингов и MLP моделей в финальном ансамбле

До скорого! Оставайтесь на связи, чтобы не пропустить самое интересное, а мы будем продолжать развиваться для вас и достигать новых вершин 🚀

P.S. Первая и вторая команды поделились ссылками на свои репозитории с решениями. Если ещё не поставили им звёздочку на GitHub, самое время это сделать! ⭐️

Please open Telegram to view this post

VIEW IN TELEGRAM

developers.sber.ru

pytorch-lifestream представляет событийные данные в виде набора чисел — embeddings

С помощью методов, реализованных в библиотеке pytorch-lifestream, можно представлять в виде набора чисел сложные событийные данные, например, истории посещений сайтов, истории покупок, события в онлайн-играх

2.9K viewsДаша, 08:36

2025/06/28 20:44:12
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>