tgoop.com/filippov_GenAI/14
Last Update:
ML vs GenAI
На фоне роста GenAI бизнес всё чаще задаётся вопросом: что делать с ML-решениями? Во многих компаниях уже есть полноценные команды Data Science, но непонятно, стоит ли продолжать инвестировать в долгий и дорогой процесс создания ML-моделей. Не станет ли всё это устаревшим и ненужным?
На мой взгляд — нет. Более того, в некоторых задачах технологии GenAI могут дать ML новый виток развития.
Возьмём, например, рекомендательные системы (RecSys). Они, как правило, требуют большого количества данных: истории покупок, просмотров фильмов, поисковых запросов и etc. У таких моделей почти всегда возникает проблема холодного старта — и её вполне можно решить с помощью синтетических данных, сгенерированных LLM.
Другой пример — обогащение фич-листов ML-моделей информацией, агрегированной с помощью LLM. Мы можем просто закинуть в модель какую-то data клиента, которая на первый взгляд не связана со скорингом (например транзакции), и попробовать извлечь из них что-то полезное. В духе: «Любит ли он летать на самолётах?» Да, это будет не супер точно. Да, не факт, что фича в итоге улучшит скор. Но гипотеза точно стоит теста.
Наконец, LLM и другие генеративки иногда позволяют прототипировать ML-решение за 2-3 дня. Допустим, нужен классификатор — пока нет датасета, роль модели временно играет LLM. Смотрим, какую точность она даёт, запускаем пилот, проводим A/B-тесты. И уже на основе этих результатов принимаем решение: стоит ли вкладываться в полноценную разработку, собирать команду и инвестировать в данные и масштабирование.
BY Илья Филиппов
Share with your friend now:
tgoop.com/filippov_GenAI/14