FILIPPOV_GENAI Telegram 14
ML vs GenAI

На фоне роста GenAI бизнес всё чаще задаётся вопросом: что делать с ML-решениями? Во многих компаниях уже есть полноценные команды Data Science, но непонятно, стоит ли продолжать инвестировать в долгий и дорогой процесс создания ML-моделей. Не станет ли всё это устаревшим и ненужным?

На мой взгляд — нет. Более того, в некоторых задачах технологии GenAI могут дать ML новый виток развития.

Возьмём, например, рекомендательные системы (RecSys). Они, как правило, требуют большого количества данных: истории покупок, просмотров фильмов, поисковых запросов и etc. У таких моделей почти всегда возникает проблема холодного старта — и её вполне можно решить с помощью синтетических данных, сгенерированных LLM.

Другой пример — обогащение фич-листов ML-моделей информацией, агрегированной с помощью LLM. Мы можем просто закинуть в модель какую-то data клиента, которая на первый взгляд не связана со скорингом (например транзакции), и попробовать извлечь из них что-то полезное. В духе: «Любит ли он летать на самолётах?» Да, это будет не супер точно. Да, не факт, что фича в итоге улучшит скор. Но гипотеза точно стоит теста.

Наконец, LLM и другие генеративки иногда позволяют прототипировать ML-решение за 2-3 дня. Допустим, нужен классификатор — пока нет датасета, роль модели временно играет LLM. Смотрим, какую точность она даёт, запускаем пилот, проводим A/B-тесты. И уже на основе этих результатов принимаем решение: стоит ли вкладываться в полноценную разработку, собирать команду и инвестировать в данные и масштабирование.



tgoop.com/filippov_GenAI/14
Create:
Last Update:

ML vs GenAI

На фоне роста GenAI бизнес всё чаще задаётся вопросом: что делать с ML-решениями? Во многих компаниях уже есть полноценные команды Data Science, но непонятно, стоит ли продолжать инвестировать в долгий и дорогой процесс создания ML-моделей. Не станет ли всё это устаревшим и ненужным?

На мой взгляд — нет. Более того, в некоторых задачах технологии GenAI могут дать ML новый виток развития.

Возьмём, например, рекомендательные системы (RecSys). Они, как правило, требуют большого количества данных: истории покупок, просмотров фильмов, поисковых запросов и etc. У таких моделей почти всегда возникает проблема холодного старта — и её вполне можно решить с помощью синтетических данных, сгенерированных LLM.

Другой пример — обогащение фич-листов ML-моделей информацией, агрегированной с помощью LLM. Мы можем просто закинуть в модель какую-то data клиента, которая на первый взгляд не связана со скорингом (например транзакции), и попробовать извлечь из них что-то полезное. В духе: «Любит ли он летать на самолётах?» Да, это будет не супер точно. Да, не факт, что фича в итоге улучшит скор. Но гипотеза точно стоит теста.

Наконец, LLM и другие генеративки иногда позволяют прототипировать ML-решение за 2-3 дня. Допустим, нужен классификатор — пока нет датасета, роль модели временно играет LLM. Смотрим, какую точность она даёт, запускаем пилот, проводим A/B-тесты. И уже на основе этих результатов принимаем решение: стоит ли вкладываться в полноценную разработку, собирать команду и инвестировать в данные и масштабирование.

BY Илья Филиппов


Share with your friend now:
tgoop.com/filippov_GenAI/14

View MORE
Open in Telegram


Telegram News

Date: |

The channel also called on people to turn out for illegal assemblies and listed the things that participants should bring along with them, showing prior planning was in the works for riots. The messages also incited people to hurl toxic gas bombs at police and MTR stations, he added. best-secure-messaging-apps-shutterstock-1892950018.jpg Judge Hui described Ng as inciting others to “commit a massacre” with three posts teaching people to make “toxic chlorine gas bombs,” target police stations, police quarters and the city’s metro stations. This offence was “rather serious,” the court said. In handing down the sentence yesterday, deputy judge Peter Hui Shiu-keung of the district court said that even if Ng did not post the messages, he cannot shirk responsibility as the owner and administrator of such a big group for allowing these messages that incite illegal behaviors to exist. Hashtags
from us


Telegram Илья Филиппов
FROM American