Нейронный Кот@neural_cat P.15

NEURAL_CAT Telegram 15

Нейронный Кот

Как оценивать качество разговорных ботов? 🤖

Допустим, у нас есть датасет, состоящий из диалогов людей. Мы на этих данных обучаем генеративную модель по истории диалога (контексту) предсказывать следующую реплику (ответ бота). Можно ли на валидационном датасете понять, хорош ли наш бот?

Первое, что приходит на ум, — использовать метрики из перевода или speech-to-text (BLEU, Word Error Rate, etc). В чем их проблема?

Оказывается, это плохая идея, так как на один и тот же вопрос можно ответить совершенно по-разному и все равно быть "правым" 🤷‍♀️

— Ты любишь огурцы?
— Да, люблю

vs.

— Ты любишь огурцы?
— Нет, ненавижу

Оба ответа имеют право на существование, поэтому любые метрики похожести между ответом бота и реальным ответом человека использовать не стоит! Хоть синтаксические (любые текстовые близости, в том числе расстояния между bag-of-words, tf-idf представлениями), хоть семантические (векторные расстояния над представлениями fasttext/bert/muse/etc).

Так что же делать? Одно из предложений — использовать разметку (читай в следующем выпуске журнала).

👍5😱1

www.tgoop.com/neural_cat/15

448 viewsedited Jun 10, 2022 at 15:50

tgoop.com/neural_cat/15

Create: 2022-06-10
Last Update: 2025-10-24 19:25:07

Как оценивать качество разговорных ботов? 🤖

Допустим, у нас есть датасет, состоящий из диалогов людей. Мы на этих данных обучаем генеративную модель по истории диалога (контексту) предсказывать следующую реплику (ответ бота). Можно ли на валидационном датасете понять, хорош ли наш бот?

Первое, что приходит на ум, — использовать метрики из перевода или speech-to-text (BLEU, Word Error Rate, etc). В чем их проблема?

Оказывается, это плохая идея, так как на один и тот же вопрос можно ответить совершенно по-разному и все равно быть "правым" 🤷‍♀️

— Ты любишь огурцы?
— Да, люблю

vs.

— Ты любишь огурцы?
— Нет, ненавижу

Оба ответа имеют право на существование, поэтому любые метрики похожести между ответом бота и реальным ответом человека использовать не стоит! Хоть синтаксические (любые текстовые близости, в том числе расстояния между bag-of-words, tf-idf представлениями), хоть семантические (векторные расстояния над представлениями fasttext/bert/muse/etc).

Так что же делать? Одно из предложений — использовать разметку (читай в следующем выпуске журнала).

BY Нейронный Кот

Share with your friend now:
tgoop.com/neural_cat/15

Open in Telegram

Telegram News

Date: 2025-10-24|

How to Create a Private or Public Channel on Telegram? A few years ago, you had to use a special bot to run a poll on Telegram. Now you can easily do that yourself in two clicks. Hit the Menu icon and select “Create Poll.” Write your question and add up to 10 options. Running polls is a powerful strategy for getting feedback from your audience. If you’re considering the possibility of modifying your channel in any way, be sure to ask your subscribers’ opinions first. Public channels are public to the internet, regardless of whether or not they are subscribed. A public channel is displayed in search results and has a short address (link). 3How to create a Telegram channel? Don’t publish new content at nighttime. Since not all users disable notifications for the night, you risk inadvertently disturbing them.
from us

Telegram Нейронный Кот
FROM American