tgoop.com/asisakov_channel/995
Last Update:
MAPE, SMAPE, WAPE, WMAPE
Допустим, нам надо сравнить наши модели прогнозирования спроса. Смотрим на графички, и вроде везде все красиво, понятно, вроде близки по профилям. Если подумать о метриках, то первым делом приходят в голову MAE и MAPE, при этом MAPE предпочтительней в случаях сильно различающихся абсолютов.
Но бывают моменты, когда у нас адекватный MAE и улетающий MAPE
Го разбираться:
Проблемы начинаются в окрестностях нуля (допустим, было 0-1-2 транзакций, когда в среднем под 1000). Исключим очевидные моменты с делением на ноль, но при этом все же имеем неприятный момент с околонулевым знаменателем. Типа поделили (1000-1) на 1, и получили 99900% ошибки.
Кайф? Не особо
Ну и не забываем про несимметричность метрики - в кейсе с 1 вниз мы улетим максимум на 100%, ну а вверх неограничены.
Здесь мы примерно стараемся избежать маленького знаменателя, но конечно же в некоторых кейсах деление на маленькие числа неизбежны. При этом имеем значение метрики от 0% до 200%, что решает проблему бесконечной ошибки MAPE.
Кстати, можете попробовать на обычных примерах оценить реальную симметричность метрики - можно заметить склонность сильнее штрафовать за занижение прогноза. Ну и стоит ли бизнесу говорить о симметричном MAPE?
Наверно не стоит
Понятно бизнесу, нет деления на ноль и вообще все четко. Но при высокой точности по WAPE мы можем топово предсказывать крупные категории и полностью промахиваться по остальным сегментам.
На тотале мы уже не уидим таких разлетов, но по конкретным категориям все же деление на околонулевые значения будет накладывать свой эффект.
Что в итоге?
Я думаю, вы отсюда уже поняли, что не существует одной идеальной метрики, и лучше всего смотреть их комбинации или разные разрезы для того, чтобы принимать правильные стратегические решения. Выбирайте метрики с чувством, толком и расстановкой, ну и пусть наши прогнозы всегда будут точными.
Дополнительное чтиво: 1, 2, 3
#metrics