tgoop.com/ielearning/5797
Create:
Last Update:
Last Update:
HeyGen: Интерактивные AI-аватары для живого общения. На что они способны спустя год?
Видео: демо возможностей HeyGen. Я быстро собрал симулятор собеседования, где ИИ играет роль e-learning специалиста.
Год назад HeyGen анонсировали функцию генерации аватаров в реальном времени. Идея — фантастическая: диалоговый тренажер, где твой виртуальный собеседник выглядит и говорит почти как живой человек. Иммерсивность на максимум.
Правда, тогда это была скорее игрушка: качество и стабильность оставляли желать лучшего. Но за год команда здорово поработала, и сейчас продукт стал гораздо ближе к реальному применению.
Что изменилось в лучшую сторону?
1. Качество и стабильность
Картинка стала намного лучше. Подтормаживания есть, но уже не критичные. Да, всё ещё слышно и видно, что это ИИ, но общее впечатление стало более убедительным.
2. Упрощенная интеграция
Появился режим, похожий на создание агентов в ChatGPT. Загружаешь базу знаний, указываешь ссылки на материалы — и агент готов. Чтобы встроить его на сайт, достаточно скопировать пару строк кода. Идеально для простых консультантов-«болталок».
3. Гибкость через API
Если возможностей из «коробки» не хватает, есть стандартный API. Там аватар становится «говорящей головой», которой ты подаешь готовый текст. Реализация сложнее, но и свобода полная: можно делать диалоговые тренажеры с аналитикой или интегрировать аватара в бизнес-процессы.
Что все еще тормозит?
1. Эффект новизны быстро стирается
Пока записывал демо, успел наиграться. Набор анимаций, жестов и интонаций очень ограничен. Быстро замечаешь повторяющиеся паттерны. Создается впечатление, что для экономии мощностей используются костыли, что бьет по вариативности.
2. Цена для диалогов
Генерация видео стоит от 10 до 20 рублей за минуту. Простой голосовой тренажер на 10 минут обойдется в 10-20 рублей. Если добавить видео — +100 рублей за сессию. Цена вырастает в 5-10 раз. Резонный вопрос: а оно того стоит? Не думаю.
Приятный бонус:
Появились анимированные персонажи! И это, на мой взгляд, ключевое улучшение. Эффект «зловещей долины» (когда почти реалистичный, но неидеальный объект вызывает неприятие) для фотореалистичных аватаров никуда не делся. А с мультяшной графикой мелкие шероховатости смотрятся естественно и не отталкивают.
Ждем, когда цена упадет хотя бы раз в 10 (и немного подкрутят качество) – и будем внедрять 😁
И до встречи на конференции «Digital Learning 2025: итоги года» 20 ноября!
Алексей Миляев и команда сообщества Digital Learning
🔋Поддержать канал