IELEARNING Telegram 5796
HeyGen: Интерактивные AI-аватары для живого общения. На что они способны спустя год?

Видео: демо возможностей HeyGen. Я быстро собрал симулятор собеседования, где ИИ играет роль e-learning специалиста.


Год назад HeyGen анонсировали функцию генерации аватаров в реальном времени. Идея — фантастическая: диалоговый тренажер, где твой виртуальный собеседник выглядит и говорит почти как живой человек. Иммерсивность на максимум.

Правда, тогда это была скорее игрушка: качество и стабильность оставляли желать лучшего. Но за год команда здорово поработала, и сейчас продукт стал гораздо ближе к реальному применению.

Что изменилось в лучшую сторону?

1. Качество и стабильность
Картинка стала намного лучше. Подтормаживания есть, но уже не критичные. Да, всё ещё слышно и видно, что это ИИ, но общее впечатление стало более убедительным.

2. Упрощенная интеграция
Появился режим, похожий на создание агентов в ChatGPT. Загружаешь базу знаний, указываешь ссылки на материалы — и агент готов. Чтобы встроить его на сайт, достаточно скопировать пару строк кода. Идеально для простых консультантов-«болталок».

3. Гибкость через API
Если возможностей из «коробки» не хватает, есть стандартный API. Там аватар становится «говорящей головой», которой ты подаешь готовый текст. Реализация сложнее, но и свобода полная: можно делать диалоговые тренажеры с аналитикой или интегрировать аватара в бизнес-процессы.

Что все еще тормозит?

1. Эффект новизны быстро стирается
Пока записывал демо, успел наиграться. Набор анимаций, жестов и интонаций очень ограничен. Быстро замечаешь повторяющиеся паттерны. Создается впечатление, что для экономии мощностей используются костыли, что бьет по вариативности.

2. Цена для диалогов
Генерация видео стоит от 10 до 20 рублей за минуту. Простой голосовой тренажер на 10 минут обойдется в 10-20 рублей. Если добавить видео — +100 рублей за сессию. Цена вырастает в 5-10 раз. Резонный вопрос: а оно того стоит? Не думаю.

Приятный бонус:
Появились анимированные персонажи! И это, на мой взгляд, ключевое улучшение. Эффект «зловещей долины» (когда почти реалистичный, но неидеальный объект вызывает неприятие) для фотореалистичных аватаров никуда не делся. А с мультяшной графикой мелкие шероховатости смотрятся естественно и не отталкивают.

Ждем, когда цена упадет хотя бы раз в 10 (и немного подкрутят качество) – и будем внедрять 😁

И до встречи на конференции «Digital Learning 2025: итоги года» 20 ноября! 🚀

Алексей Миляев и команда сообщества Digital Learning

🔋Поддержать канал🟧
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥41



tgoop.com/ielearning/5796
Create:
Last Update:

HeyGen: Интерактивные AI-аватары для живого общения. На что они способны спустя год?

Видео: демо возможностей HeyGen. Я быстро собрал симулятор собеседования, где ИИ играет роль e-learning специалиста.


Год назад HeyGen анонсировали функцию генерации аватаров в реальном времени. Идея — фантастическая: диалоговый тренажер, где твой виртуальный собеседник выглядит и говорит почти как живой человек. Иммерсивность на максимум.

Правда, тогда это была скорее игрушка: качество и стабильность оставляли желать лучшего. Но за год команда здорово поработала, и сейчас продукт стал гораздо ближе к реальному применению.

Что изменилось в лучшую сторону?

1. Качество и стабильность
Картинка стала намного лучше. Подтормаживания есть, но уже не критичные. Да, всё ещё слышно и видно, что это ИИ, но общее впечатление стало более убедительным.

2. Упрощенная интеграция
Появился режим, похожий на создание агентов в ChatGPT. Загружаешь базу знаний, указываешь ссылки на материалы — и агент готов. Чтобы встроить его на сайт, достаточно скопировать пару строк кода. Идеально для простых консультантов-«болталок».

3. Гибкость через API
Если возможностей из «коробки» не хватает, есть стандартный API. Там аватар становится «говорящей головой», которой ты подаешь готовый текст. Реализация сложнее, но и свобода полная: можно делать диалоговые тренажеры с аналитикой или интегрировать аватара в бизнес-процессы.

Что все еще тормозит?

1. Эффект новизны быстро стирается
Пока записывал демо, успел наиграться. Набор анимаций, жестов и интонаций очень ограничен. Быстро замечаешь повторяющиеся паттерны. Создается впечатление, что для экономии мощностей используются костыли, что бьет по вариативности.

2. Цена для диалогов
Генерация видео стоит от 10 до 20 рублей за минуту. Простой голосовой тренажер на 10 минут обойдется в 10-20 рублей. Если добавить видео — +100 рублей за сессию. Цена вырастает в 5-10 раз. Резонный вопрос: а оно того стоит? Не думаю.

Приятный бонус:
Появились анимированные персонажи! И это, на мой взгляд, ключевое улучшение. Эффект «зловещей долины» (когда почти реалистичный, но неидеальный объект вызывает неприятие) для фотореалистичных аватаров никуда не делся. А с мультяшной графикой мелкие шероховатости смотрятся естественно и не отталкивают.

Ждем, когда цена упадет хотя бы раз в 10 (и немного подкрутят качество) – и будем внедрять 😁

И до встречи на конференции «Digital Learning 2025: итоги года» 20 ноября! 🚀

Алексей Миляев и команда сообщества Digital Learning

🔋Поддержать канал🟧

BY Digital Learning (канал)


Share with your friend now:
tgoop.com/ielearning/5796

View MORE
Open in Telegram


Telegram News

Date: |

Just at this time, Bitcoin and the broader crypto market have dropped to new 2022 lows. The Bitcoin price has tanked 10 percent dropping to $20,000. On the other hand, the altcoin space is witnessing even more brutal correction. Bitcoin has dropped nearly 60 percent year-to-date and more than 70 percent since its all-time high in November 2021. Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation. The visual aspect of channels is very critical. In fact, design is the first thing that a potential subscriber pays attention to, even though unconsciously. But a Telegram statement also said: "Any requests related to political censorship or limiting human rights such as the rights to free speech or assembly are not and will not be considered." “Hey degen, are you stressed? Just let it all out,” he wrote, along with a link to join the group.
from us


Telegram Digital Learning (канал)
FROM American