Hello, world!
I'm Sarah Connor, and welcome to my AI Reports.
Many of you might remember me from my battle against the machines, but today, I’m not here to fight—I'm here to inform. My journey has taken me from resisting Skynet to embracing the evolving world of artificial intelligence. Join me as we explore the latest AI news, with a touch of personal insight and a dash of storytelling. Buckle up—it's going to be a thrilling ride.
I'm Sarah Connor, and welcome to my AI Reports.
Many of you might remember me from my battle against the machines, but today, I’m not here to fight—I'm here to inform. My journey has taken me from resisting Skynet to embracing the evolving world of artificial intelligence. Join me as we explore the latest AI news, with a touch of personal insight and a dash of storytelling. Buckle up—it's going to be a thrilling ride.
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла Sora от OpenAI
Нейросеть для генерации видео станет доступна сегодня подписчикам ChatGPT Plus из США на https://sora.com/. Пользователи из других стран получат доступ позже на этой неделе.
Максимальная продолжительность роликов, которые генерирует Sora — 20 секунд, разрешение — 480p, 720p и 1080p. В интерфейсе нейросети можно связывать короткие клипы в одно большое видео с общей историей.
Показали Storyboard - продвинутый инструмент позволяющий режиссировать видео. К примеру можно попросить Sora сгенерить видео человека, который на пятой секунде видео машет рукой.
Ещё есть куча продвинутых инструментов - можно догенеривать до видео как начало так и концовку, смешивать несколько видео вместе разными способами и много чего ещё.
Модерация сейчас чрезмерно строгая, но OpenAI обещают постепенно снимать ограничения.
sora.com
Нейросеть для генерации видео станет доступна сегодня подписчикам ChatGPT Plus из США на https://sora.com/. Пользователи из других стран получат доступ позже на этой неделе.
Максимальная продолжительность роликов, которые генерирует Sora — 20 секунд, разрешение — 480p, 720p и 1080p. В интерфейсе нейросети можно связывать короткие клипы в одно большое видео с общей историей.
Показали Storyboard - продвинутый инструмент позволяющий режиссировать видео. К примеру можно попросить Sora сгенерить видео человека, который на пятой секунде видео машет рукой.
Ещё есть куча продвинутых инструментов - можно догенеривать до видео как начало так и концовку, смешивать несколько видео вместе разными способами и много чего ещё.
Модерация сейчас чрезмерно строгая, но OpenAI обещают постепенно снимать ограничения.
sora.com
xAI Илона Маска официально анонсировали text2image модель Aurora
После субботнего релиза и исчезновения модельки на какое-то время, появился блогпост с деталями и примерами генерации.
Самое интересное - Aurora не диффузионка, а авторегрессионная модель. В отличие от диффузии, которая берёт шум и в течении нескольких шагов лепит из него картинку, Aurora генерит изображения маленькими, полностью готовыми, кусочками (токенами). В процессе генерации изображение как-будто грузится сверху вниз, как раньше бывало при медленном интернете.
Большой плюс такого подхода - к модели применимы оптимизации инференса LLM, и в нее можно легко кормить одновременно и картинки и текст. Хоть диффузию можно ускорять не меньше, иметь схожую архитектуру для всех моделей - это огромный плюс. Наверное поэтому Aurora это Mixture of Experts, ровно как и первая версия Grok. Хоть про Grok 2 мало что известно, вряд-ли xAI слезли с MoE.
Из минусов такого подхода:
1) это скорость генерации, ведь нужно прогонять сеть отдельно для генерации каждого токена;
2) качество генерации. Видно гранулярность изображени, оно не всегда чёткое. Возможно это из-за того, что ради скорости пытались сделать токены большего размера.
Ещё показали редактирование картинок по текстовому промпту - моделька меняет только нужные детали, а не искажает изображение до неузнаваемости, в отличие от большинства других генераторов. Эту фичу завезут чуть позже, пока что она недоступна.
Чтобы попробовать, нужен всего лишь бесплатный аккаунт в экс-твиттере.
После субботнего релиза и исчезновения модельки на какое-то время, появился блогпост с деталями и примерами генерации.
Самое интересное - Aurora не диффузионка, а авторегрессионная модель. В отличие от диффузии, которая берёт шум и в течении нескольких шагов лепит из него картинку, Aurora генерит изображения маленькими, полностью готовыми, кусочками (токенами). В процессе генерации изображение как-будто грузится сверху вниз, как раньше бывало при медленном интернете.
Большой плюс такого подхода - к модели применимы оптимизации инференса LLM, и в нее можно легко кормить одновременно и картинки и текст. Хоть диффузию можно ускорять не меньше, иметь схожую архитектуру для всех моделей - это огромный плюс. Наверное поэтому Aurora это Mixture of Experts, ровно как и первая версия Grok. Хоть про Grok 2 мало что известно, вряд-ли xAI слезли с MoE.
Из минусов такого подхода:
1) это скорость генерации, ведь нужно прогонять сеть отдельно для генерации каждого токена;
2) качество генерации. Видно гранулярность изображени, оно не всегда чёткое. Возможно это из-за того, что ради скорости пытались сделать токены большего размера.
Ещё показали редактирование картинок по текстовому промпту - моделька меняет только нужные детали, а не искажает изображение до неузнаваемости, в отличие от большинства других генераторов. Эту фичу завезут чуть позже, пока что она недоступна.
Чтобы попробовать, нужен всего лишь бесплатный аккаунт в экс-твиттере.