Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
43 - Telegram Web
Telegram Web
Forwarded from Институт AIRI
Мы выложили в открытый доступ OmniFusion 1.1. — первую в России мультимодальную модель искусственного интеллекта 🚀

🔥О модели
OmniFusion 1.1. — это передовая мультимодальная модель искусственного интеллекта, предназначенная для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных, например, изображений, а в перспективе — аудио, 3D- и видеоконтента. Модель – SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, модель хорошо справляется со сложными задачами и понимает русский язык.

🔖Открытый код
В этот раз мы выкладываем модель в открытый доступ! Делимся ссылкой на GitHub и Technical Report на arXiv. Модель можно использовать как в некоммерческой, так и в коммерческой деятельности.

🌐Статья на Хабр
В статье мы рассказали об особенностях модели, процессе обучения и примерах ее использования. Также подсветили архитектуру, проделанные эксперименты как в части архитектурных трюков, так и в работе с данными. А еще собрали интересные кейсы использования на английском и русском языках.

На Hugging Face статья про архитектуру OmniFusion уже на первом месте в списке daily papers 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍32👌1
Всем привет!

Несколько месяцев назад коллеги из AIRI номинировали меня на участие в ежегодном рейтинге Forbes «30 до 30» ❤️. И буквально вчера пришла новость, что я попал в лонг-лист этого рейтинга в рубрике «Наука и технологии» ! 🔥 🥳

Из списка номинантов жюри, экспертный совет и редакция в конце концов выберут топ-30 человек. Финальное решение в том числе будет приниматься на основе количества голосов, отданных за номинанта. Поэтому буду благодарен за каждый голос за мою кандидатуру 🗳️ (конечно же, если вы посчитаете, что этот голос уместен 🤗)

Вот ссылочка на сайт Forbes, где можно проголосовать за меня до 30 апреля включительно. Всем большое спасибо! 😉😊
👍2816🔥15💯3👌1🏆1
Dendi Math&AI pinned «Всем привет! Несколько месяцев назад коллеги из AIRI номинировали меня на участие в ежегодном рейтинге Forbes «30 до 30» ❤️. И буквально вчера пришла новость, что я попал в лонг-лист этого рейтинга в рубрике «Наука и технологии» ! 🔥 🥳 Из списка номинантов…»
Forwarded from Complete AI (Andrey Kuznetsov)
Your Transformer is Secretly Linear

Спешу познакомить вас с новой публикацией лаборатории FusionBrain про линейность большинства слоёв языковых моделей декодеров (принята на конференцию ACL 2024 - Main Track, Core A*). Наше исследование позволяет проанализировать внутренние представления языковых моделей, а также без потери качества избавиться от 10-15% слоёв.

Еще мы придумали новый механизм регуляризации, чтобы снизить пресловутую линейность и, тем самым, получить небольшой буст в качестве.

Ниже ссылочки на статью на архиве и код на гитхабе нашей прошлой статьи про анизотропию и внутреннюю размерность эмбеддингов (представляли на EACL 2024).

Статья уже на Hugging Face Daily Papers и уверенно занимает первое место, но мы будем очень рады вашим upvote голосам ⬆️
https://huggingface.co/papers/2405.12250

📕arXiv
👨‍💻GitHub
📖Хабр

@complete_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥114
Dendi Math&AI
Всем привет! Несколько месяцев назад коллеги из AIRI номинировали меня на участие в ежегодном рейтинге Forbes «30 до 30» ❤️. И буквально вчера пришла новость, что я попал в лонг-лист этого рейтинга в рубрике «Наука и технологии» ! 🔥 🥳 Из списка номинантов…
Начинаю новую неделю с крутых новостей!

Благодаря вашим голосам я победил в рейтинге Forbes «30 до 30»! Всем большое спасибо! 🎉🥳 Также поздравляю и остальных участников «тридцатки», то есть победилей этого рейтинга - абсолютно все ребята заслуженно вошли в финальный шорт-лист 👍

Мы же с командой будем и дальше развивать искусственный интеллект в России, прокачивать наши модели Kandinsky, Kandinsky Video, GigaChat, OmniFusion и создавать новые архитектуры, делиться наработками в научных и научно-популярных статьях и выкладывать в открытый доступ код! 💪

Кстати говоря, в самое ближайшее время ждите интересные новости про модель Kandinsky! 😉

@dendi_math_ai
35🔥16🍾7
Forbes представляет победителей рейтинга «З0 до 30»

В новом списке — инвестдиректор Skyeng Андрей Дубровский, создатель нейросети Kandinsky Денис Димитров, теннисистка Мирра Андреева, актер Рузиль Минекаев и другие перспективные молодые люди.

За шесть лет почва для развития бизнеса и карьеры изменилась под влиянием пандемии, «спецоперации» и санкций. Стартаперам стало сложнее привлекать инвестиции, многие спортсмены оказались отрезаны от международных стартов, а звезды новых медиа потеряли основные каналы продвижения. Рейтинг «30 до 30», как маркер, отражает эти изменения.

Но одновременно показывает, что молодые отлично умеют адаптироваться. Одни осваивают опустевшие сегменты рынка, другим, несмотря на «венчурную зиму», удается привлечь внимание инвесторов за рубежом.

Победители «З0 до 30» 2024— на сайте рейтинга
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥164👍2🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🥳 Сегодня выпустили обновление нашей модели генерации полноценных видео по тексту Kandinsky Video 1.1 🥳

Kandinsky Video 1.1 представляет собой ансамбль моделей, состоящий из трёх ключевых блоков, последовательно реализующих процесс генерации видео. Первый блок фактически является моделью синтеза изображений по текстовым описаниям Kandinsky 3.0 и отвечает за создание первого кадра видео. Второй — отвечает за генерацию ключевых кадров на основе первого кадра и введенного пользователем текста. Из этих кадров и складывается структура сюжета видео. Третий блок реализует генерацию интерполяционных кадров и позволяет достичь плавности движений в финальном видео. В основе второго и третьего блоков также лежит архитектура Kandinsky 3.0. Такой подход значительно повышает общее качество видео, особенно его визуальную составляющую (и на EvalCrafter модель выбивает неплохие скоры 🔥).

В силу особенности архитектуры новая версия модели позволяет генерировать видео не только по тексту, но и по начальному изображению, то есть «оживлять» статичную картинку. Теперь также можно контролировать динамику генерируемого видео с помощью специального параметра motion score.

Поработали в том числе над датасетом для обучения - сейчас это почти 5 млн пар «текст-видео» после фильтров из разных источников (подробнее расписано в статье на Хабр).

И, самое главное, теперь каждый может сгенерировать видео на свой вкус на fusionbrain.ai или в Telegram-боте Kandinsky. Генерация видео длиной 5,5 секунд в разрешении 512x512 и FPS=32 занимает около 1,5 минут.

Полезные ссылки:
👉 Хабр
👉 Project Page
👉 GitHub
👉 Hugging Face
👉 Telegram-бот
👉 fusionbrain.ai

@dendi_math_ai
🔥15👍53👏2😁1
И немного схем про устройство архитектуры и про метрики на EvalCrafter, о которых пишу выше
👍95👏3
2025/10/13 12:52:17
Back to Top
HTML Embed Code: