Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on null in /var/www/tgoop/function.php on line 65
1781 - Telegram Web
Telegram Web
Вышло обновление видео-модели LTX

Я ранее тестил ее прошлую версию в рамках студии LTX, там можно очень быстро собирать стори-борды с раскадровкой и промптами для сцен (рис.1).

Так вот, теперь вышла модель LTX 2, и она может генерить в про-версии аж в 4K, 50fps и иногда с очень приличным звуком.

У меня про-шка не оплачена, поэтому мне хватило кредитов всего на 2 генерации в 1440 и 50fps.

Я сгенерил картинку с великаном там же, в студии, и зарядил два image-to-video с коротким промптом.

Обе попытки в промпт не попали, но первая, конечно, ближе. А вторая, пожалуй, хорошо отражает стиль галлюцинаций этой модели 👍 (да, она это делает частенько, судя по отзывам криэйторов).

Ну и еще у меня удивило, что в студии нет ориентации видео. Может я просто не увидел где-то скрытую настройку, но проверял дважды.

#videoGenerative@TochkiNadAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3
Говорят, что в инсте появился AI-рестайл сторис

То есть вы можете убирать и добавлять объекты на фото, накидывать стили, в общем это image-to-image с промптом.

У меня пока не появилось. А у вас?
👍9🔥53🤔2
Совместные проекты и ветки диалогов в ChatGPT

В ChatGPT появился режим Shared Project: создаете проект, зовете друзей и вся команда видит общие чаты, файлы и инструкции, может править документы и код, генерить тексты и картинки, подключать голос и поиск.

Любой участник может взять чужое сообщение и увести разговор в отдельную ветку, не ломая основную линию. Каждая ветка сохраняет контекст до точки разветвления, их можно сравнивать между собой и спокойно экспериментировать с альтернативными подходами.

Есть лимиты по участникам и файлам. GPT все больше превращается в рабочую площадку для команды.
🔥23👍95
Важнейшее обновление, ящетаю!

Скоро в Sora можно будет добавлять камео питомцев, игрушек и любых объектов, превращая их в персонажей роликов.

Ну и еще появятся и базовые инструменты редактирования, например склейка клипов прямо в приложении.

Кроме того, подтвержден релиз версии для Android.
20👍136🔥4💘1🦄1
Компании всё чаще переносят нейросети в облако

Раньше компании часто разворачивали генеративки на своем железе, однако сейчас их все чаще используют в облаках. Причина простая — это стало быстрее и удобнее, а экономика таких решений понятнее и более прогнозируема. На облачных платформах можно адаптировать нейросети под свои бизнес-задачи и создать на их основе ИИ-помощников: например, голосовых агентов для поддержки или чат-бота для поиска по документам.

На этом фоне Yandex AI Studio отмечает пятикратный рост спроса на генеративные модели в облаке. Это десятки миллиардов токенов ежемесячно. В ход идут как собственные YandexGPT, которые используют для RAG-сценариев и работы с текстами, так и открытые модели, например Qwen от AliBaba. На ней чаще строят агентов и пишут код.
👍10👎6🤝6👾3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Washington Post недавно провели эксперимент, загрузили сгенерированные в Соре дипфейк ролики на топ-восемь платформ с метками Content Credentials (это цифровая маркировка, которая должна помогать понять, что контент создан ИИ).

В итоге только одна платформа (YouTube) хоть как-то отметила в формате C2PA, что видео не настоящее. И то только в скрытом описании.

Все остальные платформы удалили из видео метаданные, которые должны были сообщать, что видео создано ИИ, тем самым полностью скрыв его происхождение.

Законодательство и политика платформ пока не готовы к новому времени, интересно как скоро и какими способами начнут с этим бороться. Пока что, к сожалению, количество инфоповодов с дипфейками только растет.
😨12👍882👎2🌚2
This media is not supported in your browser
VIEW IN TELEGRAM
Новый конструктор агентов с авто-подбором моделей

GenSpark обновили свой конструктор агентов Mixture-of-Agents, платформа сама выбирает и комбинирует нужные модели под конкретный запрос.

Есть магазин готовых агентов с рейтингами и отзывами.

Бесплатный тариф дает дневные кредиты, платный без жкстких лимитов, есть доступ к API.

Забираем тут.

#Agents@TochkiNadAI #coding@TochkiNadAI
👍13🔥42🤩1🫡1
This media is not supported in your browser
VIEW IN TELEGRAM
Еще один способ делать веб-страницы из PDF или статей

Qwen прокачали свой Deep Research, теперь просто загружаете PDF или статью и модель собирает из нее интерактивную веб-страницу с графиками, визуализациями, анимациями и блоками для комментариев.

Я попробовал на саммари недавней лекции Андрея Карпаты. Сперва собрал саммари в Atlas, потом закинул пдф-ку в Qwen. Ничего не правил, записал скринкаст как модель собрала веб-страницу с первой попытки.

Каждую секцию можно править и дополнять, а из нескольких файлов можно собрать общий дашборд или шпаргалку с перекрестными ссылками, автооглавлением и поиском. Все работает в браузере бесплатно с разумными недельными лимитами.

Еще из того же файла Qwen автоматически может сделать подкаст. Выделяет ключевые идеи, пишет сценарий, озвучивает выбранным голосом на русском, английском и других языках.

Итоговый файл можно скачать или встроить в страницу, при желании подправив текст в редакторе. Подходит для учебных, исследовательских и рабочих задач, включая разбор видео/аудио и мультимодальные пайплайны.

Доступно бесплатно в Qwen Chat

#coding@TochkiNadAI #research@TochkiNadAI
🔥1244👍2
Кстати, Андрей Карпаты недавно выкатил NanoChat — минималистичный опенсорс, в котором весь цирк LLM умещается в один репозиторий и около восьми тысяч строк. На выходе у вас будет собственный LLM-бот и отчет со всеми метриками.

Цена такого развлечения около ста долларов на сервере с восемью H100 и примерно четыре часа пробега. Если восьми H100 под рукой как-то не оказалось, можно крутить на одной видеокарте дома, просто уменьшаешь батч и запастись терпением.

Проект опенсорс и бесплатный, подходит тем, кто хочет быстро разобраться в архитектуре языковых моделей. А если захочется по-взрослому, автор уже намекает на более длинные пробеги за триста и тысячу долларов.

В общем, отличный учебный каркас для своих маленьких ботов.

Git проекта

#llm@TochkiNadAI
12🔥53
This media is not supported in your browser
VIEW IN TELEGRAM
Как малому и среднему бизнесу выжать максимум из онлайн-офиса

30 октября пройдет большая конференция Яндекс 360 — Yandex Connect. IT-директора и руководители по безопасности разберут реальные кейсы цифровизации бизнеса, никакой воды и теории, только работающие инструменты под конкретную задачу.

На конференции разберут конкретные отраслевые сценарии: как маркетинговому агентству настроить работу с командой, как производству ЗОЖ-товаров управлять проектами через онлайн-офис, как автоматизировать рутину в ресторане или кафе, и как выстроить рабочие процессы в образовательном проекте.

Плюс покажут свежие фичи Яндекс 360 и анонсируют новые продукты, о которых еще нигде не рассказывали, успешные решения можно забрать себе в компанию.

Все онлайн и бесплатно, но нужно зарегистрироваться. Если думаете, как автоматизировать процессы или наладить удалёнку без боли — заходите, будет полезно.
👍7🤣3🤝3👌2👎1🌭1
Для тех, кто как и я, устал подкручивать промпты в GPT под "неджипитишный" райтинг.

Потестил Spiral. Это сервис на базе LLM, заточенный под живое письмо – статьи, письма, посты.

Не знаю что у них за системные промпты, но очень захотелось такие себе, потому что пишет он отлично.

Можно обучать чат на своем стиле, импортировать посты из соцсетей, добавлять куски текста в виде документов. Также есть рабочие пространства.

Результат выдает в трех вариациях. Еще раз подчеркну, пишет прям хорошо. Лучше, чем все что я видел до этого. Есть фри токены, можно потестировать.

#llm@TochkiNadAI #copywriting@TochkiNadAI
1410👍4🔥2
Media is too big
VIEW IN TELEGRAM
Вот это круто.

Команда Qwen за полгода создала умные очки с AI-помощником для незрячих и слабовидящих

И их стоимость равна примерно 20$.

Очки используют камеру + AI-модель (на базе Qwen, конечно же) для распознавания объектов, чтения текста и голосового сопровождения в реальном времени.

Очки видят окружение с помощью мини-камеры и микрочипа (скорее всего, с процессором типа RISC-V или ARM SoC).

Распознают предметы, людей, знаки, текст, дорожные препятствия.

Синтезируют голосовое описание через встроенные наушники.

(сори за такой тяжелый видос).
31🔥108👍5❤‍🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Тестирую перевод с русского на английский язык в нейросети Алисе.

Если нужно быстро перевести текст, коммерческое предложение или же адаптировать пост на другой язык, как я это делаю сейчас, — можно скопировать и вставить текст в чат и моментально получить версию на английском языке.

Смотрите пример на скринкасте в этом посте.
👎13🤝10👍6🙈6🐳5🍌21
Потестил новый экспериментальный гугловский сервис для вайб-маркетинга

Называется Pomelli.

Пока что он простенький и пошаговый. Его задача – собирать для вас отдельные юниты маркетинговой кампании на основе знаний о вашем продукте.

Что в нем такого классного?

Вы просто вставляете в него ссылку на свой сайт и он ведет вас вперед, поэтапно согласовывая дизайн, тексты, идеи для контента, оформление, колл-ту-экшены.

Я потестил на сайте нашей студии. Неплохо!

Надеюсь, что гугл лабс не забьют на эту игрушку (хотя, конечно, результат он дает уже сейчас), и превратят ее в полноценную платформу.

#marketing@TochkiNadAI
11🔥63
This media is not supported in your browser
VIEW IN TELEGRAM
Иногда мне кажется, что если бы у ChatGPT был отдельный секретный чатик в Телеграм, где бы он вместе с другими LLM обсуждал своих клиентов (нас с вами) – то меня бы нередко сравнивали бы там с клиентом с этой гифки.

Иногда так лень подробно объяснять что я именно хочу в итерациях, если LLM не попадает в качественный ответ с первого раза.

Это похоже на лотерею, где начинаешь подкидывать, в надежде, что с короткого уточнения он все сам поймет и сделает идеально:

"давай немножко шире, но сдержаннее"
"попробуй снова, без накала в последних абзацах"
"сделай менее продающе"
"еще чуть менее"

Господи, пусть языковые модели не обретут разум и сознание, а то будет стыдно.
😁20💯7👍51
This media is not supported in your browser
VIEW IN TELEGRAM
А вчера еще обновился Cursor до версии 2.0

Коротко главное:

> новая модель Composer. быстрая. (в 4 раза быстрее GPT4), обучена на коде и заточена под контекст больших проектов.

> агенты теперь работают параллельно и могут выполнять разные задачи без конфликтов.

> улучшены ревью кода и работа с тестами, удобнее смотреть, что конкретно меняется.

Картинки и чуть больше подробностей в анонсе.

#coding@TochkiNadAI #Agents@TochkiNadAI
7👍4🔥2
2025/11/01 03:05:23
Back to Top
HTML Embed Code: