Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
214 - Telegram Web
Telegram Web
Стартуем на лучшей LLM

Простая мысль при создании llm-based продуктов которую не все понимают.

Сначала стартуете с самой крутой моделью доступной вам, измеряете и добиваетесь качества, и уже потом оптимизируете стоимость / скорость.

Преждевременная оптимизация и раньше была грехом, но сейчас дело в другом.

Новые прорывы лежат в применении интеллекта LLM. Чем лучше эта LLM тем больше вероятность что у вас действительно получится результат.

Начинать с более слабой модели это как пытаться запустить ракету используя 95й бензин.

Так что не стесняемся использовать o1/o3-mini даже если вы список покупок делаете.
26🤔9💅9
Сделайте уже кто-нибудь гарнитуру с LLM, я вас умоляю!

Чтобы в ухе всегда была мощь лучших моделей и тулов, но чтобы не мешала говорить с людьми. Примерно как старые гарнитуры типа Plantronics были - просто на ухе висит, не мешает, звук пропускает. В них можно было сутки проходить и не заметить.

Nothing сделали подход к снаряду. Но сложновато настраивать и работает нестабильно. Как я вижу, упирается это в возможности платформ (iOS, Android) - при этом сами платформы как обычно тормозят и ничего не выпускают.

А как было бы круто всегда в ухе иметь личного LLM-ассистента полностью в твоём контексте и который может делать твои задачи!

Не нужна мне эта ваша дополненная реальность, хочу как в фильме Her 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥38🤡109
А Le Chat хорош 🥐
💅82🤡19🔥13🤔7🥱2
Кто такие эти ваши AI-агенты

Начинается бездумный хайп вокруг AI-агентов. Я уже видел как некоторые компании ставят цели своим юнитам в духе "срочно проинтегрировать 10 AI-агентов" 🥴

Давайте немного разберемся что же такое агенты.

Существует два определения агентов - профессиональное и наивное. Оба сейчас широко используются. Оба в каком-то смысле верные.

Профессиональное определение
берет свои корни в душных книгах по CS.

Я его суммаризовал примерно так:

AI-агент — это автономная система, способная решать сложные задачи требующих планирования и выполнения действий, с конкретной целью, но без заранее заданных инструкций.

То есть, это конкретный класс технических систем. Примерно такой смысл поддерживают Google, AWS, Github, OpenAI и так далее.

Наивное определение
берет начало в обсуждениях в твиттере. Звучит примерно так:

AI-агент — это интеллектуальная система которая автономно выполняет конкретную задачу.

Например, саммари моей почты по утрам по такому определению тоже вполне себе агент. Там нет ни планирования ни инструментов, но это не очень важно - единица работы реально выполняется, интеллектуальная головная боль передана автономной системе.

Первые - очень сложно строить и работающих at scale агентов почти нет. Вторые - отлично существуют уже какое-то время.

Я надеюсь эти термины просто разойдутся по углам, потому что профессиональное - про инженерию, а наивное - про применимость решений. Но пока что всё в кучу.
632🔥8💅2🤡1
Вот сидишь такой думаешь «ну что эта машина может», кидаешь картинку, а там как будто автогонщик на телефоне 😳

Мощь картиночной модальности у 4o как-то незаметно для меня проскочила.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥164🤡3
Яндекс выпустил YandexGPT 5 Pro

Ребята написали подробную статью на Habr про реализацию. И даже выложили 8b претрейн в опенсорс.

Внимательный читатель может прочитать что ребята решили все-таки бросить затею обучать модель с нуля и инициализируют свой пайплайн весами от Qwen-2.5. Ну и правильно, бессмысленная трата денег. upd: только для большой модели

Замечу тут что это не файнтюн, ребята делают полный цикл обучения модели, но стартуют претрен этап не с нулевых весов. Собственно, похожий подход применяли мы в своих моделях T-Lite / T-Pro.

По выложенным бенчмаркам какие-то прям выводы делать сложно - вроде модели хорошие. Тут главное чтобы в продуктах классно работало (Алиса поумнеет наконец?) и b2b-пользователи довольны были.

Поздравляем!
58🔥28🤡1
Forwarded from Карты, деньги и продукт (Аня Подображных)
Привет, я Витя Тарнавский, директор по ИИ в Т-Банке.

Давайте-ка расскажу зачем вообще нужен директор по ИИ. Я себе сам частенько задаю такой же вопрос 😅

Я разделяю свою работу на такие столбы: технологии, внедрение, платформа, пользовательский опыт.

Технологии - это как сделать так чтобы лучшие технологии в индустрии были у нас. Для этого нужны топовые инженеры, конкретные RnD проекты, команда мотивированная на новизну, наука и так далее.

Внедрение - это как получить пользу от AI везде в компании. Для этого нужно обучать людей, строить команды под бизнесы, тащить руками самые большие ключевые проекты и искать новые большие темы.

Платформа - это как сделать из AI-решений переиспользуемую платформу, а не набор кастомных штук. Понятно, что синтез речи проще сделать один раз - но само это так не произойдет.

Пользовательский опыт - это как менять пользовательский опыт продуктов экосистемы за счет решений на базе AI. Наша сфера новая, и обычно задача как улучшить за счет AI пользовательский опыт - тоже на нас.

Вот, хожу эти четыре задачи по кругу делаю. Если упрощать :)
266🔥23🤡5💅3
Про подписку на ChatGPT

Сейчас уже каждого уважающего себя человека из digital есть подписка на OpenAI. Некоторые платят и по $200 в месяц.

Подписка «на AI» претендует стать «дефолтной» подпиской современного человека - как на музыку, видео и так далее.

Теоретически, это рынок на миллиард (!) платящих подписчиков - примерно столько в сумме у всех музыкальных сервисов.

OpenAI имеет 2 миллиона платящих подписчиков сейчас (src). Это уже 1% от Spotify.

Но это если у обычных людей реально найдутся каждодневные задачи для такого компаньона. Это не факт - возможно, людям внешний интеллект не так уж и нужен.

Еще одна альтернатива - рекламная модель «как в поиске». Я надеюсь что так не будет, иначе это будет компаньон подталкивающий тебя в услуги более платящего рекламодателя.

Интересно что раньше такого рынка в принципе не было, а теперь есть. Через такие новые рынки растет мировая экономика.
🤡3423🥱2
Проблема поискового оркестратора в Perplexity

Когда человек приходит в поиск с вопросом про погоду, он ожидает быстрый ответ. Не нужно разворачивать всю мощь лучших в мире LLM, парсить на лету 200 источников, делать три слоя реранкинга и ещё черт знает что. Это займет кучу времени.

Искусство понять сложность запроса, правильно выбрать из систем разной сложности и профиля, и собрать правильный каскад из систем - это задача оркестрации запроса. Она же - задача роутинга, она же - задача метапоиска. Одна из самых интересных задач в IT-инженерии.

CEO Perplexity Aravind Srinivas рассказывает в подкасте что самая сложная задача которую они сейчас решают это именно проблема оркестрации и создания правильного набора систем за оркестратором. С его слов, кто решит эту проблему в новом LLM-мире, сможет построить следующий Google.

Я помню свой разговор с одним из основателей ABBYY. Он рассказывал что их ключевой ноу-хау это не сами OCR-модели, а как раз правильный каскад из моделей. Лёгкая модель определяющая задачу, дальше в зависимости от результата выбор из путей, и так до 50 разных моделей в каскаде.

В текущих AI-системах вроде ChatGPT эта проблема тоже плохо решена. Пользователю самому приходится решать "достаточно ли моя задача сложная для o3 или можно в 4o сходить". Это, конечно, неудобно.

Кстати, рекомендую и конкретный подкаст, и всю серию подкастов How to Build Future от Y Combinator
41🔥23🤡7
Яндекс потихоньку отжал уже 67% поисковой доля в России.

Рынок классического поиска довольно удивительный. Качество продукта почти не помогает перетягивать аудиторию. Это война за поиск по-умолчанию на устройстве или в браузере. Людям, к сожалению, не так важно какой у них поиск, если он базово «нормальный».

Гугл потихоньку умирает, так как в привлечение не вкладывается. Напомню, там нет рекламы! Как видим, это не так уж и важно для пользователей.

66% это почти монополия. Это не очень хорошо: стимулов расти продуктам будет ещё меньше. Если посмотреть в прошлое, и Google и Yandex очень много сделали чтобы себя улучшить в своей конкуренции. Раньше у Google была большая команда в Москве, я был у них в офисе.

Часть трафика поиска оттекла в маркетплейсы. Чайники уже в поиске не ищут. Почему-то принято считать что это "смерть поиска", хотя на самом деле это только один из срезов. Когда-нибудь человечество придумает лучшие способы искать информацию для всех категорий, но пока что baseline в виде поиска в-основном побеждает.

Ответ может лежать в новых GPT-like поисках. Я мечтаю что появится аналог Perplexity но для поиска решения твоей задачи, т.е. поиска бизнеса/исполнителя. Сейчас эти задачи решаются ну очень плохо - что поиском, что картами. Тогда есть шансы поколебать классический поиск в важных для него нишах.

Но пока что весь этот GPT/Perplexity/Нейро на рынки поиска не влияет никак - что в мире, что в России.
29🔥9
Рынок активно обсуждает утёкший ценник на AI-сотрудников от OpenAI.

$10k/mo за разработчика
$20k/mo за PhD-level research


Очень дорого, если сравнивать с моделями. Но если сравнивать с людьми, становится лучше: разработчик для компании по миру примерно так и стоит, при этом у него есть обед, work-life balance и весеннее обострение.

Мне очень нравится что OpenAI этим ценником делают заявление: работу AI-работников нужно сравнивать с работой людей. Ребята не размениваются на мнения, ребята показывают как будет выглядеть рынок. Devin за $500/mo уже выглядит дешевкой.

На самом деле, "AI Worker" это другой тип работника и в реальной жизни они скорее будут дополнять людей. На таких воркеров пойдет вся рутинная работа, это такие интеллектуальные 24/7 рабы.

Вопрос, как обычно, получится ли этим агентам давать результат сравнимый с такой стоимостью. Пока что агенты явно не там. Посмотрим что будет через год.

В следующем сезоне ждите: Профессионалы интеллектуального труда устраивают забастовки против AI-агентов
🤔1911🥱4💅1
Думаю, все уже видели, что OpenAI выкатили целую батарею инструментов для построения агентских систем. Там всё очень интересно. Описывать их не буду, читайте сиолошную.

OpenAI старается быть вертикальной компанией - предоставлять не только модели, но по возможности максимальное количество слоёв пирога будущей инженерии. В выборе подходов "Android vs Apple" OpenAI делает как Apple: вертикальная закрытая экосистема.

Всё верно делают - сами модели, скорее всего, потеряют свой удельный вес в деньгах. Скорее всего, большую часть денег будут получать производители конечных бизнес-систем. Возможно, это будут AI-сотрудники, пока что мы не знаем.
19🤡3
(!) Подробный тех репорт про обучение T-lite/T-pro 🚀

Выложили ну очень подробный репорт про обучение наших моделей.

Простой файнтюн не решает наши задачи по адаптации моделей. Нам нужно обучать модель новым скиллам и глубоко адаптировать под доменные зоны и под язык.

Пришлось придумать гибридный подход: используются веса opensource модели, и потом мы повторяем почти все стадии обучения, добавляя правильные данные.

Много про подход и хаки. Очень много про данные: правильный микс данных оказался ключом к успеху. Отдельно рассказали про использования кода в датамиксе, много интересных штук. Например, мы перевели часть комментариев в коде на русский язык.

Фактически, это рецепт, как вам самим можно глубоко адаптировать готовые базовые модели под свои задачи. Используйте!

Горжусь ребятами 🥳 и результатами и подходом к шерингу деталей работы

Напомню, модели в опенсорсе, найти можно тут
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6613💅5
Composio подняли кучу MCP-серверов для разных сервисов и собрали из этого библиотеку интеграций.

Там есть Google Docs, Github, Perplexity, 11labs и много чего ещё. Есть готовые интеграции "по кнопке" в cursor, windsurf и так далее. Классно.

Напомню, MCP это протокол от Anthropic для подключения инструментов и источников данных к LLM. Если у сервиса существует MCP-сервер для интеграции, подключить к вашим агентам или просто LLM-пайплайнам будет очень легко. Компании такие сервера уже создают.

MCP пока не так хорошо приживается в комьюнити - мнения противоречивые. Например, мы у себя внутри на MCP переходить не стали, так как он переусложнен, довольно сырой, и больше подходит для стартапов.

Но какие-то единые протоколы и каталоги тут точно нужны. Надо же всем этим агентам уметь общаться с другими системами и друг с другом.

Кто пробовал MCP ручками? У кого какое мнение?
4🔥4🤡1
Topic Call: Приходите создавать Turbo ML Conf!

В прошлом году у нас получилась одна из лучших конференций по прикладному ML на рынке. Было очень насыщенно и очень солнечно 🌞

Этим летом мы хотим повторить успех. Готовим для вас отличную программу, нам есть что рассказать.

Но без вас - не получится. Это конференция для всей индустрии и мы хотим делать её вместе. Ждём вас с докладами!

https://mlconf.t-bank.ai/
🔥29💅116
Вот это прям мощь, адаптивные интерфейсы можно будет совсем иначе делать.
17
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Очередной интересный эксперимент совмещения языковой модели и интерфейса - хочется для ТГ постов в Сиолошной такое ☕️

Автор
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥548
This media is not supported in your browser
VIEW IN TELEGRAM
Питер Левелс продолжает штамповать в одно лицо странные бизнесы которые приносят много денег. На этот раз сделал вот такую всратую игру и гребёт за неё $87k/mo.

Игру написал классическим вайб кодингом: в Cursor, за три часа, используя голосовое управление и не поднимая жопы с дивана. Продает там самолеты, рекламу на дирижаблях и вообще хайпит как может.

Много и открыто рассказывает про свою работу в твитторе. Он там практически секту вайб кодинга открыл. Продаёт кепки vibe coder, купить можно тут. Я заказал синенькую 🥳

Поиграть можно прямо в браузере тут: https://fly.pieter.com/
Please open Telegram to view this post
VIEW IN TELEGRAM
330🤡6🔥4
Вот как я должен выбрать тут модель под свою задачу? )

Одна тупая, другая долго думает. Кто-то ходит в интернет, кто-то нет. Research preview это можно использовать или нет? ) ну и потрясающие mini и mini-high )

И ни одной подсказки!

Самый большой в мире пользовательский AI-продукт продолжает развиваться как демо площадка для моделей.

Perplexity тут молодцы: сделали Auto по-умолчанию которая сама разберется что тебе нужно.
59🔥16🤔2
Уровни автоматизации в AI

В системах управления автомобилем есть вот такой стандарт уровней автономности. Он измеряется от 0 до 5, где 0 это очень слабый уровень, а 5 - водит без человека где угодно.

В автоматизации цифровых работ есть очень похожие понятийные уровни. Можно выделять три:

1. Copilot, или AI помогает человеку

AI помогает делать работу, при этом рабочий процесс не меняется.

Сложность небольшая. Процесс не меняется, и требования к качеству не такие высокие.

Экономический эффект: 0-40% стоимости работ. В редких кейсах получится сделать больше.

2. Human in the loop, или AI работает, человек контролирует

Здесь рабочий процесс значимо меняется. Работу уже делает AI, человек подключается когда AI сомневается или нужно принять финальный результат. Важно, что ответственность лежит на человеке.

Реализовать довольно сложно, основные барьеры — построить заново рабочий процесс и сделать достаточно высокое качество работы AI.

Экономический эффект: варьируется и может быть выше 90% человеческой стоимости работ. Недооцененный уровень: многие пытаются сразу сделать полную автоматизацию, а это в разы сложнее.

3. Full Automation

Здесь человека в контуре нет. Это важно, ответственность полностью переходит на робота и это принципиальный момент доверия к системе и ответа на вопрос "кто виноват".

Рабочий процесс похож на процесс из пункта 2, но нет проверок. Вместо него создается контур проверки качества - например, каждый десятый результат в фоне проверяет человек.

Экономический эффект здесь максимальный. Сделать очень сложно, основной барьер - качество выполнения работ с помощью AI.


Большая часть автоматизации цифровых работ сейчас находится на нулевом и первом уровне. Основной фактор - сложно добиться качества работы AI-систем при текущем уровне моделей и технологий.

Но через 10 лет я бы ожидал значимых сдвигов вверх по уровням по всем цифровым работам которые делает человек.

Курьеры пока что могут спать спокойно, там сложно и дороговато получается :)
🔥2814
2025/10/13 13:14:45
Back to Top
HTML Embed Code: