- Telegram Web

🥳 Представляю вам новый бэнгер: Вайбкод

🥳

Сегодня играю как диджей в Т-Банке на крыше, решил впервые вставить генеренных треков.

Suno, миллиард разных промптов и перезапусков в ночи, и получилось как я хотел – весело и всрато 🤡

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤43🔥33🤡10💅6🤔4

5.18K views13:13

[29/100] Витя Тарнавский

Смотрите, в Яндекс Картах раскатили секунды на светофорах в Москве!

Год назад писал про это в Китае и офигел, а сегодня еду на работу - и вот

Респект ✊

1🔥170❤23🥱7💅5

4.96K views08:04

[29/100] Витя Тарнавский

В сиолошной был классный пост про «модели тупеют». Тоже поймал себя на этом ощущении сегодня.

Deep Research раньше казался невероятным интеллектом из будущего, а сейчас постоянно ловлю косяки. Очевидно, что сервис не изменился – изменились мои ожидания.

Так происходит со всеми сервисами, но в AI это особенно интересно наблюдать. Я трезво понимаю что эта штука лучше меня делает многие задачи, и все равно считаю ее тупой консервной банкой 🤡

А уж реплит как меня своей тупостью бесит, вы не представляете 😅

GPT-5 Pro, кстати, дает стабильно лучше результат чем Deep Research. Кажется, эту кнопку пора объявлять легаси.

🤔28🔥16💅4❤3🤡1

4.37K views07:38

[29/100] Витя Тарнавский

Forwarded from New Yorko Times (Yury Kashnitsky)

Кремниевые читеры кругом
#genai #coolstorybob

В контексте двух постов выше: встал я в 6:30, рулю себе в Утрехт, поля, солнышко, красота. Демка готова, все потестил. Часть демки – агент NL2SQL, спрашиваешь у него что-нибудь, он идет в BigQuery, сиквелом тащит данные и отвечает. Локально все работало, вечером тестил и в нашей агентской системе, на паре запросов сработало, на полноценные тесты с ковырянием продакшн-логов времени не было (ну вы поняли, к чему я).

Утром перед воркшопом смотрю, чет агент ругается на аутентификацию в BigQuery. Хотя ровно с теми же запросами (типа "покажи 5 самых популярных стран в таблице") накануне вечером все было норм. Убедился, что auth и правда не работает. Как же агент до этого отвечал?

И что же наш кремниевый пиздабол придумал?

Не сумев залогиниться в BigQuery, агент написал очень правдоподобный неработающий SQL (все по синтаксису норм, только селект из датасета, а не таблицы), на щщях заявил, что исполнил SQL, в деталях пояснил за синтаксис и выдал ответ: самые популярные – США, Китай, Германия, Япония и Франция. И ведь 4 из 5 угадал, упырь, только с Францией промахнулся.

Благо, это всего первая демка, а не закрытие проекта и пофиксим, конечно (хотя жду коменты про skill issue), но наподобие артефактам с оптимизируемой функцией в RL, интересно следить за тем, как агенты выкручиваются. В целом мы зачастую так же домашки и зачеты сдавали на физтехе, так что если не пхд, то student-level intelligence уже виднеется.

И удачи нам всем с агентами в проде 😳 (VibeOps, как это окрестил мой неназванный друг Вадим). К дискуссии выше о том, когда оно нас всех заменит

Please open Telegram to view this post

VIEW IN TELEGRAM

❤32💅12🔥4🤡1

4.74K views08:19

[29/100] Витя Тарнавский

New Yorko Times

Кремниевые читеры кругом #genai #coolstorybob В контексте двух постов выше: встал я в 6:30, рулю себе в Утрехт, поля, солнышко, красота. Демка готова, все потестил. Часть демки – агент NL2SQL, спрашиваешь у него что-нибудь, он идет в BigQuery, сиквелом тащит…

Золотой контент 🌟
Тоже недавно вайбкодил просмотрщик тату мастеров по базе данных
К базе он достучаться не смог поэтому просто придумал каких-то тату мастеров и их показывал 🤡

Please open Telegram to view this post

VIEW IN TELEGRAM

🤡56❤14🔥9💅6

5.09K views08:27

[29/100] Витя Тарнавский

Из раза в раз вижу как CEO и прочее руководство компаний проходят одинаковые стадии принятия AI

1. Отрицание
Ваш AI – фигня, у нас тут серьезный бизнес

CEO ещё не понял масштаб AI-волны. Таких всё меньше.

Однажды сосед показывает ему ChatGPT, и они переходят в следующую стадию.

2. Нездоровое воодушевление
AI может всё! Всё замените на агентов!

CEO начинает носиться по компании и пытаться всё срочно заменить на AI. Здесь начинает быть тяжело команде – им сложно объяснить что не все задачи решаются. Особенно когда CEO показывает как в его телефоне ChatGPT эту задачу уже "решил".

Со временем выясняется что решается не всё и не везде. И не всеми.

3. Разочарование – или в AI, или в команде
Мы всё попробовали и как-то сложновато

CEO понимает что текущие подходы не работают. То ли лыжи не едут, то ли команда не та. Начинается этап поиска консультантов, внешних команд и внешних решений.

Нормальные CEO здесь набираются реальной экспертизы и способны перейти на следующий этап.

4. Осознанное использование
Я знаю как AI должен изменить мой бизнес

Сюда добралось меньшинство. А пора бы уже, пора!

2❤82🔥18💅16🤡7🥱5

10.2K viewsedited 11:34

[29/100] Витя Тарнавский

AI-мясорубка

Вижу, как многие не технические люди испытывают FOMO по поводу AI и срочно пытаются делать какие-то проекты. Это пост для вас.

Будьте аккуратны: создание AI-продуктов это технически сложная область. Вы быстро упрётесь в качество решений. А рядом с вами будет толпа таких же ребят.

Во времена бума доткомов была похожая ситуация. Всё переоценено и куча игроков-дилетантов. И затем - мясорубка из проектов и судеб.

Выжили те, кто умел делать сильные технологии.

Есть и другой риск. Не сожрет ли меня ChatGPT 8? Уметь правильно на него отвечать - сложный скилл.

Есть альтернативный путь. Наоборот, отстраивать сервисы и услуги, в которых AI ничего не может.

Тест простой. Представьте, что есть AI, который невероятно умен и может всё. Если такой вашему проекту не страшен, вы на верном пути.

Вы открыли классный элитный ресторан. Вам же всё равно на AI, правда?

Даже наоборот. На растущей экономике от AI люди будут больше тратить на остальные свои потребности.

К вам будут ходить покрытые шрамами победители AI-мясорубки и праздновать свои победы.

1❤72🔥21💅14🤔4

6.01K views09:24

[29/100] Витя Тарнавский

Запускаем AI-агента для разработки от Т-Технологий!

Агент заточен на работу с большими проектами. Сила таких решений в интеграции и правильном создании контекста, а не в моделях.
Context Engineering

Model-agnostic подход: не выпендриваемся и используем лучшие модели, сейчас это Qwen3-Coder

Внутри работает уже вовсю 💅

Форбс тут
Подробности тут

🔥62💅20🤡12❤9🥱1

7.82K viewsedited 06:23

[29/100] Витя Тарнавский

Думаю психануть и перейти на андроид 🤡

Apple явно проиграл в AI гонке. Хочу встроенный Gemini в системе и нормально приложения устанавливать 🙄

Кто переходил в одну или другую сторону, отпишитесь как оно после переключения плз?

🔥70🥱19❤6🤔6💅6

4.63K views07:22

[29/100] Витя Тарнавский

Саммари ваших ответов про переход на андроид. Кажется, пора переходить 🙄

———
За переход — около 15 человек. Против, вернулись обратно — 3.

Плюсы: встроенные AI-фичи, оплата и актуальные приложения в РФ, свобода установки и кастомизация, новые форм-факторы, батарея спокойнее.

Минусы: теряется экосистема Apple, баги и сырость, Gemini слабый, нужен VPN, быстрее устаёт железо.

Рекомендуемые телефоны: Samsung (особенно Fold-серия и флагманы вроде S25 Ultra), Pixel (чистый Android, хорошая камера), Nothing (интересная интеграция с ChatGPT / короткие команды).

Вывод: Android радует функциональностью и свободой, но iPhone всё ещё держит за счёт экосистемы и шлифовки опыта.

❤47🤡26🤔9🔥6

4.57K views16:03

[29/100] Витя Тарнавский

Всю прошлую неделю взахлёб читал невероятный блокбастер о спасении одного LLM-based проекта в канале у Рината Абдуллина / LLM под капотом. Ещё и в стиле Project Hail Mary 🌟

Нужно спасти проект на который у прошлой команды было 5 месяцев. Качество не сходится. Время: 6 дней. Разработчик ушёл в отпуск.

Прежде всего, это урок про метрики качества. Сначала eval, потом разговоры, ребят.

Ещё приметил:
– Разделение на "проверяющих" и "чинящих" через правильный на коленке собранный "фреймворк"
– Автогенерация 687 (!!!) тулов внутри пайплайна. Цитирую:

Размер и качество этого кода не имеют значения, пока у нас есть общий результат работы проекта - точность, скорость и стоимость.

Все идите читать срочно. Начинать отсюда

Ну и Project Hail Mary почитайте если ещё не, потрясающая современная фантастика.

Please open Telegram to view this post

VIEW IN TELEGRAM

10❤32🔥18🤡9🥱1💅1

4.55K viewsedited 06:43

[29/100] Витя Тарнавский

Как_создать_LLM_продукт.pdf

255.3 KB

Как строить LLM продукты

Аня Подображных написала классную и лаконичную инструкцию для продактов о том как строить LLM-продукты. Выгрузил вам её в pdf.

Ключевое отличие от обычных продуктов – работа с метриками качества. Кратко, путь таков:

1. Строим метрику качества – бенчмарк из вопросов и способ проверить правильность ответа
2. Определяем baseline – сколько по этой метрике выбивают альтернативы, включая людей
3. Только теперь строим продукт и считаем сколько выбили по метрике качества
4. Улучшаем пока не побьем baseline
5. Определяем ограничивающие метрики и добиваемся результата по ним

Теперь ваш продукт действительно нормально решает задачу. Можно запускать.

Следование этим принципам отличает любителей поделать красивые демки от реальных ребят из мира LLM-инженерии. Можно спрашивать на собеседованиях, например.

1❤52🤡14🔥5🤔2

10.3K views07:26

[29/100] Витя Тарнавский

Когда появлялось электричество, люди догадывались, что это откроет доступное освещение и холодильники. Но сложно было предположить, что за этим последует ночная городская жизнь и совершенно другой подход к тому как люди едят.

У меня давно зреет подобный доклад про AI. То, что видно сейчас – только отблески больших изменений.

На нашей конференции Продукты 24 и ffdd2d расскажу свой взгляд на изменение digital мира под влиянием AI.

27 сентября, Суперметалл. Приходите!

❤49🔥23🤡7

4.61K views13:16

[29/100] Витя Тарнавский

Научные статьи на NeurlIPS с участием санкционных вузов и компаний РФ начали получать отказы.

Это подавляющее большинство статей из России. Статьи пишутся в коллаборации с МФТИ, Сколтехом и так далее. На картинке - реджект одной из наших статей.

Особенно грустно что к статьям прилагается комментарий «статья супер, вот почему» и потом legal reject.

As recently advised by legal counsel, the NeurIPS Foundation is unable to provide services, including the publication of academic articles, involving the technology sector of the Russian Federation's economy under a sanction order laid out in Executive Order (E.O.) 14024.

p.s. только не стоит обвинять организаторов конференции плз. у них не особо есть выбор.

NeurlIPS – топовая A* конференции по AI.

🤡67❤12🔥2

5.12K views06:37

[29/100] Витя Тарнавский

Вышел подкаст со мной в проекте Noosphere Project

Говорим про AI в экосистемах, роль AI в профессиональной и личной жизни людей, близкое и далёкое будущее. Если хотите мой взгляд на будущее про AI в нашей жизни, заходите послушать!

❤27🔥19🤡13

3.59K views07:37

[29/100] Витя Тарнавский

😳

Our vision is simple: we want to create a factory that can produce a gigawatt of new AI infrastructure every week.

https://blog.samaltman.com/abundant-intelligence

edit: 1GW это примерно десятая часть Москвы и примерно две Балашихи

Please open Telegram to view this post

VIEW IN TELEGRAM

Sam Altman

Abundant Intelligence

Growth in the use of AI services has been astonishing; we expect it to be even more astonishing going forward.

As AI gets smarter, access to AI will be a fundamental driver of the economy, and...

🤔9❤4🔥3🥱3

3.36K viewsedited 14:45

[29/100] Витя Тарнавский

FutureX – насколько AI-агенты способны предсказывать будущее?

Наткнулся на оч интересный live-бенчмарк FutureX, который пытается понять предсказательную способность AI-систем.

Идея такая:
- Берем события которые точно произойдут на следующей неделе с разным вердиктом
- Заставляем всех AI-агентов предсказать вердикт
- Через неделю считаем статистику и повторяем цикл

Это гарантирует что бенчмарк не скомпроментирован. Оч круто.

Задачи разной сложности и волатильности. Например:
- Кто победит в футбольном матче;
- Какие будут финансовые показатели компании при раскрытии;
- Кто победит на выборах куда-нибудь;
- Приземлится ли ракета с запуска Starship.

Всё автоматизировано: и генерация задач, и сбор результатов. Круто. Задач только маловато, около сотни каждую неделю.

По результатам: топовая модель выбивает в среднем 30% скора. Это примерно 30% верных предсказаний, взвешенных на сложность. Вообще-то довольно круто!

Результаты шатает от недели к неделе. Весь август Grok-4 был уверенно на первом месте, а вот в сентябре GPT-5 стабильно на первом месте. Ждем агрегатов.

Отдельно есть S&P500 Leaderboard, где AI-агенты предсказывают значение S&P500 в сравнении с экспертами-аналитиками и с фактом. Пока что получается значимо хуже.

Теперь знаем насколько предсказуем наш мир 🌟
Пока что на 30% 🤔

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥28❤14🤡6🥱1

3.64K views11:25

[29/100] Витя Тарнавский

T-ECD: E-commerce кросс-доменный датасет для рекомендательных систем

😚

А мы выложили в открытый доступ еще один датасет, на этот раз RecSys!

Один из самых больших индустриальных датасетов в открытом доступе. 44 млн уников, 135 млрд взаимодействий.

Датасет собран на основе пользователей нашей экосистемы. Кросс-доменный: разные категории покупок и типов данных. Естественно, все анонимизировано.

Пользуйтесь!

Habr
Huggingface

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤55🔥37💅6🤡1

4.11K views07:44

[29/100] Витя Тарнавский

Goodbye KPI

mariachiindie754

Вот вам пятничный бэнгер Гудбай KPI 🤡
Буду его завтра вечером играть на нашей конференции Продукты 24 x ffdd2d

А ещё получается оч крутой доклад, если не успели на регистрацию приходите послушать в онлайн!

Четыре всадника AI-апокалипсиса
15:00

2❤34🔥26🤡5🥱3

3.67K views16:44

[29/100] Витя Тарнавский

Потыкал ChatGPT Pulse

Оч понравилась настройка через промпт. Я надеюсь что таких интерфейсов будет все больше.

Считаю что настройка рекомендационных сервисов должна быть через голосовое сообщение. Я бы так себе и ютуб, и спотифай накрутил с удовольствием.

В статьях мне не хватает credibility: я хочу чтобы кто-то подписался под контентом кому жалко свой авторитет. Вроде интересные статьи, но кто свои яйца поставил? Сэм Альтман?

В Perplexity в таком же продукте вроде есть какие-то аватарки, но кто эти люди, я не знаю.

Overall: 4/10, proof of concept stage

❤14🤡3

2.42K views08:00

2025/10/04 21:06:12
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>