Во время отпуска наконец-то дошли руки прочитать SITUATIONAL AWARENESS - 165-страничный документ про AI, AGI и как всё катится в сторону манхэттенского проекта.
Написал его Leopold Aschenbrenner - 22-летний инженер уволенный из OpenAI. Он был частью Superalignment Team - команды, занимающейся Safety, которую разогнали в прошлом году (вместе с Суцкевером). Уволился он тогда со скандалом - парень громко говорил что всё небезопасно и вы делаете угрозу человечеству и вообще одумайтесь.
Документ хорошо и аргументированно написан, с примерами, доказательствами и ссылками. Отчасти поэтому разлетелся и вызвал мощный резонанс.
Основная идея: Trust the trendline
Если пытаться сжать весь документ до основных идей, то:
- Мы прирастаем примерно x10 каждый год по мощности AI-систем и это четкий тренд — вы сейчас здесь;
- Это обгонит людей очень быстро, его прогноз: AGI к 2027 (как он это определяет оставлю вам на самостоятельное исследование);
- Как только будет построен устойчивый агент-AI-ресерчер начнется положительная обратная связь автоулучшаемой системы и кривая ещё загнется вверх;
- Пойдут необратимые экономические изменения;
- Подключаются государства, манхеттанский проект из текущих лабораторий и так далее.
Про моих любимых агентов он там тоже много пишет. Один из следующих шагов - AI-сотрудники на remote которые лучше чем люди.
Чтиво классное, я очень советую хотя бы первые две главы. И документ во многом исторический, очень резонансный. Классно что его написал молодой 22-летний парень.
Написал его Leopold Aschenbrenner - 22-летний инженер уволенный из OpenAI. Он был частью Superalignment Team - команды, занимающейся Safety, которую разогнали в прошлом году (вместе с Суцкевером). Уволился он тогда со скандалом - парень громко говорил что всё небезопасно и вы делаете угрозу человечеству и вообще одумайтесь.
Документ хорошо и аргументированно написан, с примерами, доказательствами и ссылками. Отчасти поэтому разлетелся и вызвал мощный резонанс.
Основная идея: Trust the trendline
Если пытаться сжать весь документ до основных идей, то:
- Мы прирастаем примерно x10 каждый год по мощности AI-систем и это четкий тренд — вы сейчас здесь;
- Это обгонит людей очень быстро, его прогноз: AGI к 2027 (как он это определяет оставлю вам на самостоятельное исследование);
- Как только будет построен устойчивый агент-AI-ресерчер начнется положительная обратная связь автоулучшаемой системы и кривая ещё загнется вверх;
- Пойдут необратимые экономические изменения;
- Подключаются государства, манхеттанский проект из текущих лабораторий и так далее.
Про моих любимых агентов он там тоже много пишет. Один из следующих шагов - AI-сотрудники на remote которые лучше чем люди.
Чтиво классное, я очень советую хотя бы первые две главы. И документ во многом исторический, очень резонансный. Классно что его написал молодой 22-летний парень.
SITUATIONAL AWARENESS - The Decade Ahead
Introduction - SITUATIONAL AWARENESS: The Decade Ahead
Leopold Aschenbrenner, June 2024 You can see the future first in San Francisco. Over the past year, the talk of the town has shifted from $10 billion compute clusters to $100 billion clusters to trillion-dollar clusters. Every six months another zero is added…
🔥54🤡12🤔6❤1
Обзорная статья от McKinsey про AI в банковском секторе. С картинкой «нового» IT-стека.
Можно почитать, булшит умеренный, полезное есть. Из того что выцепил:
- Нужно перестраивать себя и принимать риски. Большинство игроков делают слабые безрисковые проекты - строят пару чат-ботов и суммаризацию. Настоящие львы перестраивают с нуля целые домены - например, привлечение.
Так и есть, так и есть
- Фокус. Предлагают выделить пару доменов которые реально повлияют и фокусироваться на них. Так и есть, обычно это поддержка и привлечение. Ну и developers productivity, как везде.
- AI-архитектура. Предлагают переделать всю архитектуру добавив большие слои и блоки примерно как на картинке. Тут они несколько перегибают и видимо продают себя, но и правда приходится много достраивать и менять.
- AI-агенты. Предлагают всем бежать строить агентные и мультиагентные системы для автоматизации. Это они имхо рановато, агентам до банковского продакшена еще нужно дорасти. Опять же, себя продают.
https://www.mckinsey.com/industries/financial-services/our-insights/extracting-value-from-ai-in-banking-rewiring-the-enterprise
Можно почитать, булшит умеренный, полезное есть. Из того что выцепил:
- Нужно перестраивать себя и принимать риски. Большинство игроков делают слабые безрисковые проекты - строят пару чат-ботов и суммаризацию. Настоящие львы перестраивают с нуля целые домены - например, привлечение.
Так и есть, так и есть
- Фокус. Предлагают выделить пару доменов которые реально повлияют и фокусироваться на них. Так и есть, обычно это поддержка и привлечение. Ну и developers productivity, как везде.
- AI-архитектура. Предлагают переделать всю архитектуру добавив большие слои и блоки примерно как на картинке. Тут они несколько перегибают и видимо продают себя, но и правда приходится много достраивать и менять.
- AI-агенты. Предлагают всем бежать строить агентные и мультиагентные системы для автоматизации. Это они имхо рановато, агентам до банковского продакшена еще нужно дорасти. Опять же, себя продают.
https://www.mckinsey.com/industries/financial-services/our-insights/extracting-value-from-ai-in-banking-rewiring-the-enterprise
🔥23❤12🤡2🤔1
Denis Sexy IT 🤖
Добавлю:
Манхэттенский проект был ~1.5% от ВВП США 1940х, проект Stargate это ~1.7% от ВВП США прошлого года
Манхэттенский проект был ~1.5% от ВВП США 1940х, проект Stargate это ~1.7% от ВВП США прошлого года
Это к манхэттенскому проекту и situational awareness
❤12🤡2
Потрясающая статья про агентов от Chip Huyen - классной вьетнамской авторши книг про ML. Ex-NVIDIA, Netftix etc, но прежде всего она круто пишет профессиональные книги.
Это прям небольшой учебник о том как создавать агентские системы. Очень хорошо написано, сильно лучше чем статья от Antrophic. Много ссылок на статьи и источники.
Вот классная цитата:
Пользуйтесь.
https://huyenchip.com/2025/01/07/agents.html
Это прям небольшой учебник о том как создавать агентские системы. Очень хорошо написано, сильно лучше чем статья от Antrophic. Много ссылок на статьи и источники.
Вот классная цитата:
Planning, at its core, is a search problem. You search among different paths towards the goal, predict the outcome (reward) of each path, and pick the path with the most promising outcome. Often, you might determine that no path exists that can take you to the goal.
Пользуйтесь.
https://huyenchip.com/2025/01/07/agents.html
Chip Huyen
Agents
Intelligent agents are considered by many to be the ultimate goal of AI. The classic book by Stuart Russell and Peter Norvig, Artificial Intelligence: A Modern Approach (Prentice Hall, 1995), defines the field of AI research as “the study and design of rational…
🔥47❤13💅3
Все посмотрели демку оператора от OpenAI? Круто же? Ну сырое, да - но это вопрос времени.
Прокомментирую отдельно про его удаленность, это важно.
Работает он внутри браузера на серверах OpenAI. То есть вам нужно логиниться удаленно в ваши сервисы, что стремновато. С приложениями совсем не будет работать, если они конечно ферму не решат делать. Также, ваша внутренняя сеть недоступна - например, с корпоративными ресурсами.
Как я вижу, дальше появляются:
- Локальные решения в виде приложения на десктоп чтобы не логиниться
- Operator для iOS/Android с "скрытым" экраном чтобы не логиниться в приложения
- Разные комбинации on-premise решений. Надо соединить это с чем-то вроде rdp и внутрикорпоративной фермой с локальными же моделями
Важно всё это потому что открывает путь к автоматизации действий которые не имеют API-интерфейса. В диком вебе можно сделать почти всё внешнее. В корпоративном вебе можно сделать почти все внутренние задачи.
Прокомментирую отдельно про его удаленность, это важно.
Работает он внутри браузера на серверах OpenAI. То есть вам нужно логиниться удаленно в ваши сервисы, что стремновато. С приложениями совсем не будет работать, если они конечно ферму не решат делать. Также, ваша внутренняя сеть недоступна - например, с корпоративными ресурсами.
Как я вижу, дальше появляются:
- Локальные решения в виде приложения на десктоп чтобы не логиниться
- Operator для iOS/Android с "скрытым" экраном чтобы не логиниться в приложения
- Разные комбинации on-premise решений. Надо соединить это с чем-то вроде rdp и внутрикорпоративной фермой с локальными же моделями
Важно всё это потому что открывает путь к автоматизации действий которые не имеют API-интерфейса. В диком вебе можно сделать почти всё внешнее. В корпоративном вебе можно сделать почти все внутренние задачи.
YouTube
Introduction to Operator & Agents
Begins at 10am PT
Join Sam Altman, Yash Kumar, Casey Chu, and Reiichiro Nakano as they introduce and demo Operator.
Join Sam Altman, Yash Kumar, Casey Chu, and Reiichiro Nakano as they introduce and demo Operator.
🔥24❤2💅2
Что интересно про DeepSeek так это объем железа для обучения.
По официальному репорту, DeepSeek тренировался на кластере из 2k H800. Это смешной размер для таких задач. Это примерно в 50 раз меньше чем кластер для обучения любой большой модели в US.
Слухи ходят что они не раскрывают данные о реальном кластере. Китаю нельзя официально иметь кластера на H100 и других топовых картах любого крупного размера.
Я в Китае был сам и инженеры там лично говорят что кластера на 50-100к у них конечно есть. Раскрывать они их не могут.
С другой стороны, DeepSeek выпустили вместе с моделью подробный тех репорт с указанием размеров кластеров и так далее. И там все бьётся нормально - объёмы данных и времени вполне совпадают с объёмом железа, это подтвердили более-менее все лидеры индустрии.
Если это и правда возможно на кластере в 2k, значит и другие страны могут так же и стены в 100k кластера не существует.
По официальному репорту, DeepSeek тренировался на кластере из 2k H800. Это смешной размер для таких задач. Это примерно в 50 раз меньше чем кластер для обучения любой большой модели в US.
Слухи ходят что они не раскрывают данные о реальном кластере. Китаю нельзя официально иметь кластера на H100 и других топовых картах любого крупного размера.
Я в Китае был сам и инженеры там лично говорят что кластера на 50-100к у них конечно есть. Раскрывать они их не могут.
С другой стороны, DeepSeek выпустили вместе с моделью подробный тех репорт с указанием размеров кластеров и так далее. И там все бьётся нормально - объёмы данных и времени вполне совпадают с объёмом железа, это подтвердили более-менее все лидеры индустрии.
Если это и правда возможно на кластере в 2k, значит и другие страны могут так же и стены в 100k кластера не существует.
🤔28🔥17❤7💅4
Маленькая зарисовка про жизнь с Cursor
Надо было тут картинки перевести из webp в jpg. Я знаю как на маке конвертнуть одну (хотя зачем мне это знание), но мне нужно было восемь.
Я открыл Cursor и сделал скрипт на питоне буквально за 15 секунд. Просто сказал «сделай вот такую программу» и потом «сделай ее запускабельной», и всё.
Запустил, конвертнул, пошел довольный дальше.
Киберпанк какой-то🤖
Надо было тут картинки перевести из webp в jpg. Я знаю как на маке конвертнуть одну (хотя зачем мне это знание), но мне нужно было восемь.
Я открыл Cursor и сделал скрипт на питоне буквально за 15 секунд. Просто сказал «сделай вот такую программу» и потом «сделай ее запускабельной», и всё.
Запустил, конвертнул, пошел довольный дальше.
Киберпанк какой-то
Please open Telegram to view this post
VIEW IN TELEGRAM
❤39💅24🔥8🥱5
На фоне истории вокруг DeepSeek меня активно спрашивают «а почему не мы?» - имея в виду то рынок РФ, то конкретно Т-Банк
Действительно, сравнимый объём железа у нас есть, мозги - тоже. Казалось бы, все есть!
Ну, не совсем.
Возможность построить модели такого уровня это сочетание большой мотивации и ресурсов у достаточно большого количества компаний. Это лотерея - DeepSeek выиграл, ещё 100 лаб проиграли.
В США компании это делают ради денег. Если ты сделал топовую модель, твоя компания вошла в первые ряды и оценивается очень дорого. С инженерами, кстати, похожим образом работает. У нас такого нет, рынок не оценит.
Китай пронизан национальной идеей великости Китая и «порвем США». Там инженеры реально хотят обогнать OpenAI ради страны. У нас такого среди инженеров сильно меньше. Кроме того, есть как минимум десятки компаний у которых есть достаточные ресурсы. В РФ их строго меньше пяти штук.
В результате получаем то что получаем. Еще и модель в мире не примут, и железо (даже такое как у китайцев) не объяснишь.
Действительно, сравнимый объём железа у нас есть, мозги - тоже. Казалось бы, все есть!
Ну, не совсем.
Возможность построить модели такого уровня это сочетание большой мотивации и ресурсов у достаточно большого количества компаний. Это лотерея - DeepSeek выиграл, ещё 100 лаб проиграли.
В США компании это делают ради денег. Если ты сделал топовую модель, твоя компания вошла в первые ряды и оценивается очень дорого. С инженерами, кстати, похожим образом работает. У нас такого нет, рынок не оценит.
Китай пронизан национальной идеей великости Китая и «порвем США». Там инженеры реально хотят обогнать OpenAI ради страны. У нас такого среди инженеров сильно меньше. Кроме того, есть как минимум десятки компаний у которых есть достаточные ресурсы. В РФ их строго меньше пяти штук.
В результате получаем то что получаем. Еще и модель в мире не примут, и железо (даже такое как у китайцев) не объяснишь.
❤43🤡41🤔7🔥6🥱4
[29/100] Витя Тарнавский
Дикий замес вокруг Китая, Тайваня и чипов для AI На фоне новостей о китайских учениях вокруг Тайваня давайте расскажу в чем суть дела. TSMC (Тайвань) - безусловный лидер в производстве самых передовых чипов для AI. На их можностях работают Nvidia и AMD.…
Начались первые обещания закручивания гаек по GPU. Пока что в виде дополнительных тарифов на импортные GPU, призванных построить фабрики для производства чипов в США а не в Тайване.
Дальше будет веселее. США будет пытаться отобрать у Китая все потенциальные новые GPU. Для NVidia это порядка 20% бизнеса, между прочим.
И напомню про вот этот мой пост объясняющий ситуацию вокруг GPU и Тайваня.
Дальше будет веселее. США будет пытаться отобрать у Китая все потенциальные новые GPU. Для NVidia это порядка 20% бизнеса, между прочим.
И напомню про вот этот мой пост объясняющий ситуацию вокруг GPU и Тайваня.
🥱12🤔4❤3🔥3
За новостями про новые супер пупер модели мы часто упускаем более важные в прикладной работе новые строительные блоки.
Perplexity уже довольно давно запустил Sonar: API к поиску. Выглядит ровно как апишка OpenAI, но эта штука ходит в интернет.
Это сильно недооцененная вещь.
Вот пару примеров из моей головы:
- Прокачать все отели, для каждого собрать хорошее описание. Вместо отелей подставь что угодно;
- На лету подтягивать агрегат свежих новостей на конкретную тему
- Собирать преимущества и недостатки товаров из обзоров для вашего маркетплейса;
- Подтягивать на лету решения из интернетов для проблем с любым оборудованием.
По сути, нормальный умный агрегатор интернета завернутый в API. За несколько центов за запрос.
Используйте.
Perplexity уже довольно давно запустил Sonar: API к поиску. Выглядит ровно как апишка OpenAI, но эта штука ходит в интернет.
Это сильно недооцененная вещь.
Вот пару примеров из моей головы:
- Прокачать все отели, для каждого собрать хорошее описание. Вместо отелей подставь что угодно;
- На лету подтягивать агрегат свежих новостей на конкретную тему
- Собирать преимущества и недостатки товаров из обзоров для вашего маркетплейса;
- Подтягивать на лету решения из интернетов для проблем с любым оборудованием.
По сути, нормальный умный агрегатор интернета завернутый в API. За несколько центов за запрос.
Используйте.
🔥45💅10❤6
No-code - всё!!111
(надо перестать читать бэкдор пхах)
Провел какое-то время с https://n8n.io/ - довольно популярной платформой для автоматизации с поддержкой агентов.
Она довольно классная - готовые интеграции, удобный дебаг и вообще. Можно быстро накидать бота или понятную автоматизацию. Сделали за пятнадцать минут с ребенком бота который генерит мемы для школьного проекта )
Разочарование приехало быстро. Как только я начал строить более сложное, стало там тесно. Ну, как обычно с такими платформами.
И тут я понял что в Cursor накидываю такое же буквально так же быстро. И без всяких глупых ограничений.
И не сказать что я там «пишу код» - я скорее говорю ей «допиши то», «допиши сё».
Новые инструменты разработки такие как Cursor и Replit настолько быстро позволяют создавать код, что изучение правил какой-либо no-code платформы уже того не стоит. И дальше это будет только обостряться.
Такие дела. Ставьте Cursor.
(надо перестать читать бэкдор пхах)
Провел какое-то время с https://n8n.io/ - довольно популярной платформой для автоматизации с поддержкой агентов.
Она довольно классная - готовые интеграции, удобный дебаг и вообще. Можно быстро накидать бота или понятную автоматизацию. Сделали за пятнадцать минут с ребенком бота который генерит мемы для школьного проекта )
Разочарование приехало быстро. Как только я начал строить более сложное, стало там тесно. Ну, как обычно с такими платформами.
И тут я понял что в Cursor накидываю такое же буквально так же быстро. И без всяких глупых ограничений.
И не сказать что я там «пишу код» - я скорее говорю ей «допиши то», «допиши сё».
Новые инструменты разработки такие как Cursor и Replit настолько быстро позволяют создавать код, что изучение правил какой-либо no-code платформы уже того не стоит. И дальше это будет только обостряться.
Такие дела. Ставьте Cursor.
4🔥73❤5
LLM OS
Очень мощная и близкая мне концепция. Первый раз услышал от Andrej Karpathy тут
Идея такая.
Текущий мир в котором мы живем это мир иконок приложений в твоём iPhone. Есть потребность - есть приложение под него.
Эта концепция уже трещит по швам. Супераппы это порождение недостатков этой архитектуры.
Представим мир LLM OS:
1. Ядро системы это твоя личная LLM с которой ты ведешь диалог и которая делает за тебя фоновые задачи;
2. Система имеет длинную память про тебя: кто ты, что тебе интересно и так далее. Это твой по-настоящему личный партнёр;
3. Все потребности реализованы в виде LLM Tools: функциональных ручек, которые предоставляют компании. LLM умеет их искать и вызывать;
4. Интерфейсы, конечно, есть. И полностью настраиваются через LLM. Компоненты могут предоставляться компаниями в составе Tools; но это скорее конструктор из фиче-виджетов чем текущие приложения. Некоторые считают что всё вообще будет через генерацию видео, с этим я скорее не согласен.
Как будто очень легко верится в такое будущее, я хочу в нем жить. Надеюсь, кто-то уже строит новый Apple.
Очень мощная и близкая мне концепция. Первый раз услышал от Andrej Karpathy тут
Идея такая.
Текущий мир в котором мы живем это мир иконок приложений в твоём iPhone. Есть потребность - есть приложение под него.
Эта концепция уже трещит по швам. Супераппы это порождение недостатков этой архитектуры.
Представим мир LLM OS:
1. Ядро системы это твоя личная LLM с которой ты ведешь диалог и которая делает за тебя фоновые задачи;
2. Система имеет длинную память про тебя: кто ты, что тебе интересно и так далее. Это твой по-настоящему личный партнёр;
3. Все потребности реализованы в виде LLM Tools: функциональных ручек, которые предоставляют компании. LLM умеет их искать и вызывать;
4. Интерфейсы, конечно, есть. И полностью настраиваются через LLM. Компоненты могут предоставляться компаниями в составе Tools; но это скорее конструктор из фиче-виджетов чем текущие приложения. Некоторые считают что всё вообще будет через генерацию видео, с этим я скорее не согласен.
Как будто очень легко верится в такое будущее, я хочу в нем жить. Надеюсь, кто-то уже строит новый Apple.
❤61💅17🤡8🥱4🔥1
Telegram x LLM
Телеграм уже давно перестал быть ярким развивающимся продуктом, что расстраивает.
А прикиньте как можно было бы круто сделать мессенджер со всей мощью моделек?
Вот я придумал за 10 минут:
1. Омнимодальность голоса и текста: можно вводить голосом и будет текст, можно озвучить сообщение или чат, в любую сторону;
2. Поиск по смыслу, а не по словам рыжий с котом на аватарке, говорили про тачки. Поиск по медиа и файлам сквозной паспорт Маши;
3. Личный агент для структурирования информации и умеющий сканировать каналы/чаты вместо saved messages
4. Ассистент по-умолчанию в любом групповом чате;
5. Пуши с саммари iOS-style а не батарея бестолковых пушей;
6. Саммари-превью в списке чатов и автотреды по смыслу внутри чатов
Ребята, ну давайте там. 2025 год а у вас расшифровка голосовых кривая косая и по пять минут ждать🌟
Телеграм уже давно перестал быть ярким развивающимся продуктом, что расстраивает.
А прикиньте как можно было бы круто сделать мессенджер со всей мощью моделек?
Вот я придумал за 10 минут:
1. Омнимодальность голоса и текста: можно вводить голосом и будет текст, можно озвучить сообщение или чат, в любую сторону;
2. Поиск по смыслу, а не по словам рыжий с котом на аватарке, говорили про тачки. Поиск по медиа и файлам сквозной паспорт Маши;
3. Личный агент для структурирования информации и умеющий сканировать каналы/чаты вместо saved messages
4. Ассистент по-умолчанию в любом групповом чате;
5. Пуши с саммари iOS-style а не батарея бестолковых пушей;
6. Саммари-превью в списке чатов и автотреды по смыслу внутри чатов
Ребята, ну давайте там. 2025 год а у вас расшифровка голосовых кривая косая и по пять минут ждать
Please open Telegram to view this post
VIEW IN TELEGRAM
4❤70🥱17🤡10💅5
Собрал для вас табличку сервисов и фреймворков для создания агентских систем по уровню абстракции - от высокого и простого к низкоуровневым инструментам.
Если хотите посмотреть что такое агенты или сделать простую штуку, начинайте сверху. На уровень 4 спускаться примерно никогда не требуется.
Го в комменты где что забыл и у кого какой опыт
Если хотите посмотреть что такое агенты или сделать простую штуку, начинайте сверху. На уровень 4 спускаться примерно никогда не требуется.
Го в комменты где что забыл и у кого какой опыт
1❤36🔥17🤔2
Media is too big
VIEW IN TELEGRAM
Посидел с replit.com
Replit это нашумевший AI-агент для разработки. Он за тебя и код напишет, и базы подключит, и задеплоит, и запустит. Разработка по описанию задачи под ключ. Посмотрите видос!
Интересно, что изначально фаундеры затевали проект как инструмент облачной разработки и деплоя. Строят его почти 10 лет! Год назад они пивотнулись в агента и на этом дико взлетели. Тут классный подкаст с ними на Y Combinator
Всем очень советую попробовать, опыт-восторг из будущего🥳 🤖
Эта штука за тебя step-by-step делает архитектуру, сетапит среду, тащит зависимости, пишет код, подцепляет базы и так далее. Сидишь и смотришь )
- Шикарный агентский сплит-скрин UX
Отличные интеграции
- Классные до-запросы вида «вот это ли ты хочешь»
- Сам находит и пытается чинить ошибки
- Встроенный деплой топчик
Но на паре практических кейсов replit у меня довольно слабо себя показал. Слишком сложные задачи пытается брать, в результате ломается. Нужно самому определить уровень сложности и делать step-by-step над replit, тогда в целом работает, но медленно получается.
Для меня это скорее демо "как всё будет в будущем" и классный пример агентского продукта с точки зрения интерфейса.
Но помним, что модели улучшаются, а планирование (ключевая задача здесь) в принципе недавно появились как популярная задача для Llm. Завтра будет лучше.
Replit это нашумевший AI-агент для разработки. Он за тебя и код напишет, и базы подключит, и задеплоит, и запустит. Разработка по описанию задачи под ключ. Посмотрите видос!
Интересно, что изначально фаундеры затевали проект как инструмент облачной разработки и деплоя. Строят его почти 10 лет! Год назад они пивотнулись в агента и на этом дико взлетели. Тут классный подкаст с ними на Y Combinator
Всем очень советую попробовать, опыт-восторг из будущего
Эта штука за тебя step-by-step делает архитектуру, сетапит среду, тащит зависимости, пишет код, подцепляет базы и так далее. Сидишь и смотришь )
- Шикарный агентский сплит-скрин UX
Отличные интеграции
- Классные до-запросы вида «вот это ли ты хочешь»
- Сам находит и пытается чинить ошибки
- Встроенный деплой топчик
Но на паре практических кейсов replit у меня довольно слабо себя показал. Слишком сложные задачи пытается брать, в результате ломается. Нужно самому определить уровень сложности и делать step-by-step над replit, тогда в целом работает, но медленно получается.
Для меня это скорее демо "как всё будет в будущем" и классный пример агентского продукта с точки зрения интерфейса.
Но помним, что модели улучшаются, а планирование (ключевая задача здесь) в принципе недавно появились как популярная задача для Llm. Завтра будет лучше.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26❤8🤔1💅1
Vibe coding
Это такой новый способ "писать" код, термин придумал Karpathy вот этим твитом
Представь: ты сидишь откинувшись в кресле, смотришь как агент работает, иногда пишешь ему команды, и просто жмешь accept all 😅
Пишешь туда самую мелкую чушь вроде «перекрась кнопку», наблюдая как вся мощь лучших моделей в мире меняет цвет твоей кнопки.
Bonus points если вы поставили SuperWhisper и делаете это голосом. Тогда даже писать буквы не надо: вбрасываешь ртом команды и агент батрачит.
Народ уже обсуждает “vibe design”, “vibe research” и так далее
Я уже проникся на 100%, зовите меня вайб кодер🌟
Идеально вечером с чаем или пивком, очень рекомендую )
Это такой новый способ "писать" код, термин придумал Karpathy вот этим твитом
Представь: ты сидишь откинувшись в кресле, смотришь как агент работает, иногда пишешь ему команды, и просто жмешь accept all 😅
Пишешь туда самую мелкую чушь вроде «перекрась кнопку», наблюдая как вся мощь лучших моделей в мире меняет цвет твоей кнопки.
Bonus points если вы поставили SuperWhisper и делаете это голосом. Тогда даже писать буквы не надо: вбрасываешь ртом команды и агент батрачит.
Народ уже обсуждает “vibe design”, “vibe research” и так далее
Я уже проникся на 100%, зовите меня вайб кодер
Идеально вечером с чаем или пивком, очень рекомендую )
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤46🔥15🤔5🤡3🥱2
У Anthropic вышел невероятно интересный отчет и вместе с ним целая инициатива Anthropic Economic Index.
Они берут реальные данные использования их claude.aiLLM API веб-интерфейса и строят агрегированную статистику поверх. Задача исследования - понять проникновение AI в реальные задачи людей.
Anthropic использует здесь очень правильный подход: смотрят в разрезе задач а не профессий. Каждая профессия это на самом деле комплекс разных задач. Усилять или автоматизировать нужно задачи, а не целиком профессии.
Огромное количество интересных данных и выводов, сравнения с зарплатами и распределением реальных работ. Например, на картинке видно дифф между использованием API и процентом людей в профессии.
Хайлайты:
1. Разработка софта занимает практически треть всех запросов;
2. Сильный перекос в digital работы;
3. 57% запросов это аугментация работы (т.е. "работаю вместе с AI"), 43% это AI полностью делает работу за человека;
4. Есть явный перекос в работы средней стоимости. Малооплачиваемые работы видимо трогать не интересно, а с дорогими профессиями всё сложновато получается.
Очень важно что это не какие-то опросы, а реальная статистика из боевогоAPI сервиса. Они даже дают скачать датасет!
Bonus: интересная статья про Anthropic Clio, как они построили внутреннюю систему анализа запросов и как это им помогает
Они берут реальные данные использования их claude.ai
Anthropic использует здесь очень правильный подход: смотрят в разрезе задач а не профессий. Каждая профессия это на самом деле комплекс разных задач. Усилять или автоматизировать нужно задачи, а не целиком профессии.
Огромное количество интересных данных и выводов, сравнения с зарплатами и распределением реальных работ. Например, на картинке видно дифф между использованием API и процентом людей в профессии.
Хайлайты:
1. Разработка софта занимает практически треть всех запросов;
2. Сильный перекос в digital работы;
3. 57% запросов это аугментация работы (т.е. "работаю вместе с AI"), 43% это AI полностью делает работу за человека;
4. Есть явный перекос в работы средней стоимости. Малооплачиваемые работы видимо трогать не интересно, а с дорогими профессиями всё сложновато получается.
Очень важно что это не какие-то опросы, а реальная статистика из боевого
Bonus: интересная статья про Anthropic Clio, как они построили внутреннюю систему анализа запросов и как это им помогает
1🔥24❤8