AI Projects

Удивительный еще тренд по Open Router, видно, что легкие ИИ модели достигли промышленного качества генерации кода. Если в альтернативной Телеграм реальности идет холивар Gemini Pro vs Claude Opus, то в реальном использование Opus вообще не входит в Топ 10 ни в одной категории программирования, доля Gemini Pro очень мала.

Однако очень многие генерируют на Gemini Flash, Grok Fast, также заметен отказ от Chat GPT в пользу gpt-oss.

Этот "парадокс" относительный. Я эту табличку сейчас делал в AI Studio через Code Execution на Питоне. Вообще-то 3000 токенов кода сгенерировал Gemini Flash примерно за 5 секунд, т.е. 600 (!) токенов в секунду. Возможно это только в AI Studio так и для Code Execution - это VIP-вариант, но правда жизни в том, что легкие ИИ делают нормальный код уже и скорость реально между 100-200 токенов в секунду по тому же Open Router.

Это довольно серьезный тренд, если ранее был какой Opus-снобизм, то теперь четко видно, что легкие ИИ в генерации кода даже начинают доминировать. Тяжелые ИИ больше уходят в тему проектирования архитектуры и моделирования требований.

Во многом успех Grok Code Fast в том, что Илон Маск правильно понял, что текущая мощность LLM уже over kill для многих задач программирования, а если проблемы и появляются, то они не решаются просто "бруто форсом" более дорогой LLM, а скорее шаманством на промтах, гайдах, разметках кода и т.п. и т.д.

👍26🤔4

972 viewsVladimir Ivanov, edited 15:21

AI Projects

В Сенате США огромный хайп из ИИ. Комитет по образованию, труду и пенсиям прогнозирует потерю более 100 (!) миллионов рабочих мест в США из-за ИИ агентов в ближайшие 10 лет.

Левые как Бенни Сандерс требуют ограничить внедрение ИИ в США "пока не поздно".

https://fortune.com/2025/10/07/100-million-jobs-at-risk-of-elimination-senator-bernie-sanders-report-ai-kill-40-hour-workweek/

🔥12👍6🤷‍♂4

986 viewsVladimir Ivanov, 18:48

AI Projects

AI-War-Against-Workers.pdf

786.9 KB

Самое забавное, что Бенни Сандерс убеждает всех, что США будут через 10 лет сплошные безработные и куча ИИ ботов на основании... модели, которую с помощью Chat GPT построил Бенни Сандерс сам.

Ждем гайд по ИИ агентам и промптингу от левых из США 😂

Из более-менее серьезного он ссылается на большие корпоративные инвестиции в США в областях ИИ, которые сфокусированные именно на замену персонала на ИИ ботов

PS. Отчет Бенни приложен для изучения коллегами.

🤩4

934 viewsVladimir Ivanov, edited 18:54

AI Projects

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

В Grok появилась быстра бесплатная генерация видео в Web-интерфейсе.

https://grok.com/imagine

🤩11👏5❤1

1.01K viewsVladimir Ivanov, 20:00

AI Projects

Google выпустили новую модель Gemini 2.5 Computer Use.
Предназначена для агентов по управлению интерфейсом пользователя, сейчас хорошо управляет браузером и мобильными приложениями.

По факту это API распознования и управления приложением через ИИ. Хотя подобные вещи видели от Anthropic, но не такое развитое API, на мой взгляд. Это открывает двери в создание новых агентов, которые управляют старыми приложениями.

https://ai.google.dev/gemini-api/docs/computer-use

Google AI for Developers

Computer Use | Gemini API | Google AI for Developers

Learn how to use the Gemini API computer use feature.

👍13🏆3

983 viewsVladimir Ivanov, 20:57

AI Projects

This media is not supported in your browser

VIEW IN TELEGRAM

В AI Studio появился Gemini Robotics ER.

Эта модель Google позволяет управлять роботами как на изображении. Команды отдаются довольно высокого уровня типа "возьми объект"

https://ai.google.dev/gemini-api/docs/robotics-overview

🔥17

1.01K viewsVladimir Ivanov, 21:01

AI Projects

В Сбербанке массовые увольнения IT персонала по официальной версии из-за внедрения ИИ. Нужно правда быть поэтом, чтобы представить, что на GigaChat можно реально генерировать рабочий код и ещё в 100% автоматических агентах. Сам по себе GigaChat пригоден для создания агентов, но весьма примитивных. Достаточно пообщаться в чате поддержки Сбера, чтобы понять где это все находится.

Увольнение 5000 специалистов очень серьезно для Сбера. По факту это утрата компетенций IT интегратора. Более вероятно это выглядит как финансовые трудности банка, скрытые за официальной отчётностью, и резкие сокращения для стабилизации расходов.

С тем же GigaChat ситуация тут непонятная, на деле команда разработчиков его тут первая на сокращение, т.к. от перехода на Qwen на прямую Сбер ничего не потеряет, а только выиграет.

https://www.cnews.ru/news/top/2025-10-07_sber_sokrashchaet_it-spetsialistov

CNews.ru

Сбербанк массово сокращает ИТ-шников и заменяет их искусственным интеллектом - CNews

В Сбербанке мощная волна сокращений ИТ-специалистов. Под нее попадают разработчики, аналитики, тестировщики и...

👍8⚡3❤1🤯1

1.17K viewsVladimir Ivanov, edited 06:52

AI Projects

Гарвард предложил новый тест AI Productivity Index (APEX) как способность замещать ИИ агентом персонал в банках, консалтинговых и юридических фирмах, а также в медицине. Гарвард проделал большую работу по созданию data set реальных кейсов персонала.

Хотя видно, что текущий уровень ИИ не позволяет легко заменить персонал, но можно сократить персонал примерно на 60%, если ИИ агентами накрывать кейсы, там где они сильны. Тест показал, что в реальных агентских задачах намного сильнее Grok 4 и Gemini Flash, чем кажется.

По тесту видна и разница между агентом на SLM и LLM. Если LLM как Gemini Flash решает 60% реальных кейсов, то SLM полученная его дистилляций как Gemma только 36%. Хотя по обычным бенчмаркам такой разницы невидно, т.к. именно по ним дистилляция просто и делается, но реальные бизнес-кейсы идут иначе, чем шаблонные тесты. В этом плане стоит подумать о ставке на SLM как об агенте.

https://arxiv.org/html/2509.25721v1

❤6👍5🤔1

933 viewsVladimir Ivanov, 07:30

AI Projects

Массовые увольнения в IT из Сбербанка "из-за ИИ" скорее связаны с заявлением Минфина РФ, что дефицит бюджета выходит из под контроля по расходной части. Плановый дефицит был 3,7 трлн рублей в 2025 году, но по оценке Минфина в реальности достигнет 5,74 трлн рублей.

У России очень низкий госдолг, поэтому при доступности внешнего кредитного рынка это вообще не было проблемой, но он закрыт, поэтому варианты Правительства - разместить огромные госзаймы в российских банках и повышать налоги. Повышение налогов на ИТ принесет только 25 миллиардов рублей по расчетам Минфина. Это мало способно повлиять на такой дефицит.

Сумма кредитования в несколько триллионов рублей для российских банков тоже огромная. Кредит на 1 триллион рублей может превысить и прибыль Сбера. Скорее возникает вопрос сможет ли Сбербанк дальше финансировать свой амбициозный ИТ портфель, включая GigaChat.

Планируемые по данным CNews к увольнению 5000 специалистов в IT - очень много. Это практически весь штат подразделений разработчиков.

https://tass.ru/ekonomika/25195239

TACC

Дефицит федерального бюджета России в 2025 году составит 5,74 трлн рублей

Это 2,6% ВВП

❤1👍1🤯1

1.1K viewsVladimir Ivanov, 08:35

AI Projects

На тему вышел ли ИИ "на плато" технологий. Результаты по бенчмаркам продолжают расти, огромное количество технологий еще в R&D, я публикую по ним статьи постоянно.

Нет, ИИ еще даже близко не вышел на плато продуктивности

💯11🔥1

930 viewsVladimir Ivanov, 09:05

AI Projects

Epoch AI сделал обобщение самых сложных сейчас бенчмарков по софту (SWE Bench), биологии (Protocol QA) и математике (FrontierMath).

При текущих темпах R&D в ИИ тренды указывают, что в районе 2027 года данные тесты входят в насыщение и потеряют актуальность.

Это означает, что уже к 2027 году технологически станут возможны ИИ агенты замещающие на 100% текущих инженеров как минимум под надзором оператора группы таких агентов.

Текущие темпы разработок и самих агентов, что я вижу по клиентам, тоже скорее указывают на завершение разработок примерно в 2027 году, но выход этих продуктов на рынок просто чумовым образом поддержат вендоры ИИ мощностью своих LLM.

Если чего-то не поменяется в трендах, старой IT реальности осталось жить 2 года.

🤯14❤3💯3👍2

2.22K viewsVladimir Ivanov, edited 09:10

AI Projects

Подписчики сообщают, что гуманоиды китайцев UniTree уже в Москве)

916 viewsVladimir Ivanov, 11:48

AI Projects

Forwarded from Christine Mathieu

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

Вчера видела забавную картину в центре. Возможно захотите в своём канале поделиться

👍13🔥11👀8🤷‍♂2

1.18K viewsVladimir Ivanov, 11:48

AI Projects

На фоне текущих проблем Правительства, даже в ИИ сфере скорее вопрос не какие там LLM выйдут, а не начнется ли деградация IT отрасли целиком. Массовые сокращения в Сбере стали показателем как это выглядит.

Налоги на ИТ сильно вырастут. Фактически последний льготный налоговый режим это НПД или "самозанятые". В реальности в таком режиме сейчас существует огромное количество экспертов транснациональных IT корпораций, т.к. после ухода из РФ они работают по факту со старым персоналом как с индивидуальными подрядчиками ещё с кучей проблем с платежами, но это работает.

Сейчас дыра в бюджете РФ из-за внеплановых расходов превышает 5 триллионов рублей, поэтому политики ищут как решать вопрос.

Сейчас Правительство сообщило, что все же выполнит обещание не трогать НПД до 2028 года.

Очень вероятно, что многие малые ИТ компании будут выводить специалистов за штат в НПД и просить клиентов переводить средства им прямо, чтобы отношения не переквалифицировали в трудовые с дочислением НДФЛ и соцналогов.

Поэтому не стоит заказчикам удивляться таким предложениям, IT отрасль просто пытается выжить

https://www.rbc.ru/society/09/10/2025/68e782959a794795dde3f5bc

РБК

Специальный налоговый режим для самозанятых сохранят до 2028 года

Условия работы и налогообложения для самозанятых в России не будут меняться до конца 2028 года. Такие гарантии дало правительство на фоне предложений Совета Федерации ускорить завершение эксперимента

❤6🤯1

927 viewsVladimir Ivanov, edited 12:15

AI Projects

У Open AI утек список Top 30 клиентов, которые потребляют более 1 триллиона токенов.

Что тут видно. Для начала значение ИИ как обучению языкам больше, чем программирование, что ожидаемо. Программирует небольшая часть населения, а языки учат все. Что Duolingo делает такой мощный трафик через Open AI на деле показательно.

Видно, что разработчики не склонны покупать обычно API у Open AI напрямую, а чаще используют Open Router, что понятно. Это банально надежнее и нет vendor lock, после решения Open Router не брать 5% за проксирование, тренд усилится.

Показателен еще трафик Salesforce, что как-то подрывает истории, что компания может сделать свой LLM. Инвесторы давно в это не верят, поэтому CRM-лидер обвалился на 30% по капитализации за один год.

Notion в конце списка во многом "по моей теме" как проектное управление. Действительно, ИИ в project management имеет огромный потенциал. Во многом как раз из EPM систем реально придут методологии планирования и агентов для других отраслей, т.к. там это делают сейчас любители, а тут профессионалы именно в планировании проектов.

✍12👍5

789 viewsVladimir Ivanov, edited 14:41

AI Projects

Коллеги в чате подкинули интересную статью по улучшению управлением агентами. "Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models" говорит о том, что если сделать 3 агента как Generator с критиком Reflector и обновителем базы знаний контекста Curator, то качество управления агентами возрастает.

Однако очень важный момент по чтению статьей всегда смотреть в Apendix научных работ с промптами, т.к. реально наблюдаемые положительные эффекты могут быть связаны и с другими факторами, которые не по теме диссертации PhD, что пытаются подкрепить работой.

В примерах промптов виден крайне высокий профессионализм. Если дилетанты в агентах в России обычно не разбираются в XML-подобных семантических разметках, то тут вы можете видеть практически копию моей семантической разметки GRACE на START/END тегах. Именно замена стандартной разметки из ground truth labels тут точно фактор

Как и в других работах, что я публиковал, как и практически сам применяю во FLEX, никак не снизилось значение few shots в промтинге даже для LLM. Если вас волнуют галлюцинации агентов, то нужно заниматься не бредом JSON-схем, а показывать ИИ примеры как правильно толковать контекст.

В данном случае, трудно сказать, что больше было фактором эффективности в работе сама оркестровка агентов или высококачественный промптинг с семантическими разметками и примерами.

https://arxiv.org/html/2510.04618v1

✍9👍4❤3

724 viewsVladimir Ivanov, edited 15:03

AI Projects

Если хотите, чтобы я дал свой анализ какой-то научной статье, что вы заметили, то бросьте ссылку в наш чат. Временно открою в него доступ, так он закрытый. Предупреждаю сразу: все устали от флейма и флуда, поэтому если вы просто хотите развлечься в техническом чате, то не по адресу.

Сейчас очень много вышло материалов, я бы предпочел даже от коллег получить ссылки на интересные им статьи, т.к. мои интересы могут отличаться. Я все же концентрируюсь на вертикальных решениях как генерация кода, а агентов больше узкой направленности как ETL/DWH, там своя специфика с учетом еще отраслевых пользователей как строители или маркетинг.

Очень важный момент, что нужно осторожно подходить к ИИ анализу статей как все делают, дело в том, что ИИ не сразу может понять, что нужно применять более широкий контекст связанных публикаций, также почти все научные статьи имеют искажение в том плане, что автору обычно нужна статья для диссертации PhD как подтверждение тестами его гипотез, но весьма часто наблюдаемы положительные эффекты следствие других факторов или вообще подгонкой data sets под тест. Обычно ИИ без ваших указаний это все не видит и вы можете получить искаженное представление, слепо доверяя автору статьи.

https://www.tgoop.com/+nEORxCnF4WtjZmNi

💰📊🪓AI Project Manager

Закрытый клуб руководителей проектов. Вход только по приглашениям.

🔥6👍1

717 viewsVladimir Ivanov, edited 15:24

AI Projects

Goldman Sachs выложил в открытый доступ свой отчет для инвесторов еще в апреле 2025 года, который отчасти пролил свет почему инвесторы смеются над алармистами и продолжают скупать акции ИИ компаний, т.к. авторитет Goldman Sachs выше блогеров и даже "ведущих колонок Financial Times" на порядки.

Goldman Sachs указывает на P/E фактор о котором я постоянно пишу. Несмотря на огромный рост капитализации соотношение прибыли и стоимости акций ИИ компаний остается здоровым. Поэтому, перефразируя Марка Твена: "слухи о скорой смерти ИИ рынка несколько преувеличены".

Тем не менее, Goldman Sachs указывает, что коррекция возможна, но тогда основную выгоду от ИИ инвестиций получат ИИ компании "новой волны".

Они также отмечают черезмерную монополизацию ИИ рынка и риск вмешательства регуляторов в США и ЕС. Это может стать основной проблемой как раз при коррекции, когда антимонопольные службы запретят спасать Open AI или Anthropic при кризисе, чтобы не получился новый монополист в лице того же Microsoft. Регуляторы могут потребовать убыточные Open AI и Anthropic просто "разобрать на запчасти" в части патентов и так их продать рынку через процедуры банкротства. Такие сценарии конечно резко увеличат вес Китая, поэтому на антимонопольных регуляторов будут давить Правительства США и ЕС, но регуляторы имеют в демократиях значительную автономность в решениях.

https://www.goldmansachs.com/pdfs/insights/goldman-sachs-research/25-years-on-lessons-from-the-bursting-of-the-tech-bubble/redaction.pdf

❤5👍5✍3

757 viewsVladimir Ivanov, edited 15:44

AI Projects

На деле проблемы выйти в безубыточность для Open AI и Anthropic остаются главными. Они не могут выйти на NASDAQ торговаться как убыточные компании, также они крайне зависимы от инвесторов в своем существовании. Поэтому если тому же Альтману не будет хватать денег, то его легко сменит Microsoft на посту вне зависимости от количество голосов в акциях, а просто потому, что у него есть нужный кеш.

Anthropic прекрасно понимает эти риски и Дарио резко поднял стоимость Claude, если бы не верные ему фанаты, то он мог бы и лишится клиентской базы, т.к. сейчас даже легкие LLM создают приличный код, это видно по Open Router. Статистику я приводил в канале.

Однако повышениям цен активно мешает Google, который наоборот втопил дальше в демпинг, не пуская стартапы в прибыльность, необходимую как воздух.

По факту Google дропнул прайс на свой Gemini Enterprise до $21 доллара в месяц. Это тот же самый тариф на котором работает Gemini CLI (или Kilo Code через него) с лимитом на 2000 запросов в день, но Google предложил еще много плюшек как платформу хостинга ИИ агентов.

Google недавно сообщил, что перешагнул 1 квадралион токенов в месяц, правда с учетом и хостинга прямых конкурентов, но довольно хорошо видно, что в корпоративном сегменте Google становится все сильнее.

Линейка Gemini довольно мощная по качеству и скорости, а ценник в реале ниже себестоимости Open AI и Anthropic. Это напоминает просто прямую попытку сжечь напалмом конкурентов демпингом. Пока есть приток инвестиционных денег у конкурентов, это не так сказывается, но если он упадет, то Google поставит коллег по рынку на грань выживания.

https://cloud.google.com/blog/products/ai-machine-learning/introducing-gemini-enterprise

🔥16✍3👍2🤯2❤1🤗1

737 viewsVladimir Ivanov, edited 17:27

2025/10/11 17:29:35
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>