Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
2257 - Telegram Web
Telegram Web
Удивительный еще тренд по Open Router, видно, что легкие ИИ модели достигли промышленного качества генерации кода. Если в альтернативной Телеграм реальности идет холивар Gemini Pro vs Claude Opus, то в реальном использование Opus вообще не входит в Топ 10 ни в одной категории программирования, доля Gemini Pro очень мала.

Однако очень многие генерируют на Gemini Flash, Grok Fast, также заметен отказ от Chat GPT в пользу gpt-oss.

Этот "парадокс" относительный. Я эту табличку сейчас делал в AI Studio через Code Execution на Питоне. Вообще-то 3000 токенов кода сгенерировал Gemini Flash примерно за 5 секунд, т.е. 600 (!) токенов в секунду. Возможно это только в AI Studio так и для Code Execution - это VIP-вариант, но правда жизни в том, что легкие ИИ делают нормальный код уже и скорость реально между 100-200 токенов в секунду по тому же Open Router.

Это довольно серьезный тренд, если ранее был какой Opus-снобизм, то теперь четко видно, что легкие ИИ в генерации кода даже начинают доминировать. Тяжелые ИИ больше уходят в тему проектирования архитектуры и моделирования требований.

Во многом успех Grok Code Fast в том, что Илон Маск правильно понял, что текущая мощность LLM уже over kill для многих задач программирования, а если проблемы и появляются, то они не решаются просто "бруто форсом" более дорогой LLM, а скорее шаманством на промтах, гайдах, разметках кода и т.п. и т.д.
👍26🤔4
В Сенате США огромный хайп из ИИ. Комитет по образованию, труду и пенсиям прогнозирует потерю более 100 (!) миллионов рабочих мест в США из-за ИИ агентов в ближайшие 10 лет.

Левые как Бенни Сандерс требуют ограничить внедрение ИИ в США "пока не поздно".

https://fortune.com/2025/10/07/100-million-jobs-at-risk-of-elimination-senator-bernie-sanders-report-ai-kill-40-hour-workweek/
🔥12👍6🤷‍♂4
AI-War-Against-Workers.pdf
786.9 KB
Самое забавное, что Бенни Сандерс убеждает всех, что США будут через 10 лет сплошные безработные и куча ИИ ботов на основании... модели, которую с помощью Chat GPT построил Бенни Сандерс сам.

Ждем гайд по ИИ агентам и промптингу от левых из США 😂

Из более-менее серьезного он ссылается на большие корпоративные инвестиции в США в областях ИИ, которые сфокусированные именно на замену персонала на ИИ ботов

PS. Отчет Бенни приложен для изучения коллегами.
🤩4
This media is not supported in your browser
VIEW IN TELEGRAM
В Grok появилась быстра бесплатная генерация видео в Web-интерфейсе.

https://grok.com/imagine
🤩11👏51
Google выпустили новую модель Gemini 2.5 Computer Use.
Предназначена для агентов по управлению интерфейсом пользователя, сейчас хорошо управляет браузером и мобильными приложениями.

По факту это API распознования и управления приложением через ИИ. Хотя подобные вещи видели от Anthropic, но не такое развитое API, на мой взгляд. Это открывает двери в создание новых агентов, которые управляют старыми приложениями.

https://ai.google.dev/gemini-api/docs/computer-use
👍13🏆3
This media is not supported in your browser
VIEW IN TELEGRAM
В AI Studio появился Gemini Robotics ER.

Эта модель Google позволяет управлять роботами как на изображении. Команды отдаются довольно высокого уровня типа "возьми объект"

https://ai.google.dev/gemini-api/docs/robotics-overview
🔥17
В Сбербанке массовые увольнения IT персонала по официальной версии из-за внедрения ИИ. Нужно правда быть поэтом, чтобы представить, что на GigaChat можно реально генерировать рабочий код и ещё в 100% автоматических агентах. Сам по себе GigaChat пригоден для создания агентов, но весьма примитивных. Достаточно пообщаться в чате поддержки Сбера, чтобы понять где это все находится.

Увольнение 5000 специалистов очень серьезно для Сбера. По факту это утрата компетенций IT интегратора. Более вероятно это выглядит как финансовые трудности банка, скрытые за официальной отчётностью, и резкие сокращения для стабилизации расходов.

С тем же GigaChat ситуация тут непонятная, на деле команда разработчиков его тут первая на сокращение, т.к. от перехода на Qwen на прямую Сбер ничего не потеряет, а только выиграет.

https://www.cnews.ru/news/top/2025-10-07_sber_sokrashchaet_it-spetsialistov
👍831🤯1
Гарвард предложил новый тест AI Productivity Index (APEX) как способность замещать ИИ агентом персонал в банках, консалтинговых и юридических фирмах, а также в медицине. Гарвард проделал большую работу по созданию data set реальных кейсов персонала.

Хотя видно, что текущий уровень ИИ не позволяет легко заменить персонал, но можно сократить персонал примерно на 60%, если ИИ агентами накрывать кейсы, там где они сильны. Тест показал, что в реальных агентских задачах намного сильнее Grok 4 и Gemini Flash, чем кажется.

По тесту видна и разница между агентом на SLM и LLM. Если LLM как Gemini Flash решает 60% реальных кейсов, то SLM полученная его дистилляций как Gemma только 36%. Хотя по обычным бенчмаркам такой разницы невидно, т.к. именно по ним дистилляция просто и делается, но реальные бизнес-кейсы идут иначе, чем шаблонные тесты. В этом плане стоит подумать о ставке на SLM как об агенте.

https://arxiv.org/html/2509.25721v1
6👍5🤔1
Массовые увольнения в IT из Сбербанка "из-за ИИ" скорее связаны с заявлением Минфина РФ, что дефицит бюджета выходит из под контроля по расходной части. Плановый дефицит был 3,7 трлн рублей в 2025 году, но по оценке Минфина в реальности достигнет 5,74 трлн рублей.

У России очень низкий госдолг, поэтому при доступности внешнего кредитного рынка это вообще не было проблемой, но он закрыт, поэтому варианты Правительства - разместить огромные госзаймы в российских банках и повышать налоги. Повышение налогов на ИТ принесет только 25 миллиардов рублей по расчетам Минфина. Это мало способно повлиять на такой дефицит.

Сумма кредитования в несколько триллионов рублей для российских банков тоже огромная. Кредит на 1 триллион рублей может превысить и прибыль Сбера. Скорее возникает вопрос сможет ли Сбербанк дальше финансировать свой амбициозный ИТ портфель, включая GigaChat.

Планируемые по данным CNews к увольнению 5000 специалистов в IT - очень много. Это практически весь штат подразделений разработчиков.

https://tass.ru/ekonomika/25195239
1👍1🤯1
На тему вышел ли ИИ "на плато" технологий. Результаты по бенчмаркам продолжают расти, огромное количество технологий еще в R&D, я публикую по ним статьи постоянно.

Нет, ИИ еще даже близко не вышел на плато продуктивности
💯11🔥1
Epoch AI сделал обобщение самых сложных сейчас бенчмарков по софту (SWE Bench), биологии (Protocol QA) и математике (FrontierMath).

При текущих темпах R&D в ИИ тренды указывают, что в районе 2027 года данные тесты входят в насыщение и потеряют актуальность.

Это означает, что уже к 2027 году технологически станут возможны ИИ агенты замещающие на 100% текущих инженеров как минимум под надзором оператора группы таких агентов.

Текущие темпы разработок и самих агентов, что я вижу по клиентам, тоже скорее указывают на завершение разработок примерно в 2027 году, но выход этих продуктов на рынок просто чумовым образом поддержат вендоры ИИ мощностью своих LLM.

Если чего-то не поменяется в трендах, старой IT реальности осталось жить 2 года.
🤯143💯3👍2
Подписчики сообщают, что гуманоиды китайцев UniTree уже в Москве)
Forwarded from Christine Mathieu
Вчера видела забавную картину в центре. Возможно захотите в своём канале поделиться
👍13🔥11👀8🤷‍♂2
На фоне текущих проблем Правительства, даже в ИИ сфере скорее вопрос не какие там LLM выйдут, а не начнется ли деградация IT отрасли целиком. Массовые сокращения в Сбере стали показателем как это выглядит.

Налоги на ИТ сильно вырастут. Фактически последний льготный налоговый режим это НПД или "самозанятые". В реальности в таком режиме сейчас существует огромное количество экспертов транснациональных IT корпораций, т.к. после ухода из РФ они работают по факту со старым персоналом как с индивидуальными подрядчиками ещё с кучей проблем с платежами, но это работает.

Сейчас дыра в бюджете РФ из-за внеплановых расходов превышает 5 триллионов рублей, поэтому политики ищут как решать вопрос.

Сейчас Правительство сообщило, что все же выполнит обещание не трогать НПД до 2028 года.

Очень вероятно, что многие малые ИТ компании будут выводить специалистов за штат в НПД и просить клиентов переводить средства им прямо, чтобы отношения не переквалифицировали в трудовые с дочислением НДФЛ и соцналогов.

Поэтому не стоит заказчикам удивляться таким предложениям, IT отрасль просто пытается выжить

https://www.rbc.ru/society/09/10/2025/68e782959a794795dde3f5bc
6🤯1
У Open AI утек список Top 30 клиентов, которые потребляют более 1 триллиона токенов.

Что тут видно. Для начала значение ИИ как обучению языкам больше, чем программирование, что ожидаемо. Программирует небольшая часть населения, а языки учат все. Что Duolingo делает такой мощный трафик через Open AI на деле показательно.

Видно, что разработчики не склонны покупать обычно API у Open AI напрямую, а чаще используют Open Router, что понятно. Это банально надежнее и нет vendor lock, после решения Open Router не брать 5% за проксирование, тренд усилится.

Показателен еще трафик Salesforce, что как-то подрывает истории, что компания может сделать свой LLM. Инвесторы давно в это не верят, поэтому CRM-лидер обвалился на 30% по капитализации за один год.

Notion в конце списка во многом "по моей теме" как проектное управление. Действительно, ИИ в project management имеет огромный потенциал. Во многом как раз из EPM систем реально придут методологии планирования и агентов для других отраслей, т.к. там это делают сейчас любители, а тут профессионалы именно в планировании проектов.
12👍5
Коллеги в чате подкинули интересную статью по улучшению управлением агентами. "Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models" говорит о том, что если сделать 3 агента как Generator с критиком Reflector и обновителем базы знаний контекста Curator, то качество управления агентами возрастает.

Однако очень важный момент по чтению статьей всегда смотреть в Apendix научных работ с промптами, т.к. реально наблюдаемые положительные эффекты могут быть связаны и с другими факторами, которые не по теме диссертации PhD, что пытаются подкрепить работой.

В примерах промптов виден крайне высокий профессионализм. Если дилетанты в агентах в России обычно не разбираются в XML-подобных семантических разметках, то тут вы можете видеть практически копию моей семантической разметки GRACE на START/END тегах. Именно замена стандартной разметки из ground truth labels тут точно фактор

Как и в других работах, что я публиковал, как и практически сам применяю во FLEX, никак не снизилось значение few shots в промтинге даже для LLM. Если вас волнуют галлюцинации агентов, то нужно заниматься не бредом JSON-схем, а показывать ИИ примеры как правильно толковать контекст.

В данном случае, трудно сказать, что больше было фактором эффективности в работе сама оркестровка агентов или высококачественный промптинг с семантическими разметками и примерами.

https://arxiv.org/html/2510.04618v1
9👍43
Если хотите, чтобы я дал свой анализ какой-то научной статье, что вы заметили, то бросьте ссылку в наш чат. Временно открою в него доступ, так он закрытый. Предупреждаю сразу: все устали от флейма и флуда, поэтому если вы просто хотите развлечься в техническом чате, то не по адресу.

Сейчас очень много вышло материалов, я бы предпочел даже от коллег получить ссылки на интересные им статьи, т.к. мои интересы могут отличаться. Я все же концентрируюсь на вертикальных решениях как генерация кода, а агентов больше узкой направленности как ETL/DWH, там своя специфика с учетом еще отраслевых пользователей как строители или маркетинг.

Очень важный момент, что нужно осторожно подходить к ИИ анализу статей как все делают, дело в том, что ИИ не сразу может понять, что нужно применять более широкий контекст связанных публикаций, также почти все научные статьи имеют искажение в том плане, что автору обычно нужна статья для диссертации PhD как подтверждение тестами его гипотез, но весьма часто наблюдаемы положительные эффекты следствие других факторов или вообще подгонкой data sets под тест. Обычно ИИ без ваших указаний это все не видит и вы можете получить искаженное представление, слепо доверяя автору статьи.

https://www.tgoop.com/+nEORxCnF4WtjZmNi
🔥6👍1
Goldman Sachs выложил в открытый доступ свой отчет для инвесторов еще в апреле 2025 года, который отчасти пролил свет почему инвесторы смеются над алармистами и продолжают скупать акции ИИ компаний, т.к. авторитет Goldman Sachs выше блогеров и даже "ведущих колонок Financial Times" на порядки.

Goldman Sachs указывает на P/E фактор о котором я постоянно пишу. Несмотря на огромный рост капитализации соотношение прибыли и стоимости акций ИИ компаний остается здоровым. Поэтому, перефразируя Марка Твена: "слухи о скорой смерти ИИ рынка несколько преувеличены".

Тем не менее, Goldman Sachs указывает, что коррекция возможна, но тогда основную выгоду от ИИ инвестиций получат ИИ компании "новой волны".

Они также отмечают черезмерную монополизацию ИИ рынка и риск вмешательства регуляторов в США и ЕС. Это может стать основной проблемой как раз при коррекции, когда антимонопольные службы запретят спасать Open AI или Anthropic при кризисе, чтобы не получился новый монополист в лице того же Microsoft. Регуляторы могут потребовать убыточные Open AI и Anthropic просто "разобрать на запчасти" в части патентов и так их продать рынку через процедуры банкротства. Такие сценарии конечно резко увеличат вес Китая, поэтому на антимонопольных регуляторов будут давить Правительства США и ЕС, но регуляторы имеют в демократиях значительную автономность в решениях.

https://www.goldmansachs.com/pdfs/insights/goldman-sachs-research/25-years-on-lessons-from-the-bursting-of-the-tech-bubble/redaction.pdf
5👍53
На деле проблемы выйти в безубыточность для Open AI и Anthropic остаются главными. Они не могут выйти на NASDAQ торговаться как убыточные компании, также они крайне зависимы от инвесторов в своем существовании. Поэтому если тому же Альтману не будет хватать денег, то его легко сменит Microsoft на посту вне зависимости от количество голосов в акциях, а просто потому, что у него есть нужный кеш.

Anthropic прекрасно понимает эти риски и Дарио резко поднял стоимость Claude, если бы не верные ему фанаты, то он мог бы и лишится клиентской базы, т.к. сейчас даже легкие LLM создают приличный код, это видно по Open Router. Статистику я приводил в канале.

Однако повышениям цен активно мешает Google, который наоборот втопил дальше в демпинг, не пуская стартапы в прибыльность, необходимую как воздух.

По факту Google дропнул прайс на свой Gemini Enterprise до $21 доллара в месяц. Это тот же самый тариф на котором работает Gemini CLI (или Kilo Code через него) с лимитом на 2000 запросов в день, но Google предложил еще много плюшек как платформу хостинга ИИ агентов.

Google недавно сообщил, что перешагнул 1 квадралион токенов в месяц, правда с учетом и хостинга прямых конкурентов, но довольно хорошо видно, что в корпоративном сегменте Google становится все сильнее.

Линейка Gemini довольно мощная по качеству и скорости, а ценник в реале ниже себестоимости Open AI и Anthropic. Это напоминает просто прямую попытку сжечь напалмом конкурентов демпингом. Пока есть приток инвестиционных денег у конкурентов, это не так сказывается, но если он упадет, то Google поставит коллег по рынку на грань выживания.

https://cloud.google.com/blog/products/ai-machine-learning/introducing-gemini-enterprise
🔥163👍2🤯21🤗1
2025/10/11 17:29:35
Back to Top
HTML Embed Code: