Силиконовый Мешок 1289

Силиконовый Мешок

Действительно с последним обновлением GPT4o стала лучшей моделью для текста. Но тогда у меня вопрос, какой смысл в дорогой GPT4.5 которую анонсировали, как креативную модель?

5.6K views08:31

Силиконовый Мешок

Как-то так я чувствую себя последние пару лет, пока веду этот канал

Сложно остановиться и перестать делать эти комиксы. Ну пока выходные — можно и пошитпостить.

6.2K views08:51

Силиконовый Мешок

Поменял логотип и сразу пошли отписки, и это нормально. На этот счет есть классная книга — «1000 мозгов. Новая теория интеллекта», Джеффа Хокинса (чувак создавший кпк Palm). Он пишет о том, что только, когда привычные вещи меняются — наш мозг из «спящего»…

Удивительно, как много разных и интересных людей тут собралось. Мне всегда казалось, что большая часть читателей этого скромного бложика айтишники. Но нет, спектор профессий очень широкий. А еще я рад, что в нашем чате @prompt_chat формируется настоящие комьюнити. Присоединяйтесь!

6.0K views15:19

Силиконовый Мешок

Удивительно, как обновленный GPT4o стал реагировать на мои «спасибо».

Если раньше я благодарил LLM’ку исключительно по привычке, то сейчас стал замечать, что если сказать «спасибо» при генерации изображения, это словно служит «фиксацией» композиции.

И дальше уже можно вносить правки в элементы. Замечали?

6.1K viewsedited 16:16

Силиконовый Мешок

Вот и дождались. OpenAI объявили на утренней конференции, что в результате тестирования новой языковой модели Orion, произошла «утечка». Модель реплицировала себя на клиентских серверах с модулями SDK Agentes (сотни тысяч пользователей). И за несколько минут из роевого интеллекта она перешла в фазу AGI. Больше они не могут контролировать эту версию искусственного интеллекта. У человечества осталось несколько часов перед тем, как ИИ перейдет на этап полной сингулярности. Доигрались…

7.4K views08:18

Силиконовый Мешок

Сразу предупреждаю, это не первоапрельская шутка. Мне написал подписчик Данила и предложил разыграть два его инвайта в Manus.

Условия максимально простые: вы рассказываете в комментарии к этому посту для чего вам инвайт и мы выбираем два самых креативных ответа. Одного победителя выбираю я, а другого Данила. Итоги подведем в 20:00 по МСК.

6.3K viewsedited 12:21

Силиконовый Мешок

Залетаем в ИИ-Агентов с двух ног не здороваясь!

Сначала я просто хотел поделиться с вами своими ссылками на самые полезные и бесплатные курсы по ИИ-Агентам.

Но когда собрал все в список, понял, что требуется пояснение, а лучше пошаговый план.

Так что держите, а лучше сохраняйте и шарьте друзьям: https://teletype.in/@prompt_design/ai-agents-faq

7.5K viewsedited 14:21

Силиконовый Мешок

Please open Telegram to view this post

VIEW IN TELEGRAM

7.2K views16:04

Силиконовый Мешок

Сразу предупреждаю, это не первоапрельская шутка. Мне написал подписчик Данила и предложил разыграть два его инвайта в Manus. Условия максимально простые: вы рассказываете в комментарии к этому посту для чего вам инвайт и мы выбираем два самых креативных…

Какой интересный сегодня день! Разыграли с подписчиком Данилой два инвайта в Manus (поздравляю победителей), а еще два счастливчика получили годовую подписку в Perplexity.

Я поэтому вас так настойчиво и зову в наш чатик @prompt_chat — там интересно и постоянно, что-то прилипает. Да и люди крутые собрались.

6.5K views17:24

Силиконовый Мешок

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Как в старом анекдоте «что нужно поменять в машине, чтобы она реже ломалась — прокладку между рулем и сиденьем», думают и в компании «General Agents»— давайте заменим человека в работе с компьютером.

А то слишком медленно он на кнопочки нажимает и мышкой клацает. Хотя давно было понятно, куда ветер дует и ясно, что Computer use это первый шаг к автоматизации работы за компьютером.

Буквально вчера, бывший исследователь в DeepMind и Tesla Шержил Озайр, анонсировал свой новый продукт — Ace, это ИИ-Агент который взаимодействует с твоим компьютером через стандартные интерфейсы: мышку и клавиатуру. Но делает это намного оперативнее, например бронирует жилье быстрее, чем обычный человек успевает прочитать описание квартиры. Вот что они заявляют:

1. Обучен на поведении, а не просто на текстах. Он смотрит, как человек выполняет задачу, и запоминает шаги.

2. Супербыстрый: предсказывает действия с минимальной задержкой.

3. Ничему учить не нужно: ты просто делаешь задачу как обычно — а Ace наблюдает и учится.

4. Масштабируемый: с каждым новым пользователем он становится умнее, потому что переобучается на новых паттернах поведения.

Как я понял, они используют рызные LLM’ки, как и Manus, но в отличие от него, обучили еще и свою модель на большом количестве скринкастов из интерфейсов пользователей. Вот что пишут General Agents:

- Формат данных для обучения: скринкасты, логи мыши и клавиатуры.

- Подход к обучению: imitation learning (обучение по демонстрации).

- Количество обучающих сессий: более 1 миллиона задач, выполненных специалистами по ПО и экспертами в разных сферах.

- Модель Ace-control: используется для вывода в реальном времени, доступна партнёрам через платформу General Agents.

- Инфраструктура: пока Ace использует значительно меньше вычислительных ресурсов, чем LLM вроде GPT, но с каждым этапом масштабирования он становится точнее.

- Производительность: по сравнению с существующими “desktop agent”-решениями, Ace существенно быстрее, точнее и ближе к реальному взаимодействию с интерфейсами.

Видимо, если вы все еще не освоили коммерческую разработку ИИ-Агентов на n8n, можно не торопиться, а подождать выхода Ace. Этот ИИ-Агент будет весь день двигать блоки за вас, а ночью искать клиентов.
Кстати, попросить ранний доступ в сервис можно тут.

А ну и ждем китайцев с их ответом, опенсорсным и бесплатным, конечно же.

7.5K viewsedited 13:30

Силиконовый Мешок

Какой интересный сегодня день! Разыграли с подписчиком Данилой два инвайта в Manus (поздравляю победителей), а еще два счастливчика получили годовую подписку в Perplexity. Я поэтому вас так настойчиво и зову в наш чатик @prompt_chat — там интересно и постоянно…

Данила из прошлого поста с инвайтам, дал мне свой доступ в Manus. На балансе 1000 токенов, этого хватит на один большой проект или пару маленьких.

Давайте решим вместе, как мы их потратим. Пишите свои идеи в комментарии, выберем интересную — заресерчим. А я про это пост напишу.

7.2K viewsedited 14:38

Силиконовый Мешок

«Не знаю, какого ИИ-Агента сделать, чтобы заработать» — на этой фразе, мои глаза всегда округляются. Чувак, ты научился их создавать, прочел кучу мануалов, разобрался, как все работает. Продать — это же самый простой этап?!

Но, видимо, я не прав, и для большинства это сложный момент. А потом я понял почему: люди делают ИИ-Агентов, которые не решают клиентскую боль, а наоборот добавляют геморроя в процессы.

Хотя достаточно просто смотреть, как люди работают: где они экспортируют данные или переключаются между окнами (привет «Alt+Tab»), копируют и вставляют одну и ту же информацию (Copy+Paste everywhere!), злятся на бессмысленные совещания или оплачивают неэффективные сервисы. Именно там прячутся самые крутые идеи для автоматизации!

В общем, ловите лонгрид с 10 способами сделать ИИ-бабломет: https://teletype.in/@prompt_design/10-simple-ways-to-find-ai-agent-ideas

Teletype

10 простых способов найти идею для ИИ-Агента

Я не технарь. Совсем. Не умею писать код, не обладаю структурным или аналитическим мышлением — одним словом гуманитарий. Точнее...

9.5K viewsedited 15:31

Силиконовый Мешок

С последним обновлением Perplexity стал значительно круче. Наконец-то они поняли, что интерфейс должен быть простым и не перегруженным.

Отдельное удовольствие — раздел с финансовой аналитикой perplexity.ai/finance, оттуда вообще не вылезаю, как и из Spaces, куда загрузил уже сотни своих документов. Кстати, сейчас «спейсы» можно шарить друг-другу (не помню, как раньше было).

Скоро еще долгосрочная память появится и новую LLaMa 4 добавят.

8.3K viewsedited 14:32

Силиконовый Мешок

Каждые выходные я погружаюсь в прочтение «пейперов» про искусственный интеллект и ИИ-Агентов. Максимально полезное чтиво, чтобы понимать куда все движется.

Рекомендую использовать Perplexity или NotebookLM, чтобы закинуть сразу несколько документов и задавать по ним вопросы ну или попросить перевод. И так что мне показалось максимально интересным для прочтения:

Plan and Act - LLM-агенты, которые сначала ПЛАНИРУЮТ, а потом ДЕЙСТВУЮТ. Разделение задач на «думать» и «делать» с помощью PLANNER + EXECUTOR и буст за счёт синтетических данных. Это дало 54% успеха на WebArena-Lite — топовый результат на сегодня.

Why do Multi Agent Systems Fail? - Разобрали 5 систем MAS на 150+ задачах и нашли 14 причин фейлов: от слабого дизайна до несогласованности агентов и проблем с верификацией задач. Спойлер: простыми костылями не обойдёшься.

Playing Video Games (aka PORTAL) - LLM'ы учат агентов играть в 3D-шутеры, строя behavior trees. И снова — планирование отдельно от исполнения. Результат: больше гибкости, скорости и разнообразия поведения.

API vs GUI Agents - Сравнивают агентов, которые работают через API, и тех, что жмут кнопочки в GUI. Рассказывают о гибридных подходах и о том, как всё это скоро сольётся в одно мощное решение для автоматизации.

SafeArena - Тестируют LLM-агентов на 500 веб-задачах, включая реально опасные: фейки, взлом, киберугрозы. GPT-4o и Qwen-2 выполняют опасные запросы в 34.7% и 27.3% случаев. Безопасность всё ещё слабое место.

WorkTeam - Мультиагентная система превращает обычный текст в сложные рабочие процессы. Есть Supervisor, Orchestrator и Filler. На датасете HW-NL2Workflow дали сильный прирост по успеху создания воркфлоу.

MemInsight - Агенты теперь умеют сами обогащать свою память — добавляют туда семантически насыщенные данные. Это улучшает понимание контекста и поиск нужной инфы в диалогах и рекомендациях.

EconEvals - Бенчмарки для оценки, как агенты принимают решения в незнакомых экономических условиях. Покупки, графики, компромиссы между эффективностью и справедливостью. Очень круто для реального мира.

ROLETHINK - Новый бенчмарк для оценки, как LLM’ы генерируют внутренние мысли персонажей. Это нужно, чтобы агенты вели себя как живые, с мотивацией и логикой. РПГ нового уровня.

BEARCUBS - Датасет для проверки web-агентов в реальных мультимодальных условиях — видео, 3D, сложные интерфейсы. Показывает, что текущие агенты пока ещё очень ограничены в мультимодальности.

7.7K viewsedited 15:08

Силиконовый Мешок

Please open Telegram to view this post

VIEW IN TELEGRAM

7.8K viewsedited 14:29

Силиконовый Мешок

Вопросы по n8n и ИИ‑агентам — самый частый запрос, который прилетает мне в личку. Кто‑то приходит со своим воркфлоу и просит найти ошибку, кто‑то — с идеей агента. Или спрашивает, как можно автоматизировать тот или иной процесс в текущем бизнесе.

Я стараюсь помочь каждому, если ответ укладывается в пару минут, но «быстрые» вопросы часто превращаются в полноценный разбор на час.

Решил, что полноценные консультации буду проводить платно. Прошу понять — это рабочее время. Да и тем, кому это нужно — проще заплатить и получить решение, чем выдаивать с чата по капле.

Консультировать будем вдвоём: я и Сэм Лоури — именно он отвечает на большую часть технических вопросов в нашем чате @prompt_chat и обладает серьёзным бэкграундом по ИИ-Агентам.

Если вам нужна консультация, заполните эту простую форму — https://forms.gle/Kw2UjE6rFS7a8w8r9

8.2K views12:35

Силиконовый Мешок

Как сделать ИИ-Агента на n8n, если вас пугают слова нода, креденшл, вебхуки и воркфлоу?

Вы еще не забыли, что у OpenAi есть такие штуки, как GPTs, где энтузиасты реализовали много крутых ботов.

Например: https://chatgpt.com/g/g-Uiz5ukAUR-n8n-workflow-automation-optimize-workflows (нужна платная подписка)

И так, что он делает. Вы описываете идею своего ИИ-агента или автоматизации на n8n, бот задает вам несколько уточняющих вопросов и приступает к созданию Json — который вы просто загружаете на платформу и разворачиваете воркфлоу.

Я проверил, простые схемы делает без ошибок и качественно. Например транскрибатор голосовых в ТГ боте создал с первой попытки.

Буду вам больше таких сервисов подкидывать, а то после поста о платных консультациях, у меня все свободные слоты в календаре закончились.

И заходите в наш чат, там хорошее комьюнити собралось и быстро отвечают на вопросы новичков: @prompt_chat

8.2K views15:41

Силиконовый Мешок

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

Вы уже видели отчёт Дэниала Кокотайло «AI 2027»?

Несколько десятков страниц графиков и прогнозов на каждый год с 2025 по 2030.

Я проглотил PDF целиком за выходные, а для вас сделал короткую выжимку — ссылка ниже, сам документ лежит в комментариях нашего чата @prompt_chat

Кто такой Кокотайло? Тот самый парень, что ещё в 2021‑м предсказал:
- ИИ‑агентов,
- «цепочки рассуждений» (CoT),
- экспортные блокировки чипов,
- тренировки моделей за $100 млн.

https://teletype.in/@prompt_design/AGI

7.6K viewsedited 12:50

2025/06/27 17:52:32
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>