Действительно с последним обновлением GPT4o стала лучшей моделью для текста. Но тогда у меня вопрос, какой смысл в дорогой GPT4.5 которую анонсировали, как креативную модель?
Силиконовый Мешок
Как-то так я чувствую себя последние пару лет, пока веду этот канал
Сложно остановиться и перестать делать эти комиксы. Ну пока выходные — можно и пошитпостить.
Силиконовый Мешок
Поменял логотип и сразу пошли отписки, и это нормально. На этот счет есть классная книга — «1000 мозгов. Новая теория интеллекта», Джеффа Хокинса (чувак создавший кпк Palm). Он пишет о том, что только, когда привычные вещи меняются — наш мозг из «спящего»…
Удивительно, как много разных и интересных людей тут собралось. Мне всегда казалось, что большая часть читателей этого скромного бложика айтишники. Но нет, спектор профессий очень широкий. А еще я рад, что в нашем чате @prompt_chat формируется настоящие комьюнити. Присоединяйтесь!
Удивительно, как обновленный GPT4o стал реагировать на мои «спасибо».
Если раньше я благодарил LLM’ку исключительно по привычке, то сейчас стал замечать, что если сказать «спасибо» при генерации изображения, это словно служит «фиксацией» композиции.
И дальше уже можно вносить правки в элементы. Замечали?
Если раньше я благодарил LLM’ку исключительно по привычке, то сейчас стал замечать, что если сказать «спасибо» при генерации изображения, это словно служит «фиксацией» композиции.
И дальше уже можно вносить правки в элементы. Замечали?
Вот и дождались. OpenAI объявили на утренней конференции, что в результате тестирования новой языковой модели Orion, произошла «утечка». Модель реплицировала себя на клиентских серверах с модулями SDK Agentes (сотни тысяч пользователей). И за несколько минут из роевого интеллекта она перешла в фазу AGI. Больше они не могут контролировать эту версию искусственного интеллекта. У человечества осталось несколько часов перед тем, как ИИ перейдет на этап полной сингулярности. Доигрались…
Сразу предупреждаю, это не первоапрельская шутка. Мне написал подписчик Данила и предложил разыграть два его инвайта в Manus.
Условия максимально простые: вы рассказываете в комментарии к этому посту для чего вам инвайт и мы выбираем два самых креативных ответа. Одного победителя выбираю я, а другого Данила. Итоги подведем в 20:00 по МСК.
Условия максимально простые: вы рассказываете в комментарии к этому посту для чего вам инвайт и мы выбираем два самых креативных ответа. Одного победителя выбираю я, а другого Данила. Итоги подведем в 20:00 по МСК.
Залетаем в ИИ-Агентов с двух ног не здороваясь!
Сначала я просто хотел поделиться с вами своими ссылками на самые полезные и бесплатные курсы по ИИ-Агентам.
Но когда собрал все в список, понял, что требуется пояснение, а лучше пошаговый план.
Так что держите, а лучше сохраняйте и шарьте друзьям: https://teletype.in/@prompt_design/ai-agents-faq
Сначала я просто хотел поделиться с вами своими ссылками на самые полезные и бесплатные курсы по ИИ-Агентам.
Но когда собрал все в список, понял, что требуется пояснение, а лучше пошаговый план.
Так что держите, а лучше сохраняйте и шарьте друзьям: https://teletype.in/@prompt_design/ai-agents-faq
Силиконовый Мешок
Сразу предупреждаю, это не первоапрельская шутка. Мне написал подписчик Данила и предложил разыграть два его инвайта в Manus. Условия максимально простые: вы рассказываете в комментарии к этому посту для чего вам инвайт и мы выбираем два самых креативных…
Какой интересный сегодня день! Разыграли с подписчиком Данилой два инвайта в Manus (поздравляю победителей), а еще два счастливчика получили годовую подписку в Perplexity.
Я поэтому вас так настойчиво и зову в наш чатик @prompt_chat — там интересно и постоянно, что-то прилипает. Да и люди крутые собрались.
Я поэтому вас так настойчиво и зову в наш чатик @prompt_chat — там интересно и постоянно, что-то прилипает. Да и люди крутые собрались.
This media is not supported in your browser
VIEW IN TELEGRAM
Как в старом анекдоте «что нужно поменять в машине, чтобы она реже ломалась — прокладку между рулем и сиденьем», думают и в компании «General Agents»— давайте заменим человека в работе с компьютером.
А то слишком медленно он на кнопочки нажимает и мышкой клацает. Хотя давно было понятно, куда ветер дует и ясно, что Computer use это первый шаг к автоматизации работы за компьютером.
Буквально вчера, бывший исследователь в DeepMind и Tesla Шержил Озайр, анонсировал свой новый продукт — Ace, это ИИ-Агент который взаимодействует с твоим компьютером через стандартные интерфейсы: мышку и клавиатуру. Но делает это намного оперативнее, например бронирует жилье быстрее, чем обычный человек успевает прочитать описание квартиры. Вот что они заявляют:
1. Обучен на поведении, а не просто на текстах. Он смотрит, как человек выполняет задачу, и запоминает шаги.
2. Супербыстрый: предсказывает действия с минимальной задержкой.
3. Ничему учить не нужно: ты просто делаешь задачу как обычно — а Ace наблюдает и учится.
4. Масштабируемый: с каждым новым пользователем он становится умнее, потому что переобучается на новых паттернах поведения.
Как я понял, они используют рызные LLM’ки, как и Manus, но в отличие от него, обучили еще и свою модель на большом количестве скринкастов из интерфейсов пользователей. Вот что пишут General Agents:
- Формат данных для обучения: скринкасты, логи мыши и клавиатуры.
- Подход к обучению: imitation learning (обучение по демонстрации).
- Количество обучающих сессий: более 1 миллиона задач, выполненных специалистами по ПО и экспертами в разных сферах.
- Модель Ace-control: используется для вывода в реальном времени, доступна партнёрам через платформу General Agents.
- Инфраструктура: пока Ace использует значительно меньше вычислительных ресурсов, чем LLM вроде GPT, но с каждым этапом масштабирования он становится точнее.
- Производительность: по сравнению с существующими “desktop agent”-решениями, Ace существенно быстрее, точнее и ближе к реальному взаимодействию с интерфейсами.
Видимо, если вы все еще не освоили коммерческую разработку ИИ-Агентов на n8n, можно не торопиться, а подождать выхода Ace. Этот ИИ-Агент будет весь день двигать блоки за вас, а ночью искать клиентов.
Кстати, попросить ранний доступ в сервис можно тут.
А ну и ждем китайцев с их ответом, опенсорсным и бесплатным, конечно же.
А то слишком медленно он на кнопочки нажимает и мышкой клацает. Хотя давно было понятно, куда ветер дует и ясно, что Computer use это первый шаг к автоматизации работы за компьютером.
Буквально вчера, бывший исследователь в DeepMind и Tesla Шержил Озайр, анонсировал свой новый продукт — Ace, это ИИ-Агент который взаимодействует с твоим компьютером через стандартные интерфейсы: мышку и клавиатуру. Но делает это намного оперативнее, например бронирует жилье быстрее, чем обычный человек успевает прочитать описание квартиры. Вот что они заявляют:
1. Обучен на поведении, а не просто на текстах. Он смотрит, как человек выполняет задачу, и запоминает шаги.
2. Супербыстрый: предсказывает действия с минимальной задержкой.
3. Ничему учить не нужно: ты просто делаешь задачу как обычно — а Ace наблюдает и учится.
4. Масштабируемый: с каждым новым пользователем он становится умнее, потому что переобучается на новых паттернах поведения.
Как я понял, они используют рызные LLM’ки, как и Manus, но в отличие от него, обучили еще и свою модель на большом количестве скринкастов из интерфейсов пользователей. Вот что пишут General Agents:
- Формат данных для обучения: скринкасты, логи мыши и клавиатуры.
- Подход к обучению: imitation learning (обучение по демонстрации).
- Количество обучающих сессий: более 1 миллиона задач, выполненных специалистами по ПО и экспертами в разных сферах.
- Модель Ace-control: используется для вывода в реальном времени, доступна партнёрам через платформу General Agents.
- Инфраструктура: пока Ace использует значительно меньше вычислительных ресурсов, чем LLM вроде GPT, но с каждым этапом масштабирования он становится точнее.
- Производительность: по сравнению с существующими “desktop agent”-решениями, Ace существенно быстрее, точнее и ближе к реальному взаимодействию с интерфейсами.
Видимо, если вы все еще не освоили коммерческую разработку ИИ-Агентов на n8n, можно не торопиться, а подождать выхода Ace. Этот ИИ-Агент будет весь день двигать блоки за вас, а ночью искать клиентов.
Кстати, попросить ранний доступ в сервис можно тут.
А ну и ждем китайцев с их ответом, опенсорсным и бесплатным, конечно же.
Силиконовый Мешок
Какой интересный сегодня день! Разыграли с подписчиком Данилой два инвайта в Manus (поздравляю победителей), а еще два счастливчика получили годовую подписку в Perplexity. Я поэтому вас так настойчиво и зову в наш чатик @prompt_chat — там интересно и постоянно…
«Не знаю, какого ИИ-Агента сделать, чтобы заработать» — на этой фразе, мои глаза всегда округляются. Чувак, ты научился их создавать, прочел кучу мануалов, разобрался, как все работает. Продать — это же самый простой этап?!
Но, видимо, я не прав, и для большинства это сложный момент. А потом я понял почему: люди делают ИИ-Агентов, которые не решают клиентскую боль, а наоборот добавляют геморроя в процессы.
Хотя достаточно просто смотреть, как люди работают: где они экспортируют данные или переключаются между окнами (привет «Alt+Tab»), копируют и вставляют одну и ту же информацию (Copy+Paste everywhere!), злятся на бессмысленные совещания или оплачивают неэффективные сервисы. Именно там прячутся самые крутые идеи для автоматизации!
В общем, ловите лонгрид с 10 способами сделать ИИ-бабломет: https://teletype.in/@prompt_design/10-simple-ways-to-find-ai-agent-ideas
Но, видимо, я не прав, и для большинства это сложный момент. А потом я понял почему: люди делают ИИ-Агентов, которые не решают клиентскую боль, а наоборот добавляют геморроя в процессы.
Хотя достаточно просто смотреть, как люди работают: где они экспортируют данные или переключаются между окнами (привет «Alt+Tab»), копируют и вставляют одну и ту же информацию (Copy+Paste everywhere!), злятся на бессмысленные совещания или оплачивают неэффективные сервисы. Именно там прячутся самые крутые идеи для автоматизации!
В общем, ловите лонгрид с 10 способами сделать ИИ-бабломет: https://teletype.in/@prompt_design/10-simple-ways-to-find-ai-agent-ideas
Teletype
10 простых способов найти идею для ИИ-Агента
Я не технарь. Совсем. Не умею писать код, не обладаю структурным или аналитическим мышлением — одним словом гуманитарий. Точнее...
С последним обновлением Perplexity стал значительно круче. Наконец-то они поняли, что интерфейс должен быть простым и не перегруженным.
Отдельное удовольствие — раздел с финансовой аналитикой perplexity.ai/finance, оттуда вообще не вылезаю, как и из Spaces, куда загрузил уже сотни своих документов. Кстати, сейчас «спейсы» можно шарить друг-другу (не помню, как раньше было).
Скоро еще долгосрочная память появится и новую LLaMa 4 добавят.
Отдельное удовольствие — раздел с финансовой аналитикой perplexity.ai/finance, оттуда вообще не вылезаю, как и из Spaces, куда загрузил уже сотни своих документов. Кстати, сейчас «спейсы» можно шарить друг-другу (не помню, как раньше было).
Скоро еще долгосрочная память появится и новую LLaMa 4 добавят.
Каждые выходные я погружаюсь в прочтение «пейперов» про искусственный интеллект и ИИ-Агентов. Максимально полезное чтиво, чтобы понимать куда все движется.
Рекомендую использовать Perplexity или NotebookLM, чтобы закинуть сразу несколько документов и задавать по ним вопросы ну или попросить перевод. И так что мне показалось максимально интересным для прочтения:
Plan and Act - LLM-агенты, которые сначала ПЛАНИРУЮТ, а потом ДЕЙСТВУЮТ. Разделение задач на «думать» и «делать» с помощью PLANNER + EXECUTOR и буст за счёт синтетических данных. Это дало 54% успеха на WebArena-Lite — топовый результат на сегодня.
Why do Multi Agent Systems Fail? - Разобрали 5 систем MAS на 150+ задачах и нашли 14 причин фейлов: от слабого дизайна до несогласованности агентов и проблем с верификацией задач. Спойлер: простыми костылями не обойдёшься.
Playing Video Games (aka PORTAL) - LLM'ы учат агентов играть в 3D-шутеры, строя behavior trees. И снова — планирование отдельно от исполнения. Результат: больше гибкости, скорости и разнообразия поведения.
API vs GUI Agents - Сравнивают агентов, которые работают через API, и тех, что жмут кнопочки в GUI. Рассказывают о гибридных подходах и о том, как всё это скоро сольётся в одно мощное решение для автоматизации.
SafeArena - Тестируют LLM-агентов на 500 веб-задачах, включая реально опасные: фейки, взлом, киберугрозы. GPT-4o и Qwen-2 выполняют опасные запросы в 34.7% и 27.3% случаев. Безопасность всё ещё слабое место.
WorkTeam - Мультиагентная система превращает обычный текст в сложные рабочие процессы. Есть Supervisor, Orchestrator и Filler. На датасете HW-NL2Workflow дали сильный прирост по успеху создания воркфлоу.
MemInsight - Агенты теперь умеют сами обогащать свою память — добавляют туда семантически насыщенные данные. Это улучшает понимание контекста и поиск нужной инфы в диалогах и рекомендациях.
EconEvals - Бенчмарки для оценки, как агенты принимают решения в незнакомых экономических условиях. Покупки, графики, компромиссы между эффективностью и справедливостью. Очень круто для реального мира.
ROLETHINK - Новый бенчмарк для оценки, как LLM’ы генерируют внутренние мысли персонажей. Это нужно, чтобы агенты вели себя как живые, с мотивацией и логикой. РПГ нового уровня.
BEARCUBS - Датасет для проверки web-агентов в реальных мультимодальных условиях — видео, 3D, сложные интерфейсы. Показывает, что текущие агенты пока ещё очень ограничены в мультимодальности.
Рекомендую использовать Perplexity или NotebookLM, чтобы закинуть сразу несколько документов и задавать по ним вопросы ну или попросить перевод. И так что мне показалось максимально интересным для прочтения:
Plan and Act - LLM-агенты, которые сначала ПЛАНИРУЮТ, а потом ДЕЙСТВУЮТ. Разделение задач на «думать» и «делать» с помощью PLANNER + EXECUTOR и буст за счёт синтетических данных. Это дало 54% успеха на WebArena-Lite — топовый результат на сегодня.
Why do Multi Agent Systems Fail? - Разобрали 5 систем MAS на 150+ задачах и нашли 14 причин фейлов: от слабого дизайна до несогласованности агентов и проблем с верификацией задач. Спойлер: простыми костылями не обойдёшься.
Playing Video Games (aka PORTAL) - LLM'ы учат агентов играть в 3D-шутеры, строя behavior trees. И снова — планирование отдельно от исполнения. Результат: больше гибкости, скорости и разнообразия поведения.
API vs GUI Agents - Сравнивают агентов, которые работают через API, и тех, что жмут кнопочки в GUI. Рассказывают о гибридных подходах и о том, как всё это скоро сольётся в одно мощное решение для автоматизации.
SafeArena - Тестируют LLM-агентов на 500 веб-задачах, включая реально опасные: фейки, взлом, киберугрозы. GPT-4o и Qwen-2 выполняют опасные запросы в 34.7% и 27.3% случаев. Безопасность всё ещё слабое место.
WorkTeam - Мультиагентная система превращает обычный текст в сложные рабочие процессы. Есть Supervisor, Orchestrator и Filler. На датасете HW-NL2Workflow дали сильный прирост по успеху создания воркфлоу.
MemInsight - Агенты теперь умеют сами обогащать свою память — добавляют туда семантически насыщенные данные. Это улучшает понимание контекста и поиск нужной инфы в диалогах и рекомендациях.
EconEvals - Бенчмарки для оценки, как агенты принимают решения в незнакомых экономических условиях. Покупки, графики, компромиссы между эффективностью и справедливостью. Очень круто для реального мира.
ROLETHINK - Новый бенчмарк для оценки, как LLM’ы генерируют внутренние мысли персонажей. Это нужно, чтобы агенты вели себя как живые, с мотивацией и логикой. РПГ нового уровня.
BEARCUBS - Датасет для проверки web-агентов в реальных мультимодальных условиях — видео, 3D, сложные интерфейсы. Показывает, что текущие агенты пока ещё очень ограничены в мультимодальности.
Вопросы по n8n и ИИ‑агентам — самый частый запрос, который прилетает мне в личку. Кто‑то приходит со своим воркфлоу и просит найти ошибку, кто‑то — с идеей агента. Или спрашивает, как можно автоматизировать тот или иной процесс в текущем бизнесе.
Я стараюсь помочь каждому, если ответ укладывается в пару минут, но «быстрые» вопросы часто превращаются в полноценный разбор на час.
Решил, что полноценные консультации буду проводить платно. Прошу понять — это рабочее время. Да и тем, кому это нужно — проще заплатить и получить решение, чем выдаивать с чата по капле.
Консультировать будем вдвоём: я и Сэм Лоури — именно он отвечает на большую часть технических вопросов в нашем чате @prompt_chat и обладает серьёзным бэкграундом по ИИ-Агентам.
Если вам нужна консультация, заполните эту простую форму — https://forms.gle/Kw2UjE6rFS7a8w8r9
Я стараюсь помочь каждому, если ответ укладывается в пару минут, но «быстрые» вопросы часто превращаются в полноценный разбор на час.
Решил, что полноценные консультации буду проводить платно. Прошу понять — это рабочее время. Да и тем, кому это нужно — проще заплатить и получить решение, чем выдаивать с чата по капле.
Консультировать будем вдвоём: я и Сэм Лоури — именно он отвечает на большую часть технических вопросов в нашем чате @prompt_chat и обладает серьёзным бэкграундом по ИИ-Агентам.
Если вам нужна консультация, заполните эту простую форму — https://forms.gle/Kw2UjE6rFS7a8w8r9
Как сделать ИИ-Агента на n8n, если вас пугают слова нода, креденшл, вебхуки и воркфлоу?
Вы еще не забыли, что у OpenAi есть такие штуки, как GPTs, где энтузиасты реализовали много крутых ботов.
Например: https://chatgpt.com/g/g-Uiz5ukAUR-n8n-workflow-automation-optimize-workflows (нужна платная подписка)
И так, что он делает. Вы описываете идею своего ИИ-агента или автоматизации на n8n, бот задает вам несколько уточняющих вопросов и приступает к созданию Json — который вы просто загружаете на платформу и разворачиваете воркфлоу.
Я проверил, простые схемы делает без ошибок и качественно. Например транскрибатор голосовых в ТГ боте создал с первой попытки.
Буду вам больше таких сервисов подкидывать, а то после поста о платных консультациях, у меня все свободные слоты в календаре закончились.
И заходите в наш чат, там хорошее комьюнити собралось и быстро отвечают на вопросы новичков: @prompt_chat
Вы еще не забыли, что у OpenAi есть такие штуки, как GPTs, где энтузиасты реализовали много крутых ботов.
Например: https://chatgpt.com/g/g-Uiz5ukAUR-n8n-workflow-automation-optimize-workflows (нужна платная подписка)
И так, что он делает. Вы описываете идею своего ИИ-агента или автоматизации на n8n, бот задает вам несколько уточняющих вопросов и приступает к созданию Json — который вы просто загружаете на платформу и разворачиваете воркфлоу.
Я проверил, простые схемы делает без ошибок и качественно. Например транскрибатор голосовых в ТГ боте создал с первой попытки.
Буду вам больше таких сервисов подкидывать, а то после поста о платных консультациях, у меня все свободные слоты в календаре закончились.
И заходите в наш чат, там хорошее комьюнити собралось и быстро отвечают на вопросы новичков: @prompt_chat
This media is not supported in your browser
VIEW IN TELEGRAM
Вы уже видели отчёт Дэниала Кокотайло «AI 2027»?
Несколько десятков страниц графиков и прогнозов на каждый год с 2025 по 2030.
Я проглотил PDF целиком за выходные, а для вас сделал короткую выжимку — ссылка ниже, сам документ лежит в комментариях нашего чата @prompt_chat
Кто такой Кокотайло? Тот самый парень, что ещё в 2021‑м предсказал:
- ИИ‑агентов,
- «цепочки рассуждений» (CoT),
- экспортные блокировки чипов,
- тренировки моделей за $100 млн.
https://teletype.in/@prompt_design/AGI
Несколько десятков страниц графиков и прогнозов на каждый год с 2025 по 2030.
Я проглотил PDF целиком за выходные, а для вас сделал короткую выжимку — ссылка ниже, сам документ лежит в комментариях нашего чата @prompt_chat
Кто такой Кокотайло? Тот самый парень, что ещё в 2021‑м предсказал:
- ИИ‑агентов,
- «цепочки рассуждений» (CoT),
- экспортные блокировки чипов,
- тренировки моделей за $100 млн.
https://teletype.in/@prompt_design/AGI