Telegram Web
За пару месяцев я пообщался с большим количеством людей, которые задавали один и тот же вопрос разными словами: «Я хочу внедрять ИИ‑агентов, автоматизацию, n8n и вообще залететь в эту тему с ИИ, но не понимаю, с чего начать!». Первым делом мы выясняли, что человеку ближе — искать заказы или выполнять их.

Условно делю всех на две категории: Мастера и Стратеги. Первые умеют создавать автоматизации и внедрять их, а вторые — продавать. Поэтому я решил написать подробный пост о том, как понять, кто ты, и какие скиллы качать, чтобы вкатиться в ИИ‑автоматизацию в наиболее естественной для себя роли.

https://teletype.in/@prompt_design/how_to_make_money_with_automation_and_n8n
Привет, это samlowry!

Когда Тёма написал пост про то, что мы возобновляем консультации из 12 обратившихся 5 задали вопрос о примерах автоматизаций, которые мы делаем. Действительно, подумал я, а давай-ка я начну вести на канале рубрику, в которой буду рассказывать какие-то детали о том, как мы делали тот или иной проект.

Итак, проект первый, публикую с разрешения заказчика

Нужно было разработать автоматизацию с использованием нейросетей для анализа рекламных картинок и видео. Автоматизация должна работать в n8n для удобства заказчика, нужно сканировать корпоративный Google Drive и в нём обрабатывать все файлы, отвечающие корпоративной системе наименования.

Каждый рекламный креатив нужно анализировать по проприетарной системе заказчика и заносить полученные параметры в соответствующие поля Google Spreadsheet.

В проекте было 2 интересных места:

Анализ видео Gemini
Слава силиконовым богам, уже не надо резать видео на опорные кадры и заливать кучу файлов в LLM — в Gemini 1) можно просто сначала кинуть видеофайл, 2) дождаться его распаковки, 3) задавать вопросы по загруженному видео.

Как водится, у n8n пока что нет полной поддержки API Gemini, поэтому городить интеграцию с Gemini API для залива видосов пришлось вручную.

Ну а дальше — дело промпта
Так как у нас вполне себе структурированный отчёт, то юзаем структурированный вывод в JSON. В случае с Gemini для этого достаточно указать в промпте "Return ONLY a valid JSON object (no markdown wrappers, no extra text, no explanations) matching the following schema" ну и задать правильное описание формата JSON - schema - это для вас может сгенерить любая LLM.

Основные танцы с бубном начались с доработкой промпта — чтобы в полях JSON были именно те показатели и выжимки, какие надо, а не те, какими их видит Gemini. Как обычно, пришлось маскимально точно формализовать, что же именно такое есть эти показатели. Для списка жанров рекламы в промпт пришлось добавить таблицу-справочник, где каждый жанр подробно формально расписан. Естественно, мы бы не смогли сделать этого сами без плотной работы с заказчиком.

Смешной/поучительный момент
Пока искал, как заливать файлы, нашёл, как «в интернетах пишутьб»:
- что ссылки на видео на Google Drive в промпте Gemini качает и обрабатывает
- нет, не те ссылки — а ссылки на Google Buckets

Друзья, будьте внимательны к подобным советам: если для http:// ссылок в промпте юзерский интерфейс Gemini сразу показал пометку о том, что ссылки не поддерживаются — то для gs:// всё прошло гладко, и только через несколько тестов я расстроился из-за того, что не то, что все параметры плавали — плавала даже цифра протяжённости видео, а судя по ризонингу Gemini использует линуксовую утилиту ffprobe и там всё должно быть мегаточно.

Читая портянки ризонинга я наткнулся на внутренний диалог Gemini о том, что он не может качать файлы с гуглбакета, поэтому он попытается проанализировать файл, основываясь на его названии. Результат был так правдоподобен, что я не сразу заметил, что нейросеть придумывает отчёты!

Обход всех низлежаших папок Google Drive
Это был второй интересный момент, я использовал запретную рекурсию — дочерний воркфлоу вызывает сам себя каждый раз, когда натыкается на новую папку. Сколько папок вложенности — столько и будет в один момент висеть воркфлоу в работе. Для n8n этот метод будет упираться в их платные ограничения, проблема решается установкой n8n на свой хост.

И именно поэтому рекурсия — довольно нелюбимый алгоритм в программировании. Тяжело отлаживать, тяжело читать, легко профукать ресурсы.

Но для ограниченной парадигмы langchain/langgraph нод n8n, к сожалению, это наиболее простой в исполнении трюк.

Результат
Сейчас клиент проводит полное сканирование всей корпоративной базы рекламных креативов для последующего анализа полученных отчётов.
Стрим провели, а теперь интересно — сможем ли офлайн замутить. Поэтому опрос: где вы живёте?
Anonymous Poll
29%
Москва
6%
Пхукет
65%
Другое
Кто еще не заметил, в нашем чате @prompt_chat сидит бот, зафайнтюненый на авторском стиле, а еще у него RAG со всеми постами из этого канала. Не пугайтесь, если на ваш вопрос первым делом ответит именно он. Вообще можете задавать разное каверзное в чате, посмотрим, как справится.
This media is not supported in your browser
VIEW IN TELEGRAM
Как же я сегодня намучился с этими очками. И регион поменяй, и старые подписки отмени. Но вроде все заработало, кстати, проще всего новый аккаунт для Apple ID регистрировать в Apple Music, это мне ChatGPT подсказал. Ну что еще один канал сбора для «Поминики» — активирован.

Ах, да, если что девайс называется — Ray-Ban Wayfarer
Попросил у ChatGPT сделать мне фоточки в стиле рентгеновского снимка. Прикольно. Вот промпт: «generate a x-ray version of this photo».
Мне очень понравился этот конспект по LLM, который сделали ребята. Там вся базовая информация, на русском языке и с картинками. PDF’ку закину в комментарии.
OpenAI запустили стрим и рассказывают о новом продуете для разработчиков: https://youtu.be/hhdpnbfH6NU
Делайте со мной, что хотите, но я никогда не пойму, зачем начинающие «автоматизаторы» собирают монструозные воркфлоу из сотен нод. Эти конструкции разваливаются при первом же продакшене.

Я уже много раз писал, но давайте еще раз: для первого проекта начни с агента под конкретное действие. Например, «собрать лиды из LinkedIn в Google Sheets» или «сгенерить черновик поста в блог».

1. Одна «микрозадача». Собери агента под одно действие («сделать пост в блог», «скинуть лиды в таблицу»).
2. Блок-схема. Просто нарисуй на бумажке блоки: получить данные → обработать → отправить.
3. MVP — че тут думать, начинаем с классики:
— n8n https://n8n.io — open-source drag-and-drop, в любой ноде можно дописать на JS.
— Make https://make.com — SaaS-конструктор с модулем AI Agents прямо в браузере.
Воркфлоу: Webhook → LLM-нода → Google Sheets или Notion.
4. Human loop. Вставь себя в разрыв цепочки процесса. Сначала результат летит тебе в Telegram, там его апрувишь или блочишь. Когда апрув без правок стабильно > 80 %, убираешь ручной стоп-кран.
5. Тест × 20. Прогони поток двадцать раз — этого достаточно, чтобы увидеть реальный расход токенов и время. Так как бывает, что расход по токенам выше стоимости ручного труда. Тогда сужай задачу.
6. Инструменты и аналоги n8n.
— Flowise https://flowiseai.com или LangFlow https://langflow.org — примерно как n8n и RAG.
— aiXplain https://aixplain.com/studio/design — можно быстро менять модели без кода.
— Apify https://apify.com/templates/python-langgraph — деплой как Actor с оплатой за запуск.
— Orkes https://orkes.io или VoltAgent https://github.com/VoltAgent/voltagent — когда нужен серверный масштаб и логирование.

Вот еще посты на тему:
1. Больше 250 воркфлоу, которыми можно «вдохноаляться» - https://www.tgoop.com/prompt_design/1372
2. Как продавать ИИ-Агентов - https://www.tgoop.com/prompt_design/1344
3. Как погрузиться в ИИ и ИИ-Агентов - https://www.tgoop.com/prompt_design/1343
4. Как внедрять ИИ-Агентов в бизнес-процессы - https://www.tgoop.com/prompt_design/1335
5. Гайд по n8n в картинках - https://www.tgoop.com/prompt_design/1332
6. Как найти идею для ИИ-Агента - https://www.tgoop.com/prompt_design/1303
2025/06/25 18:46:14
Back to Top
HTML Embed Code: