За пару месяцев я пообщался с большим количеством людей, которые задавали один и тот же вопрос разными словами: «Я хочу внедрять ИИ‑агентов, автоматизацию, n8n и вообще залететь в эту тему с ИИ, но не понимаю, с чего начать!». Первым делом мы выясняли, что человеку ближе — искать заказы или выполнять их.
Условно делю всех на две категории: Мастера и Стратеги. Первые умеют создавать автоматизации и внедрять их, а вторые — продавать. Поэтому я решил написать подробный пост о том, как понять, кто ты, и какие скиллы качать, чтобы вкатиться в ИИ‑автоматизацию в наиболее естественной для себя роли.
https://teletype.in/@prompt_design/how_to_make_money_with_automation_and_n8n
Условно делю всех на две категории: Мастера и Стратеги. Первые умеют создавать автоматизации и внедрять их, а вторые — продавать. Поэтому я решил написать подробный пост о том, как понять, кто ты, и какие скиллы качать, чтобы вкатиться в ИИ‑автоматизацию в наиболее естественной для себя роли.
https://teletype.in/@prompt_design/how_to_make_money_with_automation_and_n8n
Teletype
Как зарабатывать на автоматизации и n8n: путь Мастера и Стратега
Автоматизация — не волшебство, но выглядит именно так, когда видишь её в деле. Процессы летят быстрее, человеческие ошибки исчезают...
Привет, это samlowry!
Когда Тёма написал пост про то, что мы возобновляем консультации из 12 обратившихся 5 задали вопрос о примерах автоматизаций, которые мы делаем. Действительно, подумал я, а давай-ка я начну вести на канале рубрику, в которой буду рассказывать какие-то детали о том, как мы делали тот или иной проект.
Итак, проект первый, публикую с разрешения заказчика
Нужно было разработать автоматизацию с использованием нейросетей для анализа рекламных картинок и видео. Автоматизация должна работать в n8n для удобства заказчика, нужно сканировать корпоративный Google Drive и в нём обрабатывать все файлы, отвечающие корпоративной системе наименования.
Каждый рекламный креатив нужно анализировать по проприетарной системе заказчика и заносить полученные параметры в соответствующие поля Google Spreadsheet.
В проекте было 2 интересных места:
Анализ видео Gemini
Слава силиконовым богам, уже не надо резать видео на опорные кадры и заливать кучу файлов в LLM — в Gemini 1) можно просто сначала кинуть видеофайл, 2) дождаться его распаковки, 3) задавать вопросы по загруженному видео.
Как водится, у n8n пока что нет полной поддержки API Gemini, поэтому городить интеграцию с Gemini API для залива видосов пришлось вручную.
Ну а дальше — дело промпта
Так как у нас вполне себе структурированный отчёт, то юзаем структурированный вывод в JSON. В случае с Gemini для этого достаточно указать в промпте "Return ONLY a valid JSON object (no markdown wrappers, no extra text, no explanations) matching the following schema" ну и задать правильное описание формата JSON - schema - это для вас может сгенерить любая LLM.
Основные танцы с бубном начались с доработкой промпта — чтобы в полях JSON были именно те показатели и выжимки, какие надо, а не те, какими их видит Gemini. Как обычно, пришлось маскимально точно формализовать, что же именно такое есть эти показатели. Для списка жанров рекламы в промпт пришлось добавить таблицу-справочник, где каждый жанр подробно формально расписан. Естественно, мы бы не смогли сделать этого сами без плотной работы с заказчиком.
Смешной/поучительный момент
Пока искал, как заливать файлы, нашёл, как «в интернетах пишутьб»:
- что ссылки на видео на Google Drive в промпте Gemini качает и обрабатывает
- нет, не те ссылки — а ссылки на Google Buckets
Друзья, будьте внимательны к подобным советам: если для http:// ссылок в промпте юзерский интерфейс Gemini сразу показал пометку о том, что ссылки не поддерживаются — то для gs:// всё прошло гладко, и только через несколько тестов я расстроился из-за того, что не то, что все параметры плавали — плавала даже цифра протяжённости видео, а судя по ризонингу Gemini использует линуксовую утилиту ffprobe и там всё должно быть мегаточно.
Читая портянки ризонинга я наткнулся на внутренний диалог Gemini о том, что он не может качать файлы с гуглбакета, поэтому он попытается проанализировать файл, основываясь на его названии. Результат был так правдоподобен, что я не сразу заметил, что нейросеть придумывает отчёты!
Обход всех низлежаших папок Google Drive
Это был второй интересный момент, я использовал запретную рекурсию — дочерний воркфлоу вызывает сам себя каждый раз, когда натыкается на новую папку. Сколько папок вложенности — столько и будет в один момент висеть воркфлоу в работе. Для n8n этот метод будет упираться в их платные ограничения, проблема решается установкой n8n на свой хост.
И именно поэтому рекурсия — довольно нелюбимый алгоритм в программировании. Тяжело отлаживать, тяжело читать, легко профукать ресурсы.
Но для ограниченной парадигмы
Результат
Сейчас клиент проводит полное сканирование всей корпоративной базы рекламных креативов для последующего анализа полученных отчётов.
Когда Тёма написал пост про то, что мы возобновляем консультации из 12 обратившихся 5 задали вопрос о примерах автоматизаций, которые мы делаем. Действительно, подумал я, а давай-ка я начну вести на канале рубрику, в которой буду рассказывать какие-то детали о том, как мы делали тот или иной проект.
Итак, проект первый, публикую с разрешения заказчика
Нужно было разработать автоматизацию с использованием нейросетей для анализа рекламных картинок и видео. Автоматизация должна работать в n8n для удобства заказчика, нужно сканировать корпоративный Google Drive и в нём обрабатывать все файлы, отвечающие корпоративной системе наименования.
Каждый рекламный креатив нужно анализировать по проприетарной системе заказчика и заносить полученные параметры в соответствующие поля Google Spreadsheet.
В проекте было 2 интересных места:
Анализ видео Gemini
Слава силиконовым богам, уже не надо резать видео на опорные кадры и заливать кучу файлов в LLM — в Gemini 1) можно просто сначала кинуть видеофайл, 2) дождаться его распаковки, 3) задавать вопросы по загруженному видео.
Как водится, у n8n пока что нет полной поддержки API Gemini, поэтому городить интеграцию с Gemini API для залива видосов пришлось вручную.
Ну а дальше — дело промпта
Так как у нас вполне себе структурированный отчёт, то юзаем структурированный вывод в JSON. В случае с Gemini для этого достаточно указать в промпте "Return ONLY a valid JSON object (no markdown wrappers, no extra text, no explanations) matching the following schema" ну и задать правильное описание формата JSON - schema - это для вас может сгенерить любая LLM.
Основные танцы с бубном начались с доработкой промпта — чтобы в полях JSON были именно те показатели и выжимки, какие надо, а не те, какими их видит Gemini. Как обычно, пришлось маскимально точно формализовать, что же именно такое есть эти показатели. Для списка жанров рекламы в промпт пришлось добавить таблицу-справочник, где каждый жанр подробно формально расписан. Естественно, мы бы не смогли сделать этого сами без плотной работы с заказчиком.
Смешной/поучительный момент
Пока искал, как заливать файлы, нашёл, как «в интернетах пишутьб»:
- что ссылки на видео на Google Drive в промпте Gemini качает и обрабатывает
- нет, не те ссылки — а ссылки на Google Buckets
Друзья, будьте внимательны к подобным советам: если для http:// ссылок в промпте юзерский интерфейс Gemini сразу показал пометку о том, что ссылки не поддерживаются — то для gs:// всё прошло гладко, и только через несколько тестов я расстроился из-за того, что не то, что все параметры плавали — плавала даже цифра протяжённости видео, а судя по ризонингу Gemini использует линуксовую утилиту ffprobe и там всё должно быть мегаточно.
Читая портянки ризонинга я наткнулся на внутренний диалог Gemini о том, что он не может качать файлы с гуглбакета, поэтому он попытается проанализировать файл, основываясь на его названии. Результат был так правдоподобен, что я не сразу заметил, что нейросеть придумывает отчёты!
Обход всех низлежаших папок Google Drive
Это был второй интересный момент, я использовал запретную рекурсию — дочерний воркфлоу вызывает сам себя каждый раз, когда натыкается на новую папку. Сколько папок вложенности — столько и будет в один момент висеть воркфлоу в работе. Для n8n этот метод будет упираться в их платные ограничения, проблема решается установкой n8n на свой хост.
И именно поэтому рекурсия — довольно нелюбимый алгоритм в программировании. Тяжело отлаживать, тяжело читать, легко профукать ресурсы.
Но для ограниченной парадигмы
langchain/langgraph
нод n8n, к сожалению, это наиболее простой в исполнении трюк.Результат
Сейчас клиент проводит полное сканирование всей корпоративной базы рекламных креативов для последующего анализа полученных отчётов.
Стрим провели, а теперь интересно — сможем ли офлайн замутить. Поэтому опрос: где вы живёте?
Anonymous Poll
29%
Москва
6%
Пхукет
65%
Другое
Кто еще не заметил, в нашем чате @prompt_chat сидит бот, зафайнтюненый на авторском стиле, а еще у него RAG со всеми постами из этого канала. Не пугайтесь, если на ваш вопрос первым делом ответит именно он. Вообще можете задавать разное каверзное в чате, посмотрим, как справится.
This media is not supported in your browser
VIEW IN TELEGRAM
Как же я сегодня намучился с этими очками. И регион поменяй, и старые подписки отмени. Но вроде все заработало, кстати, проще всего новый аккаунт для Apple ID регистрировать в Apple Music, это мне ChatGPT подсказал. Ну что еще один канал сбора для «Поминики» — активирован.
Ах, да, если что девайс называется — Ray-Ban Wayfarer
Ах, да, если что девайс называется — Ray-Ban Wayfarer
Попросил у ChatGPT сделать мне фоточки в стиле рентгеновского снимка. Прикольно. Вот промпт:
«generate a x-ray version of this photo»
.Мне очень понравился этот конспект по LLM, который сделали ребята. Там вся базовая информация, на русском языке и с картинками. PDF’ку закину в комментарии.
OpenAI запустили стрим и рассказывают о новом продуете для разработчиков: https://youtu.be/hhdpnbfH6NU
Делайте со мной, что хотите, но я никогда не пойму, зачем начинающие «автоматизаторы» собирают монструозные воркфлоу из сотен нод. Эти конструкции разваливаются при первом же продакшене.
Я уже много раз писал, но давайте еще раз: для первого проекта начни с агента под конкретное действие. Например, «собрать лиды из LinkedIn в Google Sheets» или «сгенерить черновик поста в блог».
1. Одна «микрозадача». Собери агента под одно действие («сделать пост в блог», «скинуть лиды в таблицу»).
2. Блок-схема. Просто нарисуй на бумажке блоки: получить данные → обработать → отправить.
3. MVP — че тут думать, начинаем с классики:
— n8n https://n8n.io — open-source drag-and-drop, в любой ноде можно дописать на JS.
— Make https://make.com — SaaS-конструктор с модулем AI Agents прямо в браузере.
Воркфлоу:
4. Human loop. Вставь себя в разрыв цепочки процесса. Сначала результат летит тебе в Telegram, там его апрувишь или блочишь. Когда апрув без правок стабильно > 80 %, убираешь ручной стоп-кран.
5. Тест × 20. Прогони поток двадцать раз — этого достаточно, чтобы увидеть реальный расход токенов и время. Так как бывает, что расход по токенам выше стоимости ручного труда. Тогда сужай задачу.
6. Инструменты и аналоги n8n.
— Flowise https://flowiseai.com или LangFlow https://langflow.org — примерно как n8n и RAG.
— aiXplain https://aixplain.com/studio/design — можно быстро менять модели без кода.
— Apify https://apify.com/templates/python-langgraph — деплой как Actor с оплатой за запуск.
— Orkes https://orkes.io или VoltAgent https://github.com/VoltAgent/voltagent — когда нужен серверный масштаб и логирование.
Вот еще посты на тему:
1. Больше 250 воркфлоу, которыми можно «вдохноаляться» - https://www.tgoop.com/prompt_design/1372
2. Как продавать ИИ-Агентов - https://www.tgoop.com/prompt_design/1344
3. Как погрузиться в ИИ и ИИ-Агентов - https://www.tgoop.com/prompt_design/1343
4. Как внедрять ИИ-Агентов в бизнес-процессы - https://www.tgoop.com/prompt_design/1335
5. Гайд по n8n в картинках - https://www.tgoop.com/prompt_design/1332
6. Как найти идею для ИИ-Агента - https://www.tgoop.com/prompt_design/1303
Я уже много раз писал, но давайте еще раз: для первого проекта начни с агента под конкретное действие. Например, «собрать лиды из LinkedIn в Google Sheets» или «сгенерить черновик поста в блог».
1. Одна «микрозадача». Собери агента под одно действие («сделать пост в блог», «скинуть лиды в таблицу»).
2. Блок-схема. Просто нарисуй на бумажке блоки: получить данные → обработать → отправить.
3. MVP — че тут думать, начинаем с классики:
— n8n https://n8n.io — open-source drag-and-drop, в любой ноде можно дописать на JS.
— Make https://make.com — SaaS-конструктор с модулем AI Agents прямо в браузере.
Воркфлоу:
Webhook → LLM-нода → Google Sheets или Notion.
4. Human loop. Вставь себя в разрыв цепочки процесса. Сначала результат летит тебе в Telegram, там его апрувишь или блочишь. Когда апрув без правок стабильно > 80 %, убираешь ручной стоп-кран.
5. Тест × 20. Прогони поток двадцать раз — этого достаточно, чтобы увидеть реальный расход токенов и время. Так как бывает, что расход по токенам выше стоимости ручного труда. Тогда сужай задачу.
6. Инструменты и аналоги n8n.
— Flowise https://flowiseai.com или LangFlow https://langflow.org — примерно как n8n и RAG.
— aiXplain https://aixplain.com/studio/design — можно быстро менять модели без кода.
— Apify https://apify.com/templates/python-langgraph — деплой как Actor с оплатой за запуск.
— Orkes https://orkes.io или VoltAgent https://github.com/VoltAgent/voltagent — когда нужен серверный масштаб и логирование.
Вот еще посты на тему:
1. Больше 250 воркфлоу, которыми можно «вдохноаляться» - https://www.tgoop.com/prompt_design/1372
2. Как продавать ИИ-Агентов - https://www.tgoop.com/prompt_design/1344
3. Как погрузиться в ИИ и ИИ-Агентов - https://www.tgoop.com/prompt_design/1343
4. Как внедрять ИИ-Агентов в бизнес-процессы - https://www.tgoop.com/prompt_design/1335
5. Гайд по n8n в картинках - https://www.tgoop.com/prompt_design/1332
6. Как найти идею для ИИ-Агента - https://www.tgoop.com/prompt_design/1303