Картинки со смыслом: стоит ли менять ChatGPT на Gemini 🔹 Речь о модели Gemini 2.5 Flash image generation, которая вышла 26 августа под именем
Nano Banana.
Подобно
GPT, новая модель Gemini очень точно следует промпту, отлично отрисовывает русские слова и даже таблицы/диаграммы со словами. Но есть нюансы
🧡➖ Посмотрим нюансы на сложном примере — когда нужно нарисовать
сразу 3 объекта в едином стиле, с нужным расположением.
⬆️Конкретно, мне нужна была иллюстрация известной разработчикам метафоры "
Birds and frogs". И хотелось подчеркнуть спиралевидный характер работы инженера-одиночки, который переключается между позициями bird и frog
⬆️➖➖Недостатки GPT🟠GPT непредсказуемо переделывает объект, если не может выполнить промпт по его изменению. См. выше — не смогла нарисовать вертикальный текст поверх спирали, и поэтому превратила спираль в нечто более удобное для себя (см. картинку
GPT - Edit
).
🟠Немного меняет даже "неизменные" объекты.
🟠Нередко обрезает картинку (очень обидно).
🟠Иллюстрации от GPT более блеклые — менее "вау".
🟠Без платной подписки можно использовать лишь несколько раз в день. И долго ждать.
➖➖Недостатки Gemini (Nano Banana)🔵Отказывается обрабатывать не только детей, но и известных персонажей, в т.ч. из фильмов. Т.е. мемы делать нереально (в ChatGPT с этим попроще).
🔵Надписи на русском чаще портятся, чем в GPT. И промпты лучше давать на английском (но это не проблема: просто перед генерацией просите gemini создать промпт по вашим русским словам).
🔥Вывод: последние модели от Google мощнее и удобнее, чем GPT Image 1🔥 С учетом огромных бесплатных лимитов — однозначно рекомендую переходить на Nano Banana. Это первая модель, которая "из коробки" работает буквально как AI-фотошоп ваших изображений.
📍Где использовать: gemini.google.com или
AI Studio. Во втором случае есть недостаток: несмотря на инструкции типа
Render at 16:9
, не хочет делать неквадратные пропорции (впрочем, референс-картинка это лечит: пропорции становятся ровно какие нужно).
@aidea4work #инструменты #картинки