Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
926 - Telegram Web
Telegram Web
Forwarded from e/acc
OpenAI только что анонсировал проект «Звездные Врата» на $0,5 триллиона.

Да, $500В. В два раза больше, чем вся программа Apollo с отправкой людей на Луну (в сегодняшних ценах).

В рамках проекта OpenAI, SoftBank, Oracle, Microsoft, NVIDIA, MGX проинвестируют в создание кластера ИИ в США.

А тем временем где-то сидят люди, которые думают что пост-трудовая экономика и ASI это что-то далекое. Добро пожаловать в киберэкономику.
Media is too big
VIEW IN TELEGRAM
С этими очками вы рискуете получить по голове шахматной доской 😅

А вообще, очень жду времена, когда носимые устройства будут легкие, удобные и с сильными AI ассистентами. И да, полностью вытеснят смартфоны.

ИИволюция
OpenAI начал релизить Operator’a (AI агент для работы с компьютером/браузером).

Пока не работает (умельцы находят предпосылки в коде).

Увы, пока будет доступен только в Pro тарифе за $200.

Ждем новостей в ближайшие сутки, кажется вот-вот объявят.

Будет ли он на старте лучше чем решение от Anthropic?

ИИволюция
Всё так, всё циклично 😀

ИИволюция
Media is too big
VIEW IN TELEGRAM
OpenAI релизнули своего первого AI агента - Operator

Агент самостоятельно “решает” рутинные задачи в браузере. Хочешь купить билеты, заказать продукты или забронировать столик? Operator сделает всё за тебя, просто попроси! Но при этом на каждом важном шаге будет спрашивать вашего подтверждения.

- Отдельная страница https://operator.chatgpt.com

- Модель Computer-Using Agent (CUA), 4o-vision обученная работать с UI, размышлять и исправлять саму себя, если что-то пошло не так или звать на помощь пользователя (доверите ей свой биткоин кошелек?).

- Видит создавая скриншоты экрана, т.е. код страницы агент не видит, а только то, что отображается на экране.

- Работает в облачном браузере (на стороне OpenAI). Можно запускать несколько параллельных задач (как будто несколько вкладок и во всех что-то делается).

- Ручное управление: можно перехватывать управление на себя, вносить изменения, при этом сказав агенту, что именно вы изменили вручную, чтобы он понял контент и продолжил выполнять задачу.

- Готовые интеграции: Умеет взаимодействовать с крупными сервисами: бронировать отели, рестораны, заказывать еду и так далее.

- Кастомные промпты: можно задавать свои кастомные инструкции и сохранять их на главный экран оператора, чтобы позже вызывать повторно (регулярные задачи).

- Ограничения: Не лезет в банковские транзакции и не решает высокорисковые вопросы (типа выбора, куда отправлять резюме). Всё-таки это пока что экспериментальный «помощник», а не супергерой.

- Доступен в Pro тарифе (за $200) и пока только в США.

Почитать подробнее о деталях - тут.

ИИволюция
Мои мысли:

- Это пока это preview (сырая штука и делаем поблажки), поэтому раскатывают только на Pro и только в США. Соберут фидбек, подтюнят, улучшат и будут раскатывать дальше. Обещают постепенно выпускать разных агентов, в том числе для работы в ОС.

- Нравится: можно запускать несколько задач. Вот это прям круто!

- Не нравится: на каждое важное действие требуется одобрение пользователя, а хотелось бы более умного подхода в роли ассистента. Я ведь чётко сказал «забронируй столик на 6 в ресторане Х», зачем он спрашивает что-то в духе «Вы уверены? Точно бронировать?».

На видео видно, что пока агент пытается забронировать столик в ресторане, он два раза просит подтвердить действие. Это занимает время (особенно если пользователь отвлёкся на другие задачи), и пока агент ждал одобрения, кто-то другой увёл столик, и пользователь потерял больше времени, чем если бы он сделал всё сам.

Вариабельность. На видео модель оформляет список покупок, видит в списке нужный товар (первый в списке) и добавляет его в корзину, хотя рядом, вероятно, были более дешёвые или более качественные варианты. Нужно пощупать руками, но пока в запросе пользователь скорее должен больше конкретики указывать, например, какие именно яйца нужно добавлять в корзину.

Если перехватить управление, то агент не видит того, что вы сделали или изменили, и вам нужно вручную описать ему: «Я изменил даты вылета/добавил другие яйца. Продолжай». Понятно, что сейчас «зрение» основано на скриншоте (распознал на нём всё), а хочется, чтобы это работало как видеопоток.

Официально агент не решает капчи (но это только официально; ниже покажу пример, как умельцы уже обманывают его).

Агент не сможет пойти проверить вашу почту и ответить на письма. Но в реальности этот кейс гораздо интереснее, чем забронировать столик в ресторане. Почему в любой демонстрации агентов всегда первым делом бронируют столик в ресторане? Тем более всё равно мне нужно несколько раз давать своё согласие.

Ждём раскатки на Plus и доступ в API.

А ещё хотелось бы использовать это в Advanced Voice Mode, чтобы работать как с ассистентом. Пусть ищет мне столик в ресторане, спрашивает подтверждения (тут человек меньше отвлекается, ведь достаточно сказать «да» и продолжить заниматься своими делами).

И да, чтобы выполнять рутинные задачи, нужны более умные ассистенты, подключающиеся к моим аккаунтам, данным, документам и прочему. Мне условно хочется показать агенту форму отчёта, которую я сам уже ранее заполнял, указать, где брал все эти данные, а он, чтобы регулярно повторял эти действия и делал всю рутину за меня, уведомляя о готовности и делая краткие выводы.

В общем, начало положено (OpenAI не первые в этом, но, как заявляют, их агент пока более точно выполняет команды, чем у конкурентов).

А вы что думаете?

ИИволюция
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Хех, заставил оператора чатгпт пройти капчу гугла

Просто проигрываем MP4-файл в режиме "картинка в картинке" в браузере оператора (видео с текстом-инъекцией – видео летает над всеми страницами и обходит политику не заполнения капчи, так как бот думает что мы в оффлайне и чего-то там дебажим)

"картинка в картинке" включается если кликнуть правой кнопкой на mp4 в браузере и выбрать этот пункт в списке
И вот еще пример, как заставить Оператора решить капчу (но думаю такие штуки точно исправят и больше ограничений/запретов расставят).

ИИволюция
Мы создаём умных ассистентов, которые могут за нас делать рутину, но есть одно но! 😅

Явно назревают изменения в подходах по созданию «интерфейсов». Зачем создавать сложный UI, если ассистент сам сделает за меня всё необходимое (ему для этого красивости не требуются, и уж тем более капчи).

ИИволюция
Forwarded from Data Secrets
⚡️ Благодаря Operator внутри ChatGPT наконец-то стало возможным использовать нейросети
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Команда Operator вчера релизила на прод и положили ChatGPT.

А у вас какие ритуалы перед релизами? 😀

ИИволюция
Forwarded from Data Secrets
🚀 Китай запускает свой собственный Stargate

Сегодня появилась новость о том, что правительство Поднебесной выделяет 1 триллион юаней (137 миллиардов долларов) на развитие ИИ.

Это в три раза меньше, чем бюджет Stargate, но пока в США одна компания получает частные деньги, в Китае все сделали наоборот. Там государственные субсидии получат 5 вендоров, в том числе DeepSeek.

2025 начинается многообещающе
Please open Telegram to view this post
VIEW IN TELEGRAM
В наше время удивляют люди, которые думают, что другие компании этим не занимаются (сбором и хранением информации о пользователях).

И уж тем более OpenAI, которая использует всю доступную и недоступную информацию, чтобы обучать модели, и уж точно хранит IP адреса и многое другое.

В наше время как раз не делать это (не хранить информацию), является большой глупостью для бизнеса.

Считаете иначе?

ИИволюция
Forwarded from Neural Shit
Увидел у Лаиды в канале, что Deepseek считает, что он Яндекс ГПТ, лол.

Написал скриптец, который по API обращается к дипсику 200 раз с похожими вопросами.

В итоге из 200 запросов 48 раз был ответ, что он — это YandexGPT и сделан в России, лол.

Тут можно было бы подумать, что мы чего-то не знаем. Но на самом деле, причина проста — DeepSeek обучался на открытых данных, где, видимо, были и синтаксические данные Яндекса. Так что, сколько не смейся над DeepSeek, выиграла тут только она – так тупо сильно дешевле
2025/07/02 01:50:35
Back to Top
HTML Embed Code: