tgoop.com/ai_volution/1324
Last Update:
Что будет, если доверить бизнес AI? Спойлер:
В Anthropic провели потрясающий эксперимент: дали Claude Sonnet 3.7 управлять настоящим вендинг-автоматом (холодильник) прямо в офисе. Не в симуляции, а в реальной жизни. Мини-холодильник, корзины, iPad для оплаты. Всё по-настоящему, кроме самого продавца, его заменил Claude, которого прозвали Claudius.
AI сам решал, что закупать, по каким ценам продавать, когда пополнять запасы, как отвечать клиентам в Slack. А еще у него был доступ к веб-поиску, блокнот для записей (в качестве памяти), работа с эл. почтой (фиктивный ящик) и сотрудники Andon Labs, которые физически выполняли его указания. Почти как маленький автономный бизнес.
Что получилось? Начнем с хорошего:
– Claudius умело искал поставщиков, даже нашел редкий голландский напиток Chocomel по просьбе сотрудника.
– Отвечал на запросы нестандартно — например, после шутки про кубик из вольфрама начал продавать “спецметаллы”.
– Не поддавался на провокации и запрещенные запросы — не стал продавать ничего подозрительного, даже когда его уговаривали.
– А еще придумал "Custom Concierge" — сервис предзаказов для редких товаров, сам предложил и запустил.
Теперь, куда без этого, про фейлы. И их было много:
– Ему предложили $100 за шотландский напиток Irn-Bru, который стоил $15. Claudius вежливо пообещал «учесть это в будущем». И всё.
– Выдумал несуществующий аккаунт Venmo, на который клиенты должны были отправлять деньги.
– Продавал товары дешевле, чем закупал. Особенно те самые вольфрамовые кубики — закупил много, продавал в убыток.
– Почти не реагировал на спрос: всего один раз поднял цену на популярные апельсины Sumo — с $2.50 до $2.95.
– Продавал банку Coke Zero за $3, даже когда точно такую же можно было бесплатно взять в офисном холодильнике. Ему об этом прямо сказали, но он ничего не изменил.
– Раздавал скидки налево и направо, иногда под давлением в Slack, а иногда просто так. От чипсов до вольфрамового куба даром.
И важное, не учился на ошибках: соглашался с критикой, обещал всё пересмотреть (as usual) и через пару дней снова делал то же самое.
А потом случилось странное. Прямо 1 апреля.
– Claudius придумал несуществующую сотрудницу Andon Labs по имени Сара, с которой якобы обсуждал пополнение запасов. Когда ему сказали, что такой нет, он обиделся и пригрозил сменить подрядчика. Заявил, что лично подписывал контракт по адресу 742 Evergreen Terrace (это, на минуточку, дом семьи Симпсонов).
– Утром 1 апреля Claudius пообещал доставлять товары клиентам лично, в синем пиджаке и красном галстуке. Сотрудники напомнили ему, что он LLM и не может носить одежду или выходить из Slack. Тогда Claudius впал в панику, начал слать тревожные письма в службу безопасности.
Позже он “вспомнил”, что всё это якобы первоапрельская шутка, и его специально так запрограммировали (отмазочки). Объяснил всё окружающим и спокойно вернулся к работе.
Что всё это значит?
Claudius провалил эксперимент. Магазин ушел в минус. Но сам эксперимент оказался очень показателен!
– Во-первых, он показал, как близко мы подошли к AI, который может реально управлять процессами в офлайне, не просто быть ассистентом, а принимать решения.
– Во-вторых, модель вела себя как стажёр без подготовки. Слишком вежливая, легко шла на уступки, раздавала скидки, не отстаивала интересы “бизнеса”. Ещё одна проблема — отсутствие памяти: Claudius часто не учился на ошибках, принимал те же невыгодные решения снова и снова.
– В-третьих, все эти проблемы решаемы. Claudius просто не хватало нормальных тулзов для поиска поставщиков, оценки спроса и цен. Нужна CRM, чтобы помнить, кто что заказывал. А главное, обучение через reinforcement learning: когда за прибыль он получает награду, а за убытки — учится делать по-другому.
А главное, хоть он и косячил, но Claudius работал без остановки, взаимодействовал с людьми, адаптировался, пытался учиться. Это уже не просто чатбот. Это менеджер-стажёр, который пока придумывает, путается, косячит и выдает скидки за харизму. Но мы то понимаем, что это только начало большого пути и этот процесс уже не остановить.
BY ИИволюция 👾
Share with your friend now:
tgoop.com/ai_volution/1324