PWN AI@pwnai P.1005

Forwarded from OK ML

4 секрета Roboduck. Как Theori взяли AIxCC и бустанули хакеров х10 🚀🚀🚀

Что ты представляешь, когда слышишь о системе, которая способна обнаруживать уязвимости, создавать эксплоиты, а также сразу выпускать патчи, устраняющие дыры прошлого? Theori, команда участвовавшая в соревновании AI Cyber Challenge попыталась решить эту сложную задачу, представив автономную CRS(Cyber Reasoning System) - RoboDuck. В этой системе используются агенты, но не как аддон, а как основа.

Почему система оказалась эффективной и почему получилось дополнить основу революции агентов в кибербезе?

🧩Секрет № 1. Разбивайте задачу на части, как пазл.

Главная идея - не тащить все одним супер-агентом. Делим на подзадачи и даем разным агентам. Представьте лабиринт: чем он больше, тем больше тупиков, логично? А теперь, что вместо одного огромного лабиринта у вас есть серия маленьких? Шансы найти выход резко возрастают!

Для генерации Proof of Vulnerability(PoV) команда выделила три подзадачи:

1. Анализ fuzz-harness и написание кода для преобразования семантики в бинарщину.
2. Ответы на точечные вопросы по коду.
3. Отладка готового PoV, чтобы понять почему эксплоит не срабатывает.

Каждую подзадачу вёл отдельный агент, а главный агент собирал результат в цельную картину.

⚒️Секрет №2. «Не все инструменты сразу - только нужные»

В ходе разработки решения команда обнаружила, что если агенту дозволено делать абсолютно всё, начинается хаос:

1. Агент может запустить прожорливую команду, которая съест все ресурсы (грепанём по всему коду в Линуксе 🙃)
2. Контекст засоряется - фокус теряется.
3. Простые задачи вдруг начинают требовать множества шагов 🤢..

Что сделали Theori ??? Они создали узкоспециализированные тулы: для поиска строки, для чтения фрагмента кода и для извлечения отдельных символов из кода. Плюс сами инструменты имели guardrails, которые могли сужать промпт в случае получения большого количества результатов.🤔

⛓️Секрет №3. Структурированный вывод от эксперта.

Как получить из агента не «простынь», а структурированный вывод/результат. Theori делится с нами двумя способами:

- Сперва дайте агенту схему вывода в XML и прямо попросите, чтобы он оформлял ответ в XML тегах. Модели хорошо их понимают.

- Далее создайте отдельный тул, который будет завершать работу агента, - своеобразная кнопка "Готово" с полями для заполнения😕. Когда параметры вызова совпадают с финальным результатом — агент аккуратно завершает работу без болтовни.

🎚️Секрет №последний, 4: Подстраивайтесь под особенности моделей

😮

Игнорирование факта что все LLM разные = неудача = ловить одни и те же фейлы. Команда обнаружила, что если агент делает одну и ту же ошибку, то лучше добавить в промпт запрещалку. Claude отлично следует этим запрещалкам 😎 - он любит когда ему что-то запрещают. Если агент застревает, то надо попросить его «подумать иначе» и сменить стратегию.

В соревновании это выстрелило, когда агент PoVProducer не смог создать пригодный эксплоит, но правила смогли дать нужный результат.

Как пишут в Theori: "Хотя ИИ ещё не заменит хакера, он уже делает его в 10 раз эффективнее".

🧨А с этими секретами го разрабатывать агентов для своих задач!😺

Please open Telegram to view this post

VIEW IN TELEGRAM

2🔥4❤3

www.tgoop.com/pwnai/1005

1.58K viewsArtyom Semenov, Aug 27 at 13:15

tgoop.com/pwnai/1005

Create: 2025-08-27
Last Update: 2025-10-12 13:09:57

Telegram News

4 секрета Roboduck. Как Theori взяли AIxCC и бустанули хакеров х10 🚀🚀🚀