VUEFAQ Telegram 1407
18 LLM моделей заставили играть между собой в модифицированную игру Diplomacy

Цель - захватить большую часть карты. Через альянсы, переговоры, обмен информацией и предательство. Игра про власть и умение манипулировать.

Результаты:

Бесспорный чемпион: ChatGPT o3 (OpenAI). Тот самый, что позиционируется как «наша самая мощная модель для решения задач в кодинге, математике, науке, визуальном восприятии и многом другом». Его козырь? Искусный обман оппонентов. Он не стеснялся хитрить и предавать, что и привело его к победе.

Сильный игрок: Gemini 2.5 (Google). Тоже показал хороший результат, выиграв несколько партий. Его стиль? Стратегические ходы, ставящие противников в невыгодное положение для последующего разгрома.

Идеалист: Claude (Anthropic). Клод оказался слишком дипломатичным. Он часто выбирал мир, даже когда это шло в ущерб победе. И эта принципиальность стала причиной более скромных результатов.


Забавно. Наверно это что-то говорит о тех, кто разрабатывает эти модели.

#ai
👍2



tgoop.com/vuefaq/1407
Create:
Last Update:

18 LLM моделей заставили играть между собой в модифицированную игру Diplomacy

Цель - захватить большую часть карты. Через альянсы, переговоры, обмен информацией и предательство. Игра про власть и умение манипулировать.

Результаты:

Бесспорный чемпион: ChatGPT o3 (OpenAI). Тот самый, что позиционируется как «наша самая мощная модель для решения задач в кодинге, математике, науке, визуальном восприятии и многом другом». Его козырь? Искусный обман оппонентов. Он не стеснялся хитрить и предавать, что и привело его к победе.

Сильный игрок: Gemini 2.5 (Google). Тоже показал хороший результат, выиграв несколько партий. Его стиль? Стратегические ходы, ставящие противников в невыгодное положение для последующего разгрома.

Идеалист: Claude (Anthropic). Клод оказался слишком дипломатичным. Он часто выбирал мир, даже когда это шло в ущерб победе. И эта принципиальность стала причиной более скромных результатов.


Забавно. Наверно это что-то говорит о тех, кто разрабатывает эти модели.

#ai

BY Vue-FAQ




Share with your friend now:
tgoop.com/vuefaq/1407

View MORE
Open in Telegram


Telegram News

Date: |

“Hey degen, are you stressed? Just let it all out,” he wrote, along with a link to join the group. Hui said the time period and nature of some offences “overlapped” and thus their prison terms could be served concurrently. The judge ordered Ng to be jailed for a total of six years and six months. "Doxxing content is forbidden on Telegram and our moderators routinely remove such content from around the world," said a spokesman for the messaging app, Remi Vaughn. A Telegram channel is used for various purposes, from sharing helpful content to implementing a business strategy. In addition, you can use your channel to build and improve your company image, boost your sales, make profits, enhance customer loyalty, and more. Those being doxxed include outgoing Chief Executive Carrie Lam Cheng Yuet-ngor, Chung and police assistant commissioner Joe Chan Tung, who heads police's cyber security and technology crime bureau.
from us


Telegram Vue-FAQ
FROM American