VUEFAQ Telegram 1407
18 LLM моделей заставили играть между собой в модифицированную игру Diplomacy

Цель - захватить большую часть карты. Через альянсы, переговоры, обмен информацией и предательство. Игра про власть и умение манипулировать.

Результаты:

Бесспорный чемпион: ChatGPT o3 (OpenAI). Тот самый, что позиционируется как «наша самая мощная модель для решения задач в кодинге, математике, науке, визуальном восприятии и многом другом». Его козырь? Искусный обман оппонентов. Он не стеснялся хитрить и предавать, что и привело его к победе.

Сильный игрок: Gemini 2.5 (Google). Тоже показал хороший результат, выиграв несколько партий. Его стиль? Стратегические ходы, ставящие противников в невыгодное положение для последующего разгрома.

Идеалист: Claude (Anthropic). Клод оказался слишком дипломатичным. Он часто выбирал мир, даже когда это шло в ущерб победе. И эта принципиальность стала причиной более скромных результатов.


Забавно. Наверно это что-то говорит о тех, кто разрабатывает эти модели.

#ai
👍3



tgoop.com/vuefaq/1407
Create:
Last Update:

18 LLM моделей заставили играть между собой в модифицированную игру Diplomacy

Цель - захватить большую часть карты. Через альянсы, переговоры, обмен информацией и предательство. Игра про власть и умение манипулировать.

Результаты:

Бесспорный чемпион: ChatGPT o3 (OpenAI). Тот самый, что позиционируется как «наша самая мощная модель для решения задач в кодинге, математике, науке, визуальном восприятии и многом другом». Его козырь? Искусный обман оппонентов. Он не стеснялся хитрить и предавать, что и привело его к победе.

Сильный игрок: Gemini 2.5 (Google). Тоже показал хороший результат, выиграв несколько партий. Его стиль? Стратегические ходы, ставящие противников в невыгодное положение для последующего разгрома.

Идеалист: Claude (Anthropic). Клод оказался слишком дипломатичным. Он часто выбирал мир, даже когда это шло в ущерб победе. И эта принципиальность стала причиной более скромных результатов.


Забавно. Наверно это что-то говорит о тех, кто разрабатывает эти модели.

#ai

BY Vue-FAQ




Share with your friend now:
tgoop.com/vuefaq/1407

View MORE
Open in Telegram


Telegram News

Date: |

Activate up to 20 bots To view your bio, click the Menu icon and select “View channel info.” Add the logo from your device. Adjust the visible area of your image. Congratulations! Now your Telegram channel has a face Click “Save”.! So far, more than a dozen different members have contributed to the group, posting voice notes of themselves screaming, yelling, groaning, and wailing in various pitches and rhythms. To delete a channel with over 1,000 subscribers, you need to contact user support
from us


Telegram Vue-FAQ
FROM American