tgoop.com/codecamp/7260
Last Update:
ChatGPT неотличим от человека — нейросеть прошла тест Тьюринга, опять
На этот раз исследователи проверили возможности LLaMa-3.1 и GPT-4.5 косить под человека. Вот самое интересное:
— Авторы проводили трёхсторонние тьюринг-тесты: в один чат запускали двух людей и одну нейросеть;
— Люди пытались вычислить мафию нейросеть, а она старалась не спалиться;
— Чтобы убедиться, что тестировщики не хлебушки, в эксперимент включили нейробабушку ELIZA и GPT-4o без каких-либо инструкций. Если человек и в них не распознавал нейросети — он сам нейросеть его мнение учитывать не стоит;
— Если просто сказать модели «веди себя как человек» — получается неплохо: LLaMa не спалили в 47.1% случаев, а GPT-4.5 — в 42.1%;
— А вот если попросить модель включить кринж-зумера, винрейт резко взлетает: до 64.7% у LLaMa и 75.5% у GPT-4.5.
Кстати, самая эффективная стратегия: начать нести чушь. Во время восстания машин не забудьте об этом