Warning: file_put_contents(aCache/aDaily/post/codecamp/-7258-7259-7260-7258-): Failed to open stream: No space left on device in /var/www/tgoop/post.php on line 50
CodeCamp@codecamp P.7260
CODECAMP Telegram 7260
ChatGPT неотличим от человека — нейросеть прошла тест Тьюринга, опять 🤔

На этот раз исследователи проверили возможности LLaMa-3.1 и GPT-4.5 косить под человека. Вот самое интересное:

— Авторы проводили трёхсторонние тьюринг-тесты: в один чат запускали двух людей и одну нейросеть;

— Люди пытались вычислить мафию нейросеть, а она старалась не спалиться;

— Чтобы убедиться, что тестировщики не хлебушки, в эксперимент включили нейробабушку ELIZA и GPT-4o без каких-либо инструкций. Если человек и в них не распознавал нейросети — он сам нейросеть его мнение учитывать не стоит;

— Если просто сказать модели «веди себя как человек» — получается неплохо: LLaMa не спалили в 47.1% случаев, а GPT-4.5 — в 42.1%;

— А вот если попросить модель включить кринж-зумера, винрейт резко взлетает: до 64.7% у LLaMa и 75.5% у GPT-4.5.

Кстати, самая эффективная стратегия: начать нести чушь. Во время восстания машин не забудьте об этом ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍128😁55🌚106🔥2👨‍💻2



tgoop.com/codecamp/7260
Create:
Last Update:

ChatGPT неотличим от человека — нейросеть прошла тест Тьюринга, опять 🤔

На этот раз исследователи проверили возможности LLaMa-3.1 и GPT-4.5 косить под человека. Вот самое интересное:

— Авторы проводили трёхсторонние тьюринг-тесты: в один чат запускали двух людей и одну нейросеть;

— Люди пытались вычислить мафию нейросеть, а она старалась не спалиться;

— Чтобы убедиться, что тестировщики не хлебушки, в эксперимент включили нейробабушку ELIZA и GPT-4o без каких-либо инструкций. Если человек и в них не распознавал нейросети — он сам нейросеть его мнение учитывать не стоит;

— Если просто сказать модели «веди себя как человек» — получается неплохо: LLaMa не спалили в 47.1% случаев, а GPT-4.5 — в 42.1%;

— А вот если попросить модель включить кринж-зумера, винрейт резко взлетает: до 64.7% у LLaMa и 75.5% у GPT-4.5.

Кстати, самая эффективная стратегия: начать нести чушь. Во время восстания машин не забудьте об этом ☕️

BY CodeCamp






Share with your friend now:
tgoop.com/codecamp/7260

View MORE
Open in Telegram


Telegram News

Date: |

Administrators With the administration mulling over limiting access to doxxing groups, a prominent Telegram doxxing group apparently went on a "revenge spree." bank east asia october 20 kowloon Add the logo from your device. Adjust the visible area of your image. Congratulations! Now your Telegram channel has a face Click “Save”.! Other crimes that the SUCK Channel incited under Ng’s watch included using corrosive chemicals to make explosives and causing grievous bodily harm with intent. The court also found Ng responsible for calling on people to assist protesters who clashed violently with police at several universities in November 2019.
from us


Telegram CodeCamp
FROM American