partially unsupervised@partially

partially unsupervised

Я редко пишу здесь про новости, но про очередной релиз нового семейства LLM - на этот раз Claude 3 от Anthropic - напишу.

Дело даже не в том, что они утверждают, что побили GPT-4 по метрикам. Это первая модель, которая с первой попытки правильно ответила на вопрос, которым я люблю тестировать LLM-ки: "what manhattan project participant invented the dolphin kick for swimming?" 🐬. Остальные популярные модели (GPT-4, Mistral Large, Llama 2 70B...) или скатываются в галлюцинации (обычно про Фейнмана), или отвечают в духе "уважаемый, там физики работали, какое еще плавание".

Вопрос, конечно, вдохновлен этой книгой. На более нормальные промпты, которые я успел прогнать, кажется, отвечает +- на уровне GPT.

👍42🤡8

www.tgoop.com/partially_unsupervised/215

11.7K viewsMar 4, 2024 at 15:31

tgoop.com/partially_unsupervised/215

Create: 2024-03-04
Last Update: 2025-12-13 04:16:32

BY partially unsupervised

Share with your friend now:
tgoop.com/partially_unsupervised/215

Telegram News

Я редко пишу здесь про новости