ПОСЛЕЗАВТРА@zen_dat P.849

ZEN_DAT Telegram 849

ПОСЛЕЗАВТРА

OpenAI обнаружила, что даже лучшие модели ИИ часто дают неверные ответы

Недавнее исследование OpenAI выявило серьезные недостатки в точности её ИИ-моделей. На новом бенчмарке SimpleQA, разработанном для оценки качества ответов, новейшая модель o1-preview показала успех лишь в 42,7% случаев, демонстрируя, что даже самые продвинутые языковые модели часто дают неправильные ответы. Конкурирующие модели, такие как Claude-3.5-sonnet от Anthropic, показали ещё более низкую точность — 28,9%.

Проблема “галлюцинаций”, когда ИИ уверенно выдаёт ложную информацию, давно беспокоит специалистов. Несмотря на это, технологии на основе ИИ активно используются в образовании, здравоохранении и даже правоохранительных органах. Например, ИИ, разработанный на базе технологий OpenAI, недавно был пойман на регулярных ошибках при транскрипции общения с пациентами в больницах, что вызывает серьёзные опасения по поводу распространения дезинформации.

Эти результаты подтверждают, что современные языковые модели не могут быть полностью достоверными.

👍2

www.tgoop.com/zen_dat/849

1.41K viewsNov 9, 2024 at 07:57

tgoop.com/zen_dat/849

Create: 2024-11-09
Last Update: 2025-07-12 12:30:14

OpenAI обнаружила, что даже лучшие модели ИИ часто дают неверные ответы

Недавнее исследование OpenAI выявило серьезные недостатки в точности её ИИ-моделей. На новом бенчмарке SimpleQA, разработанном для оценки качества ответов, новейшая модель o1-preview показала успех лишь в 42,7% случаев, демонстрируя, что даже самые продвинутые языковые модели часто дают неправильные ответы. Конкурирующие модели, такие как Claude-3.5-sonnet от Anthropic, показали ещё более низкую точность — 28,9%.

Проблема “галлюцинаций”, когда ИИ уверенно выдаёт ложную информацию, давно беспокоит специалистов. Несмотря на это, технологии на основе ИИ активно используются в образовании, здравоохранении и даже правоохранительных органах. Например, ИИ, разработанный на базе технологий OpenAI, недавно был пойман на регулярных ошибках при транскрипции общения с пациентами в больницах, что вызывает серьёзные опасения по поводу распространения дезинформации.

Эти результаты подтверждают, что современные языковые модели не могут быть полностью достоверными.

BY ПОСЛЕЗАВТРА

Share with your friend now:
tgoop.com/zen_dat/849

Open in Telegram

Telegram News

Date: 2025-07-12|

You can invite up to 200 people from your contacts to join your channel as the next step. Select the users you want to add and click “Invite.” You can skip this step altogether. Users are more open to new information on workdays rather than weekends. With the sharp downturn in the crypto market, yelling has become a coping mechanism for many crypto traders. This screaming therapy became popular after the surge of Goblintown Ethereum NFTs at the end of May or early June. Here, holders made incoherent groaning sounds in late-night Twitter spaces. They also role-played as urine-loving Goblin creatures. How to Create a Private or Public Channel on Telegram? Judge Hui described Ng as inciting others to “commit a massacre” with three posts teaching people to make “toxic chlorine gas bombs,” target police stations, police quarters and the city’s metro stations. This offence was “rather serious,” the court said.
from us

Telegram ПОСЛЕЗАВТРА
FROM American