Агатов Борис Tech Магазин 4.0@agatov

Агатов Борис Tech Магазин 4.0

Врут безбожно!

Сделали независимые исследования по случаям вранья новых моделей ИИ и цифры просто обескураживающие.

Их, просто, опасно подпускать к бизнесу!

У меня было ощущение, и даже я видел некоторые цифры, что с рассуждениями удалось победить галлюцинации ИИ до уровня 8–15%, но оказалось всё иначе.

Chat GPT

o3 галлюцинировала от 33 до 55%* 
o4-mini галлюцинировала от 41% до 79%*
GPT-4.5 галлюцинировала 37,1%**

*времени, в разных тестах PersonQA и SimpleQA
** тест SimpleQA

С научной статьёй можно ознакомится здесь.

Исследователи в основном говорят, что остановить галлюцинации у ботов ИИ невозможно, но многие работают над различными способами снижения частоты галлюцинаций.

Microsoft и Google выпустили продукты — Correction от Microsoft и Vertex от Google, — которые, по их словам, могут помечать информацию, которая может быть неверной в ответах ботов ИИ.

**********

Заказать мою книгу "Деловая сцена. 100 советов для ярких выступлений"
Пригласить Бориса выступить по этой теме
Лень читать, смотри на - YouTube или RuTube или VK видео
Мой курс по ИИ для бизнеса – Курс

👍9

www.tgoop.com/agatov_tech/3773

1.44K viewsБорис Агатов, May 14 at 05:13

tgoop.com/agatov_tech/3773

Create: 2025-05-14
Last Update: 2025-07-14 11:40:15

Chat GPT

o3 галлюцинировала от 33 до 55%* 
o4-mini галлюцинировала от 41% до 79%*
GPT-4.5 галлюцинировала 37,1%**

*времени, в разных тестах PersonQA и SimpleQA
** тест SimpleQA

BY Агатов Борис Tech Магазин 4.0

Share with your friend now:
tgoop.com/agatov_tech/3773

Telegram News

Врут безбожно!