AGATOV_TECH Telegram 3773
Врут безбожно!

Сделали независимые исследования по случаям вранья новых моделей ИИ и цифры просто обескураживающие.

Их, просто, опасно подпускать к бизнесу!

У меня было ощущение, и даже я видел некоторые цифры, что с рассуждениями удалось победить галлюцинации ИИ до уровня 8–15%, но оказалось всё иначе.

Chat GPT

o3 галлюцинировала от 33 до 55%*
o4-mini галлюцинировала от 41% до 79%*
GPT-4.5 галлюцинировала 37,1%**

*времени, в разных тестах PersonQA и SimpleQA
** тест SimpleQA


С научной статьёй можно ознакомится здесь.


Исследователи в основном говорят, что остановить галлюцинации у ботов ИИ невозможно, но многие работают над различными способами снижения частоты галлюцинаций.

Microsoft и Google выпустили продукты — Correction от Microsoft и Vertex от Google, — которые, по их словам, могут помечать информацию, которая может быть неверной в ответах ботов ИИ.



**********

Заказать мою книгу "Деловая сцена. 100 советов для ярких выступлений"
Пригласить Бориса выступить по этой теме
Лень читать, смотри на - YouTube или RuTube или VK видео
Мой курс по ИИ для бизнеса – Курс



tgoop.com/agatov_tech/3773
Create:
Last Update:

Врут безбожно!

Сделали независимые исследования по случаям вранья новых моделей ИИ и цифры просто обескураживающие.

Их, просто, опасно подпускать к бизнесу!

У меня было ощущение, и даже я видел некоторые цифры, что с рассуждениями удалось победить галлюцинации ИИ до уровня 8–15%, но оказалось всё иначе.

Chat GPT

o3 галлюцинировала от 33 до 55%*
o4-mini галлюцинировала от 41% до 79%*
GPT-4.5 галлюцинировала 37,1%**

*времени, в разных тестах PersonQA и SimpleQA
** тест SimpleQA


С научной статьёй можно ознакомится здесь.


Исследователи в основном говорят, что остановить галлюцинации у ботов ИИ невозможно, но многие работают над различными способами снижения частоты галлюцинаций.

Microsoft и Google выпустили продукты — Correction от Microsoft и Vertex от Google, — которые, по их словам, могут помечать информацию, которая может быть неверной в ответах ботов ИИ.



**********

Заказать мою книгу "Деловая сцена. 100 советов для ярких выступлений"
Пригласить Бориса выступить по этой теме
Лень читать, смотри на - YouTube или RuTube или VK видео
Мой курс по ИИ для бизнеса – Курс

BY Агатов Борис Tech Магазин 4.0


Share with your friend now:
tgoop.com/agatov_tech/3773

View MORE
Open in Telegram


Telegram News

Date: |

The group also hosted discussions on committing arson, Judge Hui said, including setting roadblocks on fire, hurling petrol bombs at police stations and teaching people to make such weapons. The conversation linked to arson went on for two to three months, Hui said. The Channel name and bio must be no more than 255 characters long How to create a business channel on Telegram? (Tutorial) With the “Bear Market Screaming Therapy Group,” we’ve now transcended language. ZDNET RECOMMENDS
from us


Telegram Агатов Борис Tech Магазин 4.0
FROM American