AGATOV_TECH Telegram 3773
Врут безбожно!

Сделали независимые исследования по случаям вранья новых моделей ИИ и цифры просто обескураживающие.

Их, просто, опасно подпускать к бизнесу!

У меня было ощущение, и даже я видел некоторые цифры, что с рассуждениями удалось победить галлюцинации ИИ до уровня 8–15%, но оказалось всё иначе.

Chat GPT

o3 галлюцинировала от 33 до 55%*
o4-mini галлюцинировала от 41% до 79%*
GPT-4.5 галлюцинировала 37,1%**

*времени, в разных тестах PersonQA и SimpleQA
** тест SimpleQA


С научной статьёй можно ознакомится здесь.


Исследователи в основном говорят, что остановить галлюцинации у ботов ИИ невозможно, но многие работают над различными способами снижения частоты галлюцинаций.

Microsoft и Google выпустили продукты — Correction от Microsoft и Vertex от Google, — которые, по их словам, могут помечать информацию, которая может быть неверной в ответах ботов ИИ.



**********

Заказать мою книгу "Деловая сцена. 100 советов для ярких выступлений"
Пригласить Бориса выступить по этой теме
Лень читать, смотри на - YouTube или RuTube или VK видео
Мой курс по ИИ для бизнеса – Курс
👍9



tgoop.com/agatov_tech/3773
Create:
Last Update:

Врут безбожно!

Сделали независимые исследования по случаям вранья новых моделей ИИ и цифры просто обескураживающие.

Их, просто, опасно подпускать к бизнесу!

У меня было ощущение, и даже я видел некоторые цифры, что с рассуждениями удалось победить галлюцинации ИИ до уровня 8–15%, но оказалось всё иначе.

Chat GPT

o3 галлюцинировала от 33 до 55%*
o4-mini галлюцинировала от 41% до 79%*
GPT-4.5 галлюцинировала 37,1%**

*времени, в разных тестах PersonQA и SimpleQA
** тест SimpleQA


С научной статьёй можно ознакомится здесь.


Исследователи в основном говорят, что остановить галлюцинации у ботов ИИ невозможно, но многие работают над различными способами снижения частоты галлюцинаций.

Microsoft и Google выпустили продукты — Correction от Microsoft и Vertex от Google, — которые, по их словам, могут помечать информацию, которая может быть неверной в ответах ботов ИИ.



**********

Заказать мою книгу "Деловая сцена. 100 советов для ярких выступлений"
Пригласить Бориса выступить по этой теме
Лень читать, смотри на - YouTube или RuTube или VK видео
Мой курс по ИИ для бизнеса – Курс

BY Агатов Борис Tech Магазин 4.0


Share with your friend now:
tgoop.com/agatov_tech/3773

View MORE
Open in Telegram


Telegram News

Date: |

Unlimited number of subscribers per channel Telegram Channels requirements & features Among the requests, the Brazilian electoral Court wanted to know if they could obtain data on the origins of malicious content posted on the platform. According to the TSE, this would enable the authorities to track false content and identify the user responsible for publishing it in the first place. Ng, who had pleaded not guilty to all charges, had been detained for more than 20 months. His channel was said to have contained around 120 messages and photos that incited others to vandalise pro-government shops and commit criminal damage targeting police stations. Telegram users themselves will be able to flag and report potentially false content.
from us


Telegram Агатов Борис Tech Магазин 4.0
FROM American