PULATOV_KH Telegram 2938
Искусственный интеллект превзошел людей в тесте на грамотность узбекского языка

Команда проектов UzLiB и Tahrirchi.uz собрали тесты на грамотность, опубликованные в Telegram-каналах @oriftolib, @xatoliklar, @tahrir_uz и @tahrirchi_uz, и предложили их разным ИИ-моделям. Участникам (и людям, и ИИ) предлагалось выполнить задания на:

Определение правильных слов – насколько точно модель выбирает нужные слова.
Понимание значения – как хорошо ИИ распознает смысл слов.
Контекстное понимание – насколько правильно модель интерпретирует слова в зависимости от ситуации.
Заполнение пропусков – насколько точно модель может дополнить пропущенные слова.

Какие модели показали лучшие результаты?

В тесте приняли участие ведущие ИИ-решения от Google, OpenAI, Meta, Microsoft и других компаний.
Вот лидеры рейтинга:

🥇
Gemini 2.0 Pro Experimental (Google) – 63,03%
🥈
GPT-4o (OpenAI) – 62,87%
🥉
Gemini 2.0 Flash (Google) – 60,88%
🏅
Claude 3.7 Sonnet (Anthropic) – 59,38%

Для сравнения, средний показатель
человеческих участников составил 58,94%.

То есть
ИИ уже опережает людей по грамотности в узбекском языке. Особенно высокие результаты продемонстрировали модели от Google и OpenAI, а вот Meta, Microsoft и Mistral AI пока уступают лидерам.



tgoop.com/pulatov_kh/2938
Create:
Last Update:

Искусственный интеллект превзошел людей в тесте на грамотность узбекского языка

Команда проектов UzLiB и Tahrirchi.uz собрали тесты на грамотность, опубликованные в Telegram-каналах @oriftolib, @xatoliklar, @tahrir_uz и @tahrirchi_uz, и предложили их разным ИИ-моделям. Участникам (и людям, и ИИ) предлагалось выполнить задания на:

Определение правильных слов – насколько точно модель выбирает нужные слова.
Понимание значения – как хорошо ИИ распознает смысл слов.
Контекстное понимание – насколько правильно модель интерпретирует слова в зависимости от ситуации.
Заполнение пропусков – насколько точно модель может дополнить пропущенные слова.

Какие модели показали лучшие результаты?

В тесте приняли участие ведущие ИИ-решения от Google, OpenAI, Meta, Microsoft и других компаний.
Вот лидеры рейтинга:

🥇
Gemini 2.0 Pro Experimental (Google) – 63,03%
🥈
GPT-4o (OpenAI) – 62,87%
🥉
Gemini 2.0 Flash (Google) – 60,88%
🏅
Claude 3.7 Sonnet (Anthropic) – 59,38%

Для сравнения, средний показатель
человеческих участников составил 58,94%.

То есть
ИИ уже опережает людей по грамотности в узбекском языке. Особенно высокие результаты продемонстрировали модели от Google и OpenAI, а вот Meta, Microsoft и Mistral AI пока уступают лидерам.

BY АйPulatov




Share with your friend now:
tgoop.com/pulatov_kh/2938

View MORE
Open in Telegram


Telegram News

Date: |

Your posting frequency depends on the topic of your channel. If you have a news channel, it’s OK to publish new content every day (or even every hour). For other industries, stick with 2-3 large posts a week. Activate up to 20 bots The best encrypted messaging apps Telegram users themselves will be able to flag and report potentially false content. best-secure-messaging-apps-shutterstock-1892950018.jpg
from us


Telegram АйPulatov
FROM American