tgoop.com/pulatov_kh/3036
Last Update:
UzLiB – o‘zbekcha lingvistik benchmark
Biz o‘zbek tilini tushunish darajasini baholashga mo‘ljallangan ilk keng qamrovli benchmark (mezonlar to‘plami) – UzLiB (Uzbek Linguistic Benchmark)ni ommaga taqdim etyapmiz. UzLiB bu — sun’iy intellekt modellarining o‘zbekcha so‘zlarning to‘g‘ri shakllari va qo‘llanishini qanchalik tushunishini sinaydigan savollar to‘plami.
Benchmarkni yaratish uchun Telegramdagi o‘zbek tilshunosligiga oid kanallardan viktorinalar yig‘dik. Ularni standartlashtirib, 1861 ta yuqori sifatli savoldan iborat to‘plam shakllantirdik.
UzLiB yordamida 20 dan ortiq til modelini sinovdan o‘tkazdik. Eng yaxshi natijalarni Claude 3.5 Sonnet (63.62%), Gemini 2.0 Pro (63.03%) va GPT-4 (62.87%) ko‘rsatdi. Bu odamlarning o‘rtacha natijasidan (59%) yuqoriroq.
Benchmarkni yanada takomillashtirish va kengaytirish rejalashtirilgan. Barcha tadqiqotchilarni UzLiB’dan foydalanishga va uni rivojlantirishga hissa qo‘shishga chaqiramiz.
Batafsil: https://tilmoch.ai/uz/uzlib-ozbekcha-lingvistik-benchmark
BY АйPulatov
Share with your friend now:
tgoop.com/pulatov_kh/3036