CL & NLP Enthusiasts@ComputationallinguisticsNLP P.170

COMPUTATIONALLINGUISTICSNLP Telegram 170

CL & NLP Enthusiasts

تعارف ایرانی

یک پژوهش تازه (با اسم جالب TAAROF BENCH) روی ۵ مدل زبانی معروف مثل Claude 3.5، GPT-4o، Llama 3، DeepSeek V3 و Dorna (مدل بومی‌شده برای فارسی) انجام شده است. هدفش بررسی اینه که این مدل‌ها چقدر می‌تونن تعارف ایرانی رو درست بفهمن.
🔎 نتایج اصلی:
ایرانی‌های native: ‌۸۱.۸٪ پاسخ درست
ایرانی‌های مهاجر (heritage speakers): ۶۰٪
غیرایرانی‌ها (تقریباً مثل AIها): ۴۲.۳٪ موفقیت
مدل‌های بزرگ زبانی: فقط ۳۴–۴۲٪ موفقیت
📊 جالب اینجاست که وقتی همین مدل‌ها رو به زبان فارسی تست کردن:
DeepSeek V3 از ۳۶.۶٪ به ۶۸.۶٪ جهش کرد!
GPT-4o هم ۲۳٪ بهبود داشت.
مدل‌های کوچکتر مثل Llama 3 و Dorna فقط ۱۰–۱۲٪ بهتر شدن.
@computationallinguisticsNLP

❤1👍1🙏1👌1

www.tgoop.com/ComputationallinguisticsNLP/170

327 viewsOct 2 at 07:41

tgoop.com/ComputationallinguisticsNLP/170

Create: 2025-10-02
Last Update: 2025-10-24 10:28:38

تعارف ایرانی

یک پژوهش تازه (با اسم جالب TAAROF BENCH) روی ۵ مدل زبانی معروف مثل Claude 3.5، GPT-4o، Llama 3، DeepSeek V3 و Dorna (مدل بومی‌شده برای فارسی) انجام شده است. هدفش بررسی اینه که این مدل‌ها چقدر می‌تونن تعارف ایرانی رو درست بفهمن.
🔎 نتایج اصلی:
ایرانی‌های native: ‌۸۱.۸٪ پاسخ درست
ایرانی‌های مهاجر (heritage speakers): ۶۰٪
غیرایرانی‌ها (تقریباً مثل AIها): ۴۲.۳٪ موفقیت
مدل‌های بزرگ زبانی: فقط ۳۴–۴۲٪ موفقیت
📊 جالب اینجاست که وقتی همین مدل‌ها رو به زبان فارسی تست کردن:
DeepSeek V3 از ۳۶.۶٪ به ۶۸.۶٪ جهش کرد!
GPT-4o هم ۲۳٪ بهبود داشت.
مدل‌های کوچکتر مثل Llama 3 و Dorna فقط ۱۰–۱۲٪ بهتر شدن.
@computationallinguisticsNLP

BY CL & NLP Enthusiasts

Share with your friend now:
tgoop.com/ComputationallinguisticsNLP/170

Open in Telegram

Telegram News

Date: 2025-10-24|

How to Create a Private or Public Channel on Telegram? The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. Click “Save” ; Telegram message that reads: "Bear Market Screaming Therapy Group. You are only allowed to send screaming voice notes. Everything else = BAN. Text pics, videos, stickers, gif = BAN. Anything other than screaming = BAN. You think you are smart = BAN. SUCK Channel Telegram
from us

Telegram CL & NLP Enthusiasts
FROM American