معرفی دیتاست و پیکره ParsOffensive جهت تشخیص سخنان ناسزا توی زبان فارسی!
یکی از دوستان ایرانیام در لینکدین پستی منتشر کرده بود که توجه مرا جلب کرد:
🔍 معرفی دیتاست جدید برای تشخیص فحاشی در زبان فارسی
بهتازگی دیتاستی با نام ParsOffensive منتشر شده است که شامل ۸٬۴۳۳ کامنت فارسی از اینستاگرام میباشد. این کامنتها توسط دو متخصص زبانشناسی بهصورت دستی برچسبگذاری شدهاند و به دو دسته «توهینآمیز» و «خنثی» تقسیم میشوند. این مجموعه داده میتواند در پروژههای تحقیقاتی و توسعه مدلهای یادگیری ماشین برای تشخیص زبان توهینآمیز در زبان فارسی مورد استفاده قرار گیرد.
معرفی دیتاست و پیکره ParsOffensive جهت تشخیص سخنان ناسزا توی زبان فارسی!
یکی از دوستان ایرانیام در لینکدین پستی منتشر کرده بود که توجه مرا جلب کرد:
🔍 معرفی دیتاست جدید برای تشخیص فحاشی در زبان فارسی
بهتازگی دیتاستی با نام ParsOffensive منتشر شده است که شامل ۸٬۴۳۳ کامنت فارسی از اینستاگرام میباشد. این کامنتها توسط دو متخصص زبانشناسی بهصورت دستی برچسبگذاری شدهاند و به دو دسته «توهینآمیز» و «خنثی» تقسیم میشوند. این مجموعه داده میتواند در پروژههای تحقیقاتی و توسعه مدلهای یادگیری ماشین برای تشخیص زبان توهینآمیز در زبان فارسی مورد استفاده قرار گیرد.
According to media reports, the privacy watchdog was considering “blacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. Public channels are public to the internet, regardless of whether or not they are subscribed. A public channel is displayed in search results and has a short address (link). Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. In the “Bear Market Screaming Therapy Group” on Telegram, members are only allowed to post voice notes of themselves screaming. Anything else will result in an instant ban from the group, which currently has about 75 members. 3How to create a Telegram channel?
from us