DOTNETCODE Telegram 3067
جستجوی هوشمند یعنی چی؟ با Stemming آشنا شو!

تاحالا شده دنبال کلمه‌ی "خرید" بگردی ولی نتایجی که توشون "خریدم" یا "خریدن" هست رو پیدا نکنی؟ اینجاست که Stemming یا ریشه‌یابی وارد میشه!

---

ریشه‌یابی (Stemming) چیه؟

خیلی ساده‌ست! فرض کن یک هرس‌کننده‌ی هوشمند داری که شاخ و برگ اضافی کلمه‌ها رو میزنه تا به ریشه‌شون برسه.

برای مثال، این کلمات رو در نظر بگیر:
* کتاب‌ها
* کتابی
* کتابخانه

ریشه‌یاب همه‌ی این‌ها رو به یک کلمه‌ی اصلی برمی‌گردونه: "کتاب"

---

چطوری کار می‌کنه؟

وقتی در سیستمی مثل الاستیک‌سرچ (Elasticsearch) از ریشه‌یابی استفاده می‌کنیم، دو تا اتفاق مهم میفته:

۱. موقع ذخیره: وقتی متنی رو ذخیره می‌کنیم، سیستم کلمه‌ها رو به ریشه‌شون تبدیل می‌کنه.
- جمله‌ی "من کتاب‌ها را خواندم" اینطوری ذخیره میشه: "من کتاب را خواند"

۲. موقع جستجو: وقتی تو کلمه‌ی "کتاب" رو جستجو می‌کنی، سیستم دنبال ریشه‌ی "کتاب" می‌گرده و تمام نتایج مرتبط رو پیدا می‌کنه! 🎉

---

چند مثال دیگه:

* رفتم، می‌روی، رفتند ⬅️ رفت
* کارگر، کارها، کارخانه ⬅️ کار
* نوشته، می‌نویسم، نویسنده ⬅️ نویس

---

نتیجه نهایی:

با ریشه‌یابی، دیگه فرقی نمی‌کنه کاربر دنبال "خرید" بگرده یا "خریدار" یا "خریدند"؛ در هر صورت به چیزی که می‌خواد می‌رسه. این یعنی جستجوی دقیق‌تر، نتایج بیشتر و تجربه‌ی کاربری بهتر!

لینک منبع :

https://www.elastic.co/docs/manage-data/data-store/text-analysis/stemming

🎺برای یادگیری بیشتر و دریافت مطالب مفید در زمینه .NET و برنامه‌نویسی، به کانال ما بپیوندید!

📚💻 @dotnetcode 🖥👨‍💻
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👏2👍1



tgoop.com/dotnetcode/3067
Create:
Last Update:

جستجوی هوشمند یعنی چی؟ با Stemming آشنا شو!

تاحالا شده دنبال کلمه‌ی "خرید" بگردی ولی نتایجی که توشون "خریدم" یا "خریدن" هست رو پیدا نکنی؟ اینجاست که Stemming یا ریشه‌یابی وارد میشه!

---

ریشه‌یابی (Stemming) چیه؟

خیلی ساده‌ست! فرض کن یک هرس‌کننده‌ی هوشمند داری که شاخ و برگ اضافی کلمه‌ها رو میزنه تا به ریشه‌شون برسه.

برای مثال، این کلمات رو در نظر بگیر:
* کتاب‌ها
* کتابی
* کتابخانه

ریشه‌یاب همه‌ی این‌ها رو به یک کلمه‌ی اصلی برمی‌گردونه: "کتاب"

---

چطوری کار می‌کنه؟

وقتی در سیستمی مثل الاستیک‌سرچ (Elasticsearch) از ریشه‌یابی استفاده می‌کنیم، دو تا اتفاق مهم میفته:

۱. موقع ذخیره: وقتی متنی رو ذخیره می‌کنیم، سیستم کلمه‌ها رو به ریشه‌شون تبدیل می‌کنه.
- جمله‌ی "من کتاب‌ها را خواندم" اینطوری ذخیره میشه: "من کتاب را خواند"

۲. موقع جستجو: وقتی تو کلمه‌ی "کتاب" رو جستجو می‌کنی، سیستم دنبال ریشه‌ی "کتاب" می‌گرده و تمام نتایج مرتبط رو پیدا می‌کنه! 🎉

---

چند مثال دیگه:

* رفتم، می‌روی، رفتند ⬅️ رفت
* کارگر، کارها، کارخانه ⬅️ کار
* نوشته، می‌نویسم، نویسنده ⬅️ نویس

---

نتیجه نهایی:

با ریشه‌یابی، دیگه فرقی نمی‌کنه کاربر دنبال "خرید" بگرده یا "خریدار" یا "خریدند"؛ در هر صورت به چیزی که می‌خواد می‌رسه. این یعنی جستجوی دقیق‌تر، نتایج بیشتر و تجربه‌ی کاربری بهتر!

لینک منبع :

https://www.elastic.co/docs/manage-data/data-store/text-analysis/stemming

🎺برای یادگیری بیشتر و دریافت مطالب مفید در زمینه .NET و برنامه‌نویسی، به کانال ما بپیوندید!

📚💻 @dotnetcode 🖥👨‍💻

BY DotNet | دات نت




Share with your friend now:
tgoop.com/dotnetcode/3067

View MORE
Open in Telegram


Telegram News

Date: |

As five out of seven counts were serious, Hui sentenced Ng to six years and six months in jail. Hui said the time period and nature of some offences “overlapped” and thus their prison terms could be served concurrently. The judge ordered Ng to be jailed for a total of six years and six months. “[The defendant] could not shift his criminal liability,” Hui said. "Doxxing content is forbidden on Telegram and our moderators routinely remove such content from around the world," said a spokesman for the messaging app, Remi Vaughn. Click “Save” ;
from us


Telegram DotNet | دات نت
FROM American