tgoop.com/dsproglib/5626
Last Update:
✍️ Что такое косинусное сходство (cosine similarity) и какие альтернативные методы существуют?
Cosine similarity используется для оценки сходства двух векторов. В сущности, это косинус угла между двумя векторами. Значения cosine similarity варьируются от -1 до 1. Однако для большинства задач с положительными векторами (например, текстовые данные, векторы признаков), значения лежат в диапазоне от 0 до 1. При этом:
▪️ 1 означает полное совпадение (вектора направлены в одну и ту же сторону).
▪️ 0 указывает на отсутствие сходства (вектора перпендикулярны друг другу).
▪️ -1 указывает на полную противоположность (вектора направлены в противоположные стороны).
Как ещё можно оценивать сходство векторов? Вот некоторые способы:
▫️Евклидово расстояние;
▫️Манхэттенское расстояние;
▫️Расстояние Чебышева.
Подробнее о них и о том, как они применимы в LLM, читайте в статье 👈
BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Share with your friend now:
tgoop.com/dsproglib/5626