DS_INTERVIEW_LIB Telegram 945
👌 Как правильно инициализировать центроиды в k-means, чтобы не застрять в плохом локальном минимуме

Простая случайная инициализация (выбор k случайных точек из данных) может привести к плохому результату, особенно если точки окажутся слишком близко друг к другу или не отражают структуру данных.

🔥 Лучшее решение — использовать алгоритм k-means++

Он работает так:
1. Сначала выбирается одна случайная точка из данных.
2. Далее каждый следующий центр выбирается с вероятностью, пропорциональной квадрату расстояния до ближайшего уже выбранного центра.

Такой подход равномерно распределяет центры и уменьшает риск плохой сходимости. В большинстве случаев он ещё и ускоряет обучение.

💡 В сложных случаях (например, потоковые данные или неустойчивое распределение) можно использовать:
Инициализацию на основе иерархической кластеризации.
Несколько прогонов с разными начальными условиями и выбор лучшего результата по ошибке.

Библиотека собеса по Data Science



tgoop.com/ds_interview_lib/945
Create:
Last Update:

👌 Как правильно инициализировать центроиды в k-means, чтобы не застрять в плохом локальном минимуме

Простая случайная инициализация (выбор k случайных точек из данных) может привести к плохому результату, особенно если точки окажутся слишком близко друг к другу или не отражают структуру данных.

🔥 Лучшее решение — использовать алгоритм k-means++

Он работает так:
1. Сначала выбирается одна случайная точка из данных.
2. Далее каждый следующий центр выбирается с вероятностью, пропорциональной квадрату расстояния до ближайшего уже выбранного центра.

Такой подход равномерно распределяет центры и уменьшает риск плохой сходимости. В большинстве случаев он ещё и ускоряет обучение.

💡 В сложных случаях (например, потоковые данные или неустойчивое распределение) можно использовать:
Инициализацию на основе иерархической кластеризации.
Несколько прогонов с разными начальными условиями и выбор лучшего результата по ошибке.

Библиотека собеса по Data Science

BY Библиотека собеса по Data Science | вопросы с собеседований


Share with your friend now:
tgoop.com/ds_interview_lib/945

View MORE
Open in Telegram


Telegram News

Date: |

During the meeting with TSE Minister Edson Fachin, Perekopsky also mentioned the TSE channel on the platform as one of the firm's key success stories. Launched as part of the company's commitments to tackle the spread of fake news in Brazil, the verified channel has attracted more than 184,000 members in less than a month. 1What is Telegram Channels? 4How to customize a Telegram channel? 6How to manage your Telegram channel? Select “New Channel”
from us


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM American