🌀Почему в некоторых случаях полезно обучать модель на данных, полученных… от другой модели
Обучение на предсказаниях другой модели — это основа подхода под названием knowledge distillation (дистилляция знаний). Идея в том, что сложная, тяжёлая модель (например, глубокая нейросеть) может содержать более «мягкую» и богатую информацию о структуре задачи, чем просто метки «0» и «1».
Маленькая модель, обучающаяся не на оригинальных метках, а на вероятностных предсказаниях большой модели, может: ➡️лучше улавливать обобщённые закономерности, ➡️достигать качества, близкого к исходной модели, ➡️быть гораздо быстрее и легче в продакшене.
Это особенно полезно, когда требуется deploy в ограниченной среде (например, на мобильных устройствах), но не хочется терять в качестве. Получается, что модель может «учиться у другой модели», как ученик у учителя — и это работает.
🌀Почему в некоторых случаях полезно обучать модель на данных, полученных… от другой модели
Обучение на предсказаниях другой модели — это основа подхода под названием knowledge distillation (дистилляция знаний). Идея в том, что сложная, тяжёлая модель (например, глубокая нейросеть) может содержать более «мягкую» и богатую информацию о структуре задачи, чем просто метки «0» и «1».
Маленькая модель, обучающаяся не на оригинальных метках, а на вероятностных предсказаниях большой модели, может: ➡️лучше улавливать обобщённые закономерности, ➡️достигать качества, близкого к исходной модели, ➡️быть гораздо быстрее и легче в продакшене.
Это особенно полезно, когда требуется deploy в ограниченной среде (например, на мобильных устройствах), но не хочется терять в качестве. Получается, что модель может «учиться у другой модели», как ученик у учителя — и это работает.
Developing social channels based on exchanging a single message isn’t exactly new, of course. Back in 2014, the “Yo” app was launched with the sole purpose of enabling users to send each other the greeting “Yo.” On June 7, Perekopsky met with Brazilian President Jair Bolsonaro, an avid user of the platform. According to the firm's VP, the main subject of the meeting was "freedom of expression." bank east asia october 20 kowloon Informative When choosing the right name for your Telegram channel, use the language of your target audience. The name must sum up the essence of your channel in 1-3 words. If you’re planning to expand your Telegram audience, it makes sense to incorporate keywords into your name.
from us