Warning: mkdir(): No space left on device in /var/www/tgoop/post.php on line 37

Warning: file_put_contents(aCache/aDaily/post/UseDataConfChannel/--): Failed to open stream: No such file or directory in /var/www/tgoop/post.php on line 50
AiConf Channel@UseDataConfChannel P.393

USEDATACONFCHANNEL Telegram 393

Как сжимать большие языковые модели без потери в качестве и скорости?

С докладом на тему «Экстремальное сжатие больших языковых моделей» выступит Денис Кузнеделев из Яндекса🔥

За последние несколько лет был достигнут прогресс в области обработки естественного языка. Однако большой размер и значительный объем вычислений затрудняют внедрение сильных моделей из-за высокой стоимости.

Одним из самых эффективных методов уменьшения размера модели и ускорения ее работы является квантизация — представление параметров в некоторой более компактной форме. Однако при сжатии в 8 и более раз стандартные подходы, сжимающие параметры поодиночке, слишком сильно ухудшают качество работы языковой модели.

Денис расскажет о новом методе квантизации и методе дообучения — вместе они помогают достигать более высоких результатов в качестве и скорости.

✅Подробнее о тезисах выступления — на сайте

Подписывайтесь:

💬

@UseDataConfChannel

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6👍3👌3

www.tgoop.com/UseDataConfChannel/393

255 viewsJul 8 at 12:48

tgoop.com/UseDataConfChannel/393

Create: 2025-07-08
Last Update: 2025-07-23 23:30:05

Как сжимать большие языковые модели без потери в качестве и скорости?

С докладом на тему «Экстремальное сжатие больших языковых моделей» выступит Денис Кузнеделев из Яндекса🔥

За последние несколько лет был достигнут прогресс в области обработки естественного языка. Однако большой размер и значительный объем вычислений затрудняют внедрение сильных моделей из-за высокой стоимости.

Одним из самых эффективных методов уменьшения размера модели и ускорения ее работы является квантизация — представление параметров в некоторой более компактной форме. Однако при сжатии в 8 и более раз стандартные подходы, сжимающие параметры поодиночке, слишком сильно ухудшают качество работы языковой модели.

Денис расскажет о новом методе квантизации и методе дообучения — вместе они помогают достигать более высоких результатов в качестве и скорости.

✅Подробнее о тезисах выступления — на сайте

Подписывайтесь:
💬@UseDataConfChannel

BY AiConf Channel

Share with your friend now:
tgoop.com/UseDataConfChannel/393

Open in Telegram

Telegram News

Date: 2025-07-23|

So far, more than a dozen different members have contributed to the group, posting voice notes of themselves screaming, yelling, groaning, and wailing in various pitches and rhythms. Select “New Channel” How to Create a Private or Public Channel on Telegram? The main design elements of your Telegram channel include a name, bio (brief description), and avatar. Your bio should be: Informative
from us

Warning: filemtime(): stat failed for aCache/aDaily/post/UseDataConfChannel/-- in /var/www/tgoop/post.php on line 323

Warning: filemtime(): stat failed for aCache/aDaily/post/UseDataConfChannel/-- in /var/www/tgoop/post.php on line 324

Как сжимать большие языковые модели без потери в качестве и скорости?

AiConf Channel TG
web: 393
AiConf Channel.Telegram web
AiConf Channel Telegram TG Channel
Telegram Updated: 1970-01-01 00:00:00

Telegram AiConf Channel
FROM American