КПД@quant_prune_distill P.273

КПД

[Блог Nvidia][пост на addmeto]

Пока все находятся в томном ожидании релиза 🦙-3 400B Nvidia сделали ход конем и выкатили семейство здоровенных херовин.

Знакомьтесь - Nemotron-4!
Идет в трех комплектациях:
1️⃣Base - претрейн
2️⃣Instruct - дообучение на инструкциях
3️⃣Reward - reward model для RL alignment, обученная поверх Base

Предобучалось оно на 9 триллионах токенах из 50+ человеческих языков и 40+ языков программирования.
Для alignment использовали набор из 20к инструкций, который выложили в открытый доступ.
Контекст коротковат по современным меркам - всего 4к токенов, небось больше не лезло во время обучения 😅.

Скоры на бенчах весьма достойны. На свежей ArenaHard от lmsys уступают лишь свежим версиям чат-гопоты и Клод Опус. На lmsys arena было бы еще интересно глянуть Elo Score.

Ну и самая интересная деталь - размер 340B параметров, т.е 640Gb на одни лишь веса в fp16. Как вы ее будете инферить - это ваша проблема)

Задача экстремальной квантизации уже не вместить LLMку именно на consumer-grade GPU, а хоть на какую-то)

Но зеленым, конечно, спасибо за такой вклад в опенсорс)

👍26🍾3👏2

www.tgoop.com/quant_prune_distill/273

1.83K viewsedited Jun 14, 2024 at 20:26

tgoop.com/quant_prune_distill/273

Create: 2024-06-14
Last Update: 2025-09-07 11:28:35

BY КПД

Share with your friend now:
tgoop.com/quant_prune_distill/273

Telegram News

[Блог Nvidia][пост на addmeto]