Forwarded from Нейродвиж
⚡️ LLaMa 4 ВЫШЛА — Цукербург растоптал Claude 3.7 и GPT-4.5. При этом у его модели ДЕСЯТЬ МИЛЛИОНАМОВ токенов контекста — можно загрузить все тома «Войны и мира» ДВА РАЗА.
В семействе три модели:
— Behemoth: 2 ТРИЛЛИОНА параметров, в опенсорс не ушла. Использовалась для дистилляции (обучения) младших моделей. Королевская модель, но пока только показывают;
— Scout: 17B активных параметров, 109B всего. Это как раз та модель с 10 миллионами токенов контекста, но не такая умная, как:
— Maverick: 17B активных и 400B всего. Контекст — всего миллион токенов, зато отличные результаты в бенчмарках. Лучшая модель Meta на данный момент из тех, что доступны.
Скачать можно здесь.
В семействе три модели:
— Behemoth: 2 ТРИЛЛИОНА параметров, в опенсорс не ушла. Использовалась для дистилляции (обучения) младших моделей. Королевская модель, но пока только показывают;
— Scout: 17B активных параметров, 109B всего. Это как раз та модель с 10 миллионами токенов контекста, но не такая умная, как:
— Maverick: 17B активных и 400B всего. Контекст — всего миллион токенов, зато отличные результаты в бенчмарках. Лучшая модель Meta на данный момент из тех, что доступны.
Скачать можно здесь.
🔥86👍30❤10😁5👨💻2
tgoop.com/codecamp/7299
Create:
Last Update:
Last Update:
⚡️ LLaMa 4 ВЫШЛА — Цукербург растоптал Claude 3.7 и GPT-4.5. При этом у его модели ДЕСЯТЬ МИЛЛИОНАМОВ токенов контекста — можно загрузить все тома «Войны и мира» ДВА РАЗА.
В семействе три модели:
— Behemoth: 2 ТРИЛЛИОНА параметров, в опенсорс не ушла. Использовалась для дистилляции (обучения) младших моделей. Королевская модель, но пока только показывают;
— Scout: 17B активных параметров, 109B всего. Это как раз та модель с 10 миллионами токенов контекста, но не такая умная, как:
— Maverick: 17B активных и 400B всего. Контекст — всего миллион токенов, зато отличные результаты в бенчмарках. Лучшая модель Meta на данный момент из тех, что доступны.
Скачать можно здесь.
В семействе три модели:
— Behemoth: 2 ТРИЛЛИОНА параметров, в опенсорс не ушла. Использовалась для дистилляции (обучения) младших моделей. Королевская модель, но пока только показывают;
— Scout: 17B активных параметров, 109B всего. Это как раз та модель с 10 миллионами токенов контекста, но не такая умная, как:
— Maverick: 17B активных и 400B всего. Контекст — всего миллион токенов, зато отличные результаты в бенчмарках. Лучшая модель Meta на данный момент из тех, что доступны.
Скачать можно здесь.
BY CodeCamp


Share with your friend now:
tgoop.com/codecamp/7299