tgoop.com/opendatascience/2546
Last Update:
Релиз двух новых моделей и обновление нейминга серии RuadaptQwen3 🎉
Мы подготовили целых два релиза:
- 🚀 Адаптированная Qwen3-8B
→ RuadaptQwen3-8B-Hybrid
- 🚀 Адаптированная Qwen3-4B-Instruct-2507
→ RuadaptQwen3-4B-Instruct
Обе модели достойно себя показывают и обладают нашим Ruadapt токенайзером. В частности, мы недавно измерили разницу в скорости генерации (RuadaptQwen3-4B-Instruct
против Qwen3-4B-Instruct-2507
):
- ⚡️ Скорость генерации ответов на ru_arena_hard вопросы — на 40% быстрее для Ruadapt версий!
- ⚡️ Скорость ответа на вопрос в 300 тыс. символов — на 83% быстрее!
Также важный анонс по поводу нейминга моделей 🔄:
Все текущие RuadaptQwen3
модели будут вскоре переименованы из RuadaptQwen3-XB-Instruct
→ в RuadaptQwen3-XB-Hybrid
, так как по сути они являются моделями с гибридным ризонингом (4B модель уже переименована, 32B на днях).
А чисто инструктивные версии будут называться RuadaptQwen3-XB-Instruct
(как, например, адаптация Qwen3-4B-Instruct-2507
).
Модели на HuggingFace:
https://huggingface.co/RefalMachine/RuadaptQwen3-8B-Hybrid
https://huggingface.co/RefalMachine/RuadaptQwen3-8B-Hybrid-GGUF
https://huggingface.co/RefalMachine/RuadaptQwen3-4B-Instruct
https://huggingface.co/RefalMachine/RuadaptQwen3-4B-Instruct-GGUF
BY Data Science by ODS.ai 🦜

Share with your friend now:
tgoop.com/opendatascience/2546