MACHINELEARNING_INTERVIEW Telegram 1390
Forwarded from Machinelearning
🌟 ДинамичСскоС 4-Π±ΠΈΡ‚Π½ΠΎΠ΅ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ VLM с ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½Π½ΠΎΠΉ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΡ‚ Unsolth .

Unsloth прСдставил практичСский ΠΌΠ΅Ρ‚ΠΎΠ΄ динамичСского 4-Π±ΠΈΡ‚Π½ΠΎΠ³ΠΎ квантования VLM, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ сниТСния точности популярных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² квантования AWQ, Bitsandbytes, GPTQ ΠΈ HQQ.

Π’ экспСримСнтС использовался Bitsandbytes Π² качСствС основы для всСх Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… слоСв, Π½ΠΎ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π±Ρ‹Π»ΠΎ динамичСски ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΎ. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ» Π΄ΠΎΠ±ΠΈΡ‚ΡŒΡΡ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ точности ΠΏΡ€ΠΈ использовании всСго Π½Π° 10% большС VRAM ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с стандартным 4-Π±ΠΈΡ‚Π½Ρ‹ΠΌ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Bitsandbytes.

Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅, этот ΠΌΠ΅Ρ‚ΠΎΠ΄ позволяСт ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π±Π»ΠΈΠ·ΠΊΡƒΡŽ ΠΊ 16-Π±ΠΈΡ‚Π½ΠΎΠΉ точности, ΠΏΡ€ΠΈ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ сокращСнии Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ВСстированиС Π½Π° VL-модСлях Llama 3.2 Vision, Qwen2 Vision ΠΈ Pixtral, ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ прСимущСства ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ со стандартным 4-Π±ΠΈΡ‚Π½Ρ‹ΠΌ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ. НапримСр, ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ Qwen2 Vision 2B Π΄ΠΎ 4 Π±ΠΈΡ‚ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΠ»ΠΎ ΠΊ ΠΏΠΎΠ»Π½ΠΎΠΉ ΠΏΠΎΠ»ΠΎΠΌΠΊΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ΠΌΠ΅Ρ‚ΠΎΠ΄ динамичСского квантования позволял Π²ΠΎΡΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΈ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠΈ использования памяти всСго Π½Π° 450 ΠœΠ‘.

Аналогичным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΎΡΡŒ Π²ΠΎΡΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Llama 3.2 Vision 11B ΠΈ Pixtral 12B, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Π°ΠΊΠΆΠ΅ Π΄Π΅Π³Ρ€Π°Π΄ΠΈΡ€ΠΎΠ²Π°Π»ΠΈ Π½Π° стандартном 4-Π±ΠΈΡ‚Π½ΠΎΠΌ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠΈ.

▢️В ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΉ доступ Π½Π° HF ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΡƒΡ‡Π°ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π² исслСдовании:

🟒Llama-3.2-11B-Vision-Instruct-unsloth-bnb-4bit (7.23 GB)

🟒Llama-3.2-11B-Vision-unsloth-bnb-4bit (7.23 GB)

🟠Qwen2-VL-2B-Instruct-unsloth-bnb-4bit (1.81 GB)

🟠Qwen2-VL-7B-Instruct-unsloth-bnb-4bit (6.3 GB)

🟠QwQ-32B-Preview-unsloth-bnb-4bit

🟒Pixtral-12B-2409-unsloth-bnb-4bit (8.42GB)


⚠️ К ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² Model Card ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ Π±Π»ΠΎΠΊΠ½ΠΎΡ‚ для запуска Π² Google Collab ΠΈ созданныС сообщСством GGUF-вСрсии.


πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ:

πŸŸ Π‘Π΅ΠΌΠ΅ΠΉΡΡ‚Π²ΠΎ Llama: Llama 3.2 Community License Agreement
πŸŸ’Π‘Π΅ΠΌΠ΅ΠΉΡΡ‚Π²ΠΎ Qwen: Apache 2.0 License.
🟒Pixtral: Apache 2.0 License.


πŸŸ‘Π‘Ρ‚Π°Ρ‚ΡŒΡ
πŸŸ‘ΠΠ°Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ
πŸŸ‘Π‘ΠΎΠΎΠ±Ρ‰Π΅ΡΡ‚Π²ΠΎ Π² Discord


@ai_machinelearning_big_data

#AI #ML #VLM #Unsolth #Quantization
Please open Telegram to view this post
VIEW IN TELEGRAM
πŸ”₯7❀4πŸ‘3



tgoop.com/machinelearning_interview/1390
Create:
Last Update:

🌟 ДинамичСскоС 4-Π±ΠΈΡ‚Π½ΠΎΠ΅ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ VLM с ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½Π½ΠΎΠΉ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΡ‚ Unsolth .

Unsloth прСдставил практичСский ΠΌΠ΅Ρ‚ΠΎΠ΄ динамичСского 4-Π±ΠΈΡ‚Π½ΠΎΠ³ΠΎ квантования VLM, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ сниТСния точности популярных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² квантования AWQ, Bitsandbytes, GPTQ ΠΈ HQQ.

Π’ экспСримСнтС использовался Bitsandbytes Π² качСствС основы для всСх Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… слоСв, Π½ΠΎ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π±Ρ‹Π»ΠΎ динамичСски ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΎ. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ» Π΄ΠΎΠ±ΠΈΡ‚ΡŒΡΡ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ точности ΠΏΡ€ΠΈ использовании всСго Π½Π° 10% большС VRAM ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с стандартным 4-Π±ΠΈΡ‚Π½Ρ‹ΠΌ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Bitsandbytes.

Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅, этот ΠΌΠ΅Ρ‚ΠΎΠ΄ позволяСт ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π±Π»ΠΈΠ·ΠΊΡƒΡŽ ΠΊ 16-Π±ΠΈΡ‚Π½ΠΎΠΉ точности, ΠΏΡ€ΠΈ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ сокращСнии Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ВСстированиС Π½Π° VL-модСлях Llama 3.2 Vision, Qwen2 Vision ΠΈ Pixtral, ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ прСимущСства ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ со стандартным 4-Π±ΠΈΡ‚Π½Ρ‹ΠΌ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ. НапримСр, ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ Qwen2 Vision 2B Π΄ΠΎ 4 Π±ΠΈΡ‚ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΠ»ΠΎ ΠΊ ΠΏΠΎΠ»Π½ΠΎΠΉ ΠΏΠΎΠ»ΠΎΠΌΠΊΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ΠΌΠ΅Ρ‚ΠΎΠ΄ динамичСского квантования позволял Π²ΠΎΡΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΈ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠΈ использования памяти всСго Π½Π° 450 ΠœΠ‘.

Аналогичным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΎΡΡŒ Π²ΠΎΡΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Llama 3.2 Vision 11B ΠΈ Pixtral 12B, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Π°ΠΊΠΆΠ΅ Π΄Π΅Π³Ρ€Π°Π΄ΠΈΡ€ΠΎΠ²Π°Π»ΠΈ Π½Π° стандартном 4-Π±ΠΈΡ‚Π½ΠΎΠΌ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠΈ.

▢️В ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΉ доступ Π½Π° HF ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΡƒΡ‡Π°ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π² исслСдовании:

🟒Llama-3.2-11B-Vision-Instruct-unsloth-bnb-4bit (7.23 GB)

🟒Llama-3.2-11B-Vision-unsloth-bnb-4bit (7.23 GB)

🟠Qwen2-VL-2B-Instruct-unsloth-bnb-4bit (1.81 GB)

🟠Qwen2-VL-7B-Instruct-unsloth-bnb-4bit (6.3 GB)

🟠QwQ-32B-Preview-unsloth-bnb-4bit

🟒Pixtral-12B-2409-unsloth-bnb-4bit (8.42GB)


⚠️ К ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² Model Card ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ Π±Π»ΠΎΠΊΠ½ΠΎΡ‚ для запуска Π² Google Collab ΠΈ созданныС сообщСством GGUF-вСрсии.


πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ:

πŸŸ Π‘Π΅ΠΌΠ΅ΠΉΡΡ‚Π²ΠΎ Llama: Llama 3.2 Community License Agreement
πŸŸ’Π‘Π΅ΠΌΠ΅ΠΉΡΡ‚Π²ΠΎ Qwen: Apache 2.0 License.
🟒Pixtral: Apache 2.0 License.


πŸŸ‘Π‘Ρ‚Π°Ρ‚ΡŒΡ
πŸŸ‘ΠΠ°Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ
πŸŸ‘Π‘ΠΎΠΎΠ±Ρ‰Π΅ΡΡ‚Π²ΠΎ Π² Discord


@ai_machinelearning_big_data

#AI #ML #VLM #Unsolth #Quantization

BY Machine learning Interview




Share with your friend now:
tgoop.com/machinelearning_interview/1390

View MORE
Open in Telegram


Telegram News

Date: |

While some crypto traders move toward screaming as a coping mechanism, many mental health experts have argued that β€œscream therapy” is pseudoscience. Scientific research or no, it obviously feels good. To upload a logo, click the Menu icon and select β€œManage Channel.” In a new window, hit the Camera icon. Telegram iOS app: In the β€œChats” tab, click the new message icon in the right upper corner. Select β€œNew Channel.” It’s yet another bloodbath on Satoshi Street. As of press time, Bitcoin (BTC) and the broader cryptocurrency market have corrected another 10 percent amid a massive sell-off. Ethereum (EHT) is down a staggering 15 percent moving close to $1,000, down more than 42 percent on the weekly chart. Telegram Android app: Open the chats list, click the menu icon and select β€œNew Channel.”
from us


Telegram Machine learning Interview
FROM American