Warning: mkdir(): No space left on device in /var/www/tgoop/post.php on line 37

Warning: file_put_contents(aCache/aDaily/post/bigdata_1/-947-948-947-): Failed to open stream: No such file or directory in /var/www/tgoop/post.php on line 50
BigData@bigdata_1 P.948
BIGDATA_1 Telegram 948
🌟 GuideLLM: ΠžΡ†Π΅Π½ΠΊΠ° ΠΈ Π°Π½Π°Π»ΠΈΠ· ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ LLM Π² Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… условиях.

GuideLLM - инструмСнт для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ развСртывания LLM. ΠœΠΎΠ΄Π΅Π»ΠΈΡ€ΡƒΡ Ρ€Π°Π±ΠΎΡ‡ΠΈΠ΅ Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ ΠΏΠΎ инфСрСнсу Π² Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… условиях, GuideLLM ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ, потрСбности Π² рСсурсах ΠΈ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΏΠΎ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΠΉ Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΈ для запуска LLM.

ВозмоТности :

πŸŸ’ΠžΡ†Π΅Π½ΠΊΠ° ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ: Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠΉΡ‚Π΅ инфСрСнс LLM ΠΏΡ€ΠΈ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… сцСнариях Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ;

πŸŸ’ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡ рСсурсов: ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚Π΅ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ подходящиС ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΈ оборудования для ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Ρ†Π΅Π»Π΅Π²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ;

πŸŸ’ΠžΡ†Π΅Π½ΠΊΠ° Π·Π°Ρ‚Ρ€Π°Ρ‚: ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ финансовых послСдствий Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… стратСгий развСртывания ΠΈ принятиС обоснованных Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ для ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Π·Π°Ρ‚Ρ€Π°Ρ‚;

πŸŸ’Π’Π΅ΡΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΠΈ: имитация ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ с большим количСством ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ.

Для использования GuideLLM трСбуСтся OpenAI-совмСстимый сСрвСр, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, vLLM. ЦСлСвая модСль для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ‰Π΅Π½Π° ΠΊΠ°ΠΊ локально, Ρ‚Π°ΠΊ ΠΈ Π² сСти.

▢️ Установка ΠΈ запуск Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½Π½ΠΎΠΉ Llama-3.1-8B :


# Установка ΠΈΠ· pip
pip install guidellm

# Запуск ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² vLLM
vllm serve "neuralmagic/Meta-Llama-3.1-8B-Instruct-quantized.w4a16"

# Запуск GuideLLM
guidellm \
--target "http://localhost:8000/v1" \
--model "neuralmagic/Meta-Llama-3.1-8B-Instruct-quantized.w4a16" \
--data-type emulated \
--data "prompt_tokens=512,generated_tokens=128"


По ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ, GuideLLM ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ ΡΠ΅Ρ€ΠΈΡŽ ΠΎΡ†Π΅Π½ΠΎΠΊ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ с Ρ€Π°Π·Π½ΠΎΠΉ частотой запросов, каТдая ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… длится 120 сСкунд, ΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ выводятся Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Π».
ПослС Π·Π°Π²Π΅Ρ€ΡˆΠ΅Π½ΠΈΡ ΠΎΡ†Π΅Π½ΠΊΠΈ GuideLLM ΠΏΠΎΠ΄Π²Π΅Π΄Π΅Ρ‚ ΠΈΡ‚ΠΎΠ³ΠΈ, Π² Ρ‚ΠΎΠΌ числС - ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ эффСктивности.


ДокумСнтация ΠΊ находится Π² стадии Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ. ΠŸΠΎΠ»Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΎΠΏΡ†ΠΈΠΉ запуска ΠΈ конфигурирования GuideLLM ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠΎΠΌΠ°Π½Π΄Π°ΠΌΠΈ
guidellm --help ΠΈ guidellm-config

https://github.com/neuralmagic/guidellm

πŸ‘‰ @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM



tgoop.com/bigdata_1/948
Create:
Last Update:

🌟 GuideLLM: ΠžΡ†Π΅Π½ΠΊΠ° ΠΈ Π°Π½Π°Π»ΠΈΠ· ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ LLM Π² Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… условиях.

GuideLLM - инструмСнт для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ развСртывания LLM. ΠœΠΎΠ΄Π΅Π»ΠΈΡ€ΡƒΡ Ρ€Π°Π±ΠΎΡ‡ΠΈΠ΅ Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ ΠΏΠΎ инфСрСнсу Π² Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… условиях, GuideLLM ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ, потрСбности Π² рСсурсах ΠΈ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΏΠΎ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΠΉ Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΈ для запуска LLM.

ВозмоТности :

πŸŸ’ΠžΡ†Π΅Π½ΠΊΠ° ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ: Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠΉΡ‚Π΅ инфСрСнс LLM ΠΏΡ€ΠΈ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… сцСнариях Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ;

πŸŸ’ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡ рСсурсов: ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚Π΅ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ подходящиС ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΈ оборудования для ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Ρ†Π΅Π»Π΅Π²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ;

πŸŸ’ΠžΡ†Π΅Π½ΠΊΠ° Π·Π°Ρ‚Ρ€Π°Ρ‚: ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ финансовых послСдствий Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… стратСгий развСртывания ΠΈ принятиС обоснованных Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ для ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Π·Π°Ρ‚Ρ€Π°Ρ‚;

πŸŸ’Π’Π΅ΡΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΠΈ: имитация ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ с большим количСством ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ.

Для использования GuideLLM трСбуСтся OpenAI-совмСстимый сСрвСр, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, vLLM. ЦСлСвая модСль для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ‰Π΅Π½Π° ΠΊΠ°ΠΊ локально, Ρ‚Π°ΠΊ ΠΈ Π² сСти.

▢️ Установка ΠΈ запуск Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½Π½ΠΎΠΉ Llama-3.1-8B :


# Установка ΠΈΠ· pip
pip install guidellm

# Запуск ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² vLLM
vllm serve "neuralmagic/Meta-Llama-3.1-8B-Instruct-quantized.w4a16"

# Запуск GuideLLM
guidellm \
--target "http://localhost:8000/v1" \
--model "neuralmagic/Meta-Llama-3.1-8B-Instruct-quantized.w4a16" \
--data-type emulated \
--data "prompt_tokens=512,generated_tokens=128"


По ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ, GuideLLM ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ ΡΠ΅Ρ€ΠΈΡŽ ΠΎΡ†Π΅Π½ΠΎΠΊ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ с Ρ€Π°Π·Π½ΠΎΠΉ частотой запросов, каТдая ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… длится 120 сСкунд, ΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ выводятся Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Π».
ПослС Π·Π°Π²Π΅Ρ€ΡˆΠ΅Π½ΠΈΡ ΠΎΡ†Π΅Π½ΠΊΠΈ GuideLLM ΠΏΠΎΠ΄Π²Π΅Π΄Π΅Ρ‚ ΠΈΡ‚ΠΎΠ³ΠΈ, Π² Ρ‚ΠΎΠΌ числС - ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ эффСктивности.


ДокумСнтация ΠΊ находится Π² стадии Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ. ΠŸΠΎΠ»Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΎΠΏΡ†ΠΈΠΉ запуска ΠΈ конфигурирования GuideLLM ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠΎΠΌΠ°Π½Π΄Π°ΠΌΠΈ
guidellm --help ΠΈ guidellm-config

https://github.com/neuralmagic/guidellm

πŸ‘‰ @bigdata_1

BY BigData





Share with your friend now:
tgoop.com/bigdata_1/948

View MORE
Open in Telegram


Telegram News

Date: |

During a meeting with the president of the Supreme Electoral Court (TSE) on June 6, Telegram's Vice President Ilya Perekopsky announced the initiatives. According to the executive, Brazil is the first country in the world where Telegram is introducing the features, which could be expanded to other countries facing threats to democracy through the dissemination of false content. β€˜Ban’ on Telegram Choose quality over quantity. Remember that one high-quality post is better than five short publications of questionable value. There have been several contributions to the group with members posting voice notes of screaming, yelling, groaning, and wailing in different rhythms and pitches. Calling out the β€œdegenerate” community or the crypto obsessives that engage in high-risk trading, Co-founder of NFT renting protocol Rentable World emiliano.eth shared this group on his Twitter. He wrote: β€œhey degen, are you stressed? Just let it out all out. Voice only tg channel for screaming”. In handing down the sentence yesterday, deputy judge Peter Hui Shiu-keung of the district court said that even if Ng did not post the messages, he cannot shirk responsibility as the owner and administrator of such a big group for allowing these messages that incite illegal behaviors to exist.
from us


Telegram BigData
FROM American