Warning: file_put_contents(aCache/aDaily/post/opendatascience/-2664-2665-2666-2667-2668-2669-2670-): Failed to open stream: No space left on device in /var/www/tgoop/post.php on line 50
Data Science by ODS.ai 🦜@opendatascience P.2668

OPENDATASCIENCE Telegram 2668

Data Science by ODS.ai 🦜

Forwarded from Machinelearning

⚡️ Glyph: масштабирование контекста через визуально-текстовую компрессию

В основе модели лежит простая идея : вместо того чтобы кормить модели километровый текст, Glyph превращает его в изображение и обрабатывает через vision-language модель.

Используется LLM-управляемый генетический алгоритм, чтобы подобрать наилучшие параметры визуального отображения текста (шрифт, плотность, макет), балансируя между сжатием и точностью.

Это радикально снижает вычислительные затраты, сохраняя при этом смысловую структуру текста.

При этом точность почти не падает: на задачах с длинным контекстом Glyph работает на уровне современных моделей вроде Qwen3-8B.

При экстремальном сжатии VLM с контекстом 128K может эффективно обрабатывать задачи, эквивалентные 1M+ токенов в традиционных LLM.

Фактически, длинный контекст становится мультимодальной задачей, а не чисто текстовой.

📄 Подробности: arxiv.org/abs/2510.17800

🧩 Веса: huggingface.co/zai-org/Glyph

👉 Репозиторий: github.com/thu-coai/Glyph

@ai_machinelearning_big_data

#AI #LLM #Multimodal #Research #DeepLearning

❤8🔥3👍2😢1🙏1

www.tgoop.com/opendatascience/2668

1.76K viewsOct 27 at 16:26

tgoop.com/opendatascience/2668

Create: 2025-10-27
Last Update: 2025-10-31 22:15:10

⚡️ Glyph: масштабирование контекста через визуально-текстовую компрессию

В основе модели лежит простая идея : вместо того чтобы кормить модели километровый текст, Glyph превращает его в изображение и обрабатывает через vision-language модель.

Используется LLM-управляемый генетический алгоритм, чтобы подобрать наилучшие параметры визуального отображения текста (шрифт, плотность, макет), балансируя между сжатием и точностью.

Это радикально снижает вычислительные затраты, сохраняя при этом смысловую структуру текста.

При этом точность почти не падает: на задачах с длинным контекстом Glyph работает на уровне современных моделей вроде Qwen3-8B.

При экстремальном сжатии VLM с контекстом 128K может эффективно обрабатывать задачи, эквивалентные 1M+ токенов в традиционных LLM.

Фактически, длинный контекст становится мультимодальной задачей, а не чисто текстовой.

📄 Подробности: arxiv.org/abs/2510.17800

🧩 Веса: huggingface.co/zai-org/Glyph

👉 Репозиторий: github.com/thu-coai/Glyph

@ai_machinelearning_big_data

#AI #LLM #Multimodal #Research #DeepLearning

BY Data Science by ODS.ai 🦜

Share with your friend now:
tgoop.com/opendatascience/2668

Open in Telegram

Telegram News

Date: 2025-10-31|

Ng Man-ho, a 27-year-old computer technician, was convicted last month of seven counts of incitement charges after he made use of the 100,000-member Chinese-language channel that he runs and manages to post "seditious messages," which had been shut down since August 2020. Content is editable within two days of publishing Each account can create up to 10 public channels Invite up to 200 users from your contacts to join your channel ‘Ban’ on Telegram
from us

Warning: filemtime(): stat failed for aCache/aDaily/post/opendatascience/-2664-2665-2666-2667-2668-2669-2670- in /var/www/tgoop/post.php on line 323

Warning: filemtime(): stat failed for aCache/aDaily/post/opendatascience/-2664-2665-2666-2667-2668-2669-2670- in /var/www/tgoop/post.php on line 324

⚡️ Glyph: масштабирование контекста через визуально-текстовую компрессию

Data Science by ODS.ai 🦜 TG
web: 2668
Data Science by ODS.ai 🦜.Telegram web
Data Science by ODS.ai 🦜 Telegram TG Channel
Telegram Updated: 1970-01-01 00:00:00

Telegram Data Science by ODS.ai 🦜
FROM American