ALGORITHMDESIGN_DATASTRUCTUER Telegram 1759
🧠 تا حالا شده بخوای یه مدل زبانی بزرگ مثل LLaMA بتونه تصویر رو بفهمه، بدون اینکه بخوای آموزشش بدی؟

توی یه مقاله جدید یه روش خیلی جالب پیشنهاد شده به اسم:
Zero-Shot Vision Encoder Grafting

ایده‌ش اینه:
میان یه مدل کوچیک درست می‌کنن (بهش می‌گن surrogate) که از لایه‌های ابتدایی همون LLM استفاده می‌کنه. بعد یه رمزگذار بینایی (Vision Encoder) رو روی این مدل کوچیک آموزش می‌دن.

📌 حالا رمزگذار بینایی رو می‌گیرن و مستقیم می‌چسبونن به LLM اصلی! بدون اینکه LLM نیاز به آموزش داشته باشه

نکته: نماد (❄️)Freeze نشان میده که وزن های این رمزگذار در طول این فرایند به روز نمی شوند در واقع از قبل آموزش دیده و ثابت است.
نماد Traing (🔥) نشان دهنده که این مدل خاص در حال آموزش است.

https://arxiv.org/abs/2505.22664

Link github : https://github.com/facebookresearch/zero

#هوش_مصنوعی
📣👨‍💻 @AlgorithmDesign_DataStructuer



tgoop.com/AlgorithmDesign_DataStructuer/1759
Create:
Last Update:

🧠 تا حالا شده بخوای یه مدل زبانی بزرگ مثل LLaMA بتونه تصویر رو بفهمه، بدون اینکه بخوای آموزشش بدی؟

توی یه مقاله جدید یه روش خیلی جالب پیشنهاد شده به اسم:
Zero-Shot Vision Encoder Grafting

ایده‌ش اینه:
میان یه مدل کوچیک درست می‌کنن (بهش می‌گن surrogate) که از لایه‌های ابتدایی همون LLM استفاده می‌کنه. بعد یه رمزگذار بینایی (Vision Encoder) رو روی این مدل کوچیک آموزش می‌دن.

📌 حالا رمزگذار بینایی رو می‌گیرن و مستقیم می‌چسبونن به LLM اصلی! بدون اینکه LLM نیاز به آموزش داشته باشه

نکته: نماد (❄️)Freeze نشان میده که وزن های این رمزگذار در طول این فرایند به روز نمی شوند در واقع از قبل آموزش دیده و ثابت است.
نماد Traing (🔥) نشان دهنده که این مدل خاص در حال آموزش است.

https://arxiv.org/abs/2505.22664

Link github : https://github.com/facebookresearch/zero

#هوش_مصنوعی
📣👨‍💻 @AlgorithmDesign_DataStructuer

BY Algorithm design & data structure




Share with your friend now:
tgoop.com/AlgorithmDesign_DataStructuer/1759

View MORE
Open in Telegram


Telegram News

Date: |

According to media reports, the privacy watchdog was considering “blacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. Members can post their voice notes of themselves screaming. Interestingly, the group doesn’t allow to post anything else which might lead to an instant ban. As of now, there are more than 330 members in the group. Image: Telegram. SUCK Channel Telegram Write your hashtags in the language of your target audience.
from us


Telegram Algorithm design & data structure
FROM American