AI_PYTHON_ARXIV Telegram 16090
Forwarded from Recommender system (MehriMah Amiri)
شرکت NVIDIA مدلي به نام NVEagle را عرضه کرده که یک مدل پیشرفته برای ترکیب بینایی و زبان است. این مدل در سه نسخه 7B، 13B و 13B بهینه‌سازی‌شده برای چت ارائه شده است. این مدل از روش‌های مختلفی برای ادغام خروجی‌های انکودرهای تصویر و استفاده از متخصصین مختلف (MoE) بهره می‌برد.

در این مدل، برای ادغام تخصص‌ها، خروجی‌های انکودرهای تصویر از طریق concatenation به هم متصل می‌شوند و سپس مرحله‌ای به نام "pre-alignment" اجرا می‌شود که در آن متخصصین با انکودر متن ثابت بهینه‌سازی می‌شوند. سپس متخصصین و دیکودر فریز شده و تنها لایه پروجکشن آموزش داده می‌شود، و در نهایت همه اجزا برای بهینه‌سازی نظارتی باز می‌شوند.

معماری اصلی مدل شباهت زیادی به مدل LLaVA دارد.

Model repository: link
Try it here: link



tgoop.com/ai_python_arxiv/16090
Create:
Last Update:

شرکت NVIDIA مدلي به نام NVEagle را عرضه کرده که یک مدل پیشرفته برای ترکیب بینایی و زبان است. این مدل در سه نسخه 7B، 13B و 13B بهینه‌سازی‌شده برای چت ارائه شده است. این مدل از روش‌های مختلفی برای ادغام خروجی‌های انکودرهای تصویر و استفاده از متخصصین مختلف (MoE) بهره می‌برد.

در این مدل، برای ادغام تخصص‌ها، خروجی‌های انکودرهای تصویر از طریق concatenation به هم متصل می‌شوند و سپس مرحله‌ای به نام "pre-alignment" اجرا می‌شود که در آن متخصصین با انکودر متن ثابت بهینه‌سازی می‌شوند. سپس متخصصین و دیکودر فریز شده و تنها لایه پروجکشن آموزش داده می‌شود، و در نهایت همه اجزا برای بهینه‌سازی نظارتی باز می‌شوند.

معماری اصلی مدل شباهت زیادی به مدل LLaVA دارد.

Model repository: link
Try it here: link

BY arXiv




Share with your friend now:
tgoop.com/ai_python_arxiv/16090

View MORE
Open in Telegram


Telegram News

Date: |

The main design elements of your Telegram channel include a name, bio (brief description), and avatar. Your bio should be: While some crypto traders move toward screaming as a coping mechanism, many mental health experts have argued that “scream therapy” is pseudoscience. Scientific research or no, it obviously feels good. fire bomb molotov November 18 Dylan Hollingsworth yau ma tei To upload a logo, click the Menu icon and select “Manage Channel.” In a new window, hit the Camera icon. Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day.
from us


Telegram arXiv
FROM American