AI, Python, Cognitive Neuroscience@ai_python_en P.2438

AI_PYTHON_EN Telegram 2438

AI, Python, Cognitive Neuroscience

Forwarded from Recommender system (MehriMah Amiri)

شرکت NVIDIA مدلي به نام NVEagle را عرضه کرده که یک مدل پیشرفته برای ترکیب بینایی و زبان است. این مدل در سه نسخه 7B، 13B و 13B بهینه‌سازی‌شده برای چت ارائه شده است. این مدل از روش‌های مختلفی برای ادغام خروجی‌های انکودرهای تصویر و استفاده از متخصصین مختلف (MoE) بهره می‌برد.

در این مدل، برای ادغام تخصص‌ها، خروجی‌های انکودرهای تصویر از طریق concatenation به هم متصل می‌شوند و سپس مرحله‌ای به نام "pre-alignment" اجرا می‌شود که در آن متخصصین با انکودر متن ثابت بهینه‌سازی می‌شوند. سپس متخصصین و دیکودر فریز شده و تنها لایه پروجکشن آموزش داده می‌شود، و در نهایت همه اجزا برای بهینه‌سازی نظارتی باز می‌شوند.

معماری اصلی مدل شباهت زیادی به مدل LLaVA دارد.

Model repository: link
Try it here: link

www.tgoop.com/ai_python_en/2438

1.28K viewsFarzad 🦅, Aug 30, 2024 at 19:04

tgoop.com/ai_python_en/2438

Create: 2024-08-30
Last Update: 2025-10-17 15:19:02

شرکت NVIDIA مدلي به نام NVEagle را عرضه کرده که یک مدل پیشرفته برای ترکیب بینایی و زبان است. این مدل در سه نسخه 7B، 13B و 13B بهینه‌سازی‌شده برای چت ارائه شده است. این مدل از روش‌های مختلفی برای ادغام خروجی‌های انکودرهای تصویر و استفاده از متخصصین مختلف (MoE) بهره می‌برد.

در این مدل، برای ادغام تخصص‌ها، خروجی‌های انکودرهای تصویر از طریق concatenation به هم متصل می‌شوند و سپس مرحله‌ای به نام "pre-alignment" اجرا می‌شود که در آن متخصصین با انکودر متن ثابت بهینه‌سازی می‌شوند. سپس متخصصین و دیکودر فریز شده و تنها لایه پروجکشن آموزش داده می‌شود، و در نهایت همه اجزا برای بهینه‌سازی نظارتی باز می‌شوند.

معماری اصلی مدل شباهت زیادی به مدل LLaVA دارد.

Model repository: link
Try it here: link

BY AI, Python, Cognitive Neuroscience

Share with your friend now:
tgoop.com/ai_python_en/2438

Open in Telegram

Telegram News

Date: 2025-10-17|

As of Thursday, the SUCK Channel had 34,146 subscribers, with only one message dated August 28, 2020. It was an announcement stating that police had removed all posts on the channel because its content “contravenes the laws of Hong Kong.” Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. For crypto enthusiasts, there was the “gm” app, a self-described “meme app” which only allowed users to greet each other with “gm,” or “good morning,” a common acronym thrown around on Crypto Twitter and Discord. But the gm app was shut down back in September after a hacker reportedly gained access to user data. Telegram Channels requirements & features 5Telegram Channel avatar size/dimensions
from us

Telegram AI, Python, Cognitive Neuroscience
FROM American