CVISION Telegram 4292
Tensorflow(@CVision)
🔥 شرکت Meta فقط SAM 3 را معرفی نکرد، بلکه SAM 3D را هم منتشر کرد! مدل جدید Meta یک جهش بزرگ در بازسازی سه‌بعدی از روی تصاویر دوبعدی ایجاد کرده است؛ هم برای اشیا و هم برای بدن انسان. 🔹 SAM 3D Objects این نسخه می‌تواند فقط از روی یک تصویر، کل ساختار سه‌بعدی…
This media is not supported in your browser
VIEW IN TELEGRAM
قبلاً در مورد SAM 3 و نسخه‌های سه‌بعدی مثل SAM 3D Objects و SAM 3D Body بحث کردیم...
متا یک قدم جلوتر رفته و استاندارد جدیدی در بین مدل‌های بینایی کامپیوتری ساخته:

قابلیت Segment Anything with Concepts!

نسخه‌ی جدید SAM 3 نه فقط اشیاء رو تشخیص می‌ده، بلکه با پرامپت مفهومی می‌تونی هر چیزی رو با یک عبارت ساده بخش‌بندی کنی؛ از «اتوبوس مدرسه زرد» گرفته تا «بازیکنی با لباس سفید».


مدل می‌تونه بین مفاهیم نزدیک خیلی دقیق تمایز بذاره—حتی در ویدیوهای شلوغ!
این کار با معماری جدید Presence Head انجام می‌شه

زیرساخت مدل:

دیتاست عظیم شامل ۴ میلیون مفهوم

بنچ‌مارک جدید SA-Co با ۲۷۰ هزار مفهوم (۵۰ برابر بزرگ‌تر از قبلی‌ها!)

دو برابر دقیق‌تر از مدل‌های قبلی در بخش‌بندی تصویر و ویدیو

عملکرد نزدیک به ۷۵–۸۰٪ انسان

پردازش یک تصویر شلوغ در فقط ۳۰ میلی‌ثانیه روی GPU H200

مدل ۸۴۸ میلیون پارامتری

📦 مدل‌ها + 📚 کدها + 📊 بنچ‌مارک SA-Co
همه هم روی Hugging Face در دسترسه

مقاله | مدل و دیتاست | دمو
👍25🔥85



tgoop.com/cvision/4292
Create:
Last Update:

قبلاً در مورد SAM 3 و نسخه‌های سه‌بعدی مثل SAM 3D Objects و SAM 3D Body بحث کردیم...
متا یک قدم جلوتر رفته و استاندارد جدیدی در بین مدل‌های بینایی کامپیوتری ساخته:

قابلیت Segment Anything with Concepts!

نسخه‌ی جدید SAM 3 نه فقط اشیاء رو تشخیص می‌ده، بلکه با پرامپت مفهومی می‌تونی هر چیزی رو با یک عبارت ساده بخش‌بندی کنی؛ از «اتوبوس مدرسه زرد» گرفته تا «بازیکنی با لباس سفید».


مدل می‌تونه بین مفاهیم نزدیک خیلی دقیق تمایز بذاره—حتی در ویدیوهای شلوغ!
این کار با معماری جدید Presence Head انجام می‌شه

زیرساخت مدل:

دیتاست عظیم شامل ۴ میلیون مفهوم

بنچ‌مارک جدید SA-Co با ۲۷۰ هزار مفهوم (۵۰ برابر بزرگ‌تر از قبلی‌ها!)

دو برابر دقیق‌تر از مدل‌های قبلی در بخش‌بندی تصویر و ویدیو

عملکرد نزدیک به ۷۵–۸۰٪ انسان

پردازش یک تصویر شلوغ در فقط ۳۰ میلی‌ثانیه روی GPU H200

مدل ۸۴۸ میلیون پارامتری

📦 مدل‌ها + 📚 کدها + 📊 بنچ‌مارک SA-Co
همه هم روی Hugging Face در دسترسه

مقاله | مدل و دیتاست | دمو

BY Tensorflow(@CVision)


Share with your friend now:
tgoop.com/cvision/4292

View MORE
Open in Telegram


Telegram News

Date: |

A vandalised bank during the 2019 protest. File photo: May James/HKFP. Each account can create up to 10 public channels The best encrypted messaging apps Add the logo from your device. Adjust the visible area of your image. Congratulations! Now your Telegram channel has a face Click “Save”.! So far, more than a dozen different members have contributed to the group, posting voice notes of themselves screaming, yelling, groaning, and wailing in various pitches and rhythms.
from us


Telegram Tensorflow(@CVision)
FROM American