tgoop.com/pytorch_howsam/565
Create:
Last Update:
Last Update:
Sapiens: Foundation for Human Vision Models
کار کامپیوتر ویژنی جدید متا بنام Sapiens؛ اول ویدئوی بالا رو ببینید و بعد ادامه متن رو بخونید.
بخش Reality شرکت متا یک مجموعه مدل بنام Sapiens معرفی کرده که مخصوص چهار تسک مهم بینایی کامپیوتر با محوریت انسان هست:
* تخمین ژست (Pose Estimation)
* سگمنت اعضای بدن (Body-part Segmentation
* تخمین عمق (Depth Estimation)
* پیشبینی نرمال سطح (Surface Normal Prediction)
ریزنکاتی از این کار ارزشمند:
* مدلها بر پایه ویژن ترنسفورمرها طراحی شدن.
* مدلها ورودی رزولوشن بالا در اندازه 1024×1024 قبول میکنن.
* روی 300 میلیون تصویر انسان آموزش دیدن.
* چهار مدل به سایزهای 0.3 0.6 1.0 2.0 بیلیون پارامتر ارائه شده.
* نسخه Pretrain و Finetune شده مدلها در هاگینگفیس قرار داده شده.
* مقاله Sapiens در ECCV پذیرفته شده.
مقاله | گیتهاب
@pytorch_howsam
BY PyTorch Howsam
Share with your friend now:
tgoop.com/pytorch_howsam/565