tgoop.com/pytorch_howsam/526
Create:
Last Update:
Last Update:
داغ داغ داغ!
بعد از معرفی xLSTM، حالا xLSTM برای حوزه ویژن بنام ViL هم معرفی شده. 🫡
از لحاظ کارایی هم عملکرد مطلوبی از خودش نشون داده و قابل قیاس با شبکههایی مثل ViT یا DeiT هست.
بخونیم ببینیم چه خبره!
رویکردش درمورد داده تصویری جالبه!
We introduce Vision-LSTM (ViL), an adaption of xLSTM to computer vision. In order to adjust xLSTM (an autoregressive model) to better handle non-autoregressive inputs such as images, we employ alternating bi-directional mLSTM blocks. Odd blocks process the image row-wise from top left to bottom right, while even blocks process the image from bottom right to top left.
مقاله | صفحه پروژه
BY PyTorch Howsam


Share with your friend now:
tgoop.com/pytorch_howsam/526