MACHINELEARNING_INTERVIEW Telegram 1914
Forwarded from Machinelearning
🌟 WM-ABench: тСстированиС VL-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ Ρ„ΠΈΠ·ΠΈΠΊΠΈ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΌΠΈΡ€Π°.

Мaitrix Org Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ WM-ABench, Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊ для ΠΎΡ†Π΅Π½ΠΊΠΈ VLM Π² качСствС Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… Β«ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΠΈΡ€Π°Β». ИдСя проста: ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ‚ΠΎΠΏΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ способны Π½Π΅ просто Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ, Π° ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΎΠΊΡ€ΡƒΠΆΠ°ΡŽΡ‰ΡƒΡŽ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ Π΅Π΅ измСнСния.

Π‘ΠΎΠ·Π΄Π°Ρ‚Π΅Π»ΠΈ, ΠΎΠΏΠΈΡ€Π°ΡΡΡŒ Π½Π° ΠΊΠΎΠ³Π½ΠΈΡ‚ΠΈΠ²Π½ΡƒΡŽ Π½Π°ΡƒΠΊΡƒ, создали Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ тСстируСт 15 самых популярных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎ 23 ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌ, раздСляя процСсс Π½Π° 2 ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… этапа: восприятиС ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅.

Π’ основС Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ° - ΠΎΠ³Ρ€ΠΎΠΌΠ½Ρ‹ΠΉ датасСт ΠΈΠ· Π±ΠΎΠ»Π΅Π΅ Ρ‡Π΅ΠΌ 100 тысяч ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ², сгСнСрированных Π² 6 Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… симуляторах, ΠΎΡ‚ ThreeDWorld ΠΈ Physion Π΄ΠΎ Carla.

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π΅ искали Π»Π΅Π³ΠΊΠΈΡ… ΠΏΡƒΡ‚Π΅ΠΉ ΠΈ Π½Π΅ полагались Π½Π° повСрхностныС совпадСния, Π² тСст Π΄ΠΎΠ±Π°Π²ΠΈΠ»ΠΈ «слоТныС Π½Π΅Π³Π°Ρ‚ΠΈΠ²Ρ‹Β» - контрфактичСскиС состояния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π·Π°ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ систСму Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ происходящСС.

Π’Π΅ΡΡŒ процСсс Π±Ρ‹Π» Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ Π½Π° ΠΎΡ†Π΅Π½ΠΊΡƒ восприятия (распознаваниС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², пространства, Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, двиТСния) ΠΈ прогнозирования (симуляция Ρ„ΠΈΠ·ΠΈΠΊΠΈ, Ρ‚Ρ€Π°Π½Π·ΠΈΡ‚ΠΈΠ²Π½Ρ‹ΠΉ ΠΈ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π²Ρ‹Π²ΠΎΠ΄). Для ΠΊΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠΈ слоТности Π·Π°Π΄Π°Ρ‡ Π±Ρ‹Π»ΠΈ установлСны Π±Π°Π·ΠΎΠ²Ρ‹Π΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ, основанныС Π½Π° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°Ρ… людСй.

πŸŸ‘Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

Π‘ простым Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΌ восприятиСм, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ с ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ†Π²Π΅Ρ‚Π° ΠΈΠ»ΠΈ Ρ„ΠΎΡ€ΠΌΡ‹, всС ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠΏΡ€Π°Π²Π»ΡΡŽΡ‚ΡΡ ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ. Однако ΠΊΠΎΠ³Π΄Π° Π΄Π΅Π»ΠΎ Π΄ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ Π΄ΠΎ Ρ‚Ρ€Π΅Ρ…ΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ пространствСнного ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΡ, Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠΈ двиТСния ΠΈΠ»ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ, Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‚ΡΡ ΡΠ΅Ρ€ΡŒΠ΅Π·Π½Ρ‹Π΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹.

Π’Ρ‹ΡΡΠ½ΠΈΠ»Π°ΡΡŒ ΠΈ другая Π»ΡŽΠ±ΠΎΠΏΡ‹Ρ‚Π½Π°Ρ Π΄Π΅Ρ‚Π°Π»ΡŒ: VLM склонны Β«ΡΠΏΡƒΡ‚Ρ‹Π²Π°Ρ‚ΡŒΒ» физичСскиС понятия. НапримСр, Ссли Π² сцСнС ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ†Π²Π΅Ρ‚ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°, модСль ΠΌΠΎΠΆΠ΅Ρ‚ Π²Π½Π΅Π·Π°ΠΏΠ½ΠΎ ΠΎΡˆΠΈΠ±ΠΈΡ‚ΡŒΡΡ Π² ΠΎΡ†Π΅Π½ΠΊΠ΅ Π΅Π³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΈΠ»ΠΈ скорости.

Оказалось, Ρ‡Ρ‚ΠΎ Ρ†Π²Π΅Ρ‚ ΠΈ Ρ„ΠΎΡ€ΠΌΠ° ΡΠ²Π»ΡΡŽΡ‚ΡΡ самыми Π²Π»ΠΈΡΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΊΠ°ΠΆΠ°ΡŽΡ‚ восприятиС Π΄Ρ€ΡƒΠ³ΠΈΡ…, Π½Π΅ связанных с Π½ΠΈΠΌΠΈ характСристик.

🟑Но главная ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° кроСтся Π³Π»ΡƒΠ±ΠΆΠ΅.

Π’ΠΎΡ‡Π½ΠΎΠ΅ восприятиС ΠΌΠΈΡ€Π° ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½Π΅ Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΡƒΠ΅Ρ‚ Ρ‚ΠΎΡ‡Π½ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°.

ИсслСдованиС ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ, Ρ‡Ρ‚ΠΎ Π΄Π°ΠΆΠ΅ ΠΏΡ€ΠΈ идСально Π²Π΅Ρ€Π½ΠΎΠΌ распознавании Ρ‚Π΅ΠΊΡƒΡ‰Π΅Π³ΠΎ состояния сцСны ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΎΠ²Π°Π»ΠΈΠ²Π°ΡŽΡ‚ прСдсказаниС физичСских взаимодСйствий.

Π Π°Π·Ρ€Ρ‹Π² с чСловСчСскими способностями явный: Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π½Π° Ρ‚Ρ€Π°Π½Π·ΠΈΡ‚ΠΈΠ²Π½Ρ‹ΠΉ Π²Ρ‹Π²ΠΎΠ΄ ΠΎΠ½ достигаСт 46%, Π° ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π²Ρ‹Π²ΠΎΠ΄ выполняСтся Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ случайного угадывания.

πŸŸ‘Π‘Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊ подсвСтил Ρ„ΡƒΠ½Π΄Π°ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΉ нСдостаток:

Π£ соврСмСнных VLM ΠΎΡ‚ΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚ Π±Π°Π·ΠΎΠ²Ρ‹Π΅ знания Ρ„ΠΈΠ·ΠΈΠΊΠΈ, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ для симуляции Π΄Π°ΠΆΠ΅ ΠΏΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠΈΡ… событий. Они видят ΠΌΠΈΡ€, Π½ΠΎ Π½Π΅ ΠΏΠΎΠ½ΠΈΠΌΠ°ΡŽΡ‚, ΠΏΠΎ ΠΊΠ°ΠΊΠΈΠΌ Π·Π°ΠΊΠΎΠ½Π°ΠΌ ΠΎΠ½ ΠΆΠΈΠ²Π΅Ρ‚.


πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅: Apache 2.0 License.


πŸŸ‘Π‘Ρ‚Ρ€Π°Π½ΠΈΡ†Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°
🟑Arxiv
πŸŸ‘Π”Π°Ρ‚Π°ΡΠ΅Ρ‚


@ai_machinelearning_big_data

#AI #ML #VLM #Benchmark #Maitrix
Please open Telegram to view this post
VIEW IN TELEGRAM



tgoop.com/machinelearning_interview/1914
Create:
Last Update:

🌟 WM-ABench: тСстированиС VL-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ Ρ„ΠΈΠ·ΠΈΠΊΠΈ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΌΠΈΡ€Π°.

Мaitrix Org Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ WM-ABench, Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊ для ΠΎΡ†Π΅Π½ΠΊΠΈ VLM Π² качСствС Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… Β«ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΠΈΡ€Π°Β». ИдСя проста: ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ‚ΠΎΠΏΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ способны Π½Π΅ просто Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ, Π° ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΎΠΊΡ€ΡƒΠΆΠ°ΡŽΡ‰ΡƒΡŽ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ Π΅Π΅ измСнСния.

Π‘ΠΎΠ·Π΄Π°Ρ‚Π΅Π»ΠΈ, ΠΎΠΏΠΈΡ€Π°ΡΡΡŒ Π½Π° ΠΊΠΎΠ³Π½ΠΈΡ‚ΠΈΠ²Π½ΡƒΡŽ Π½Π°ΡƒΠΊΡƒ, создали Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ тСстируСт 15 самых популярных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎ 23 ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌ, раздСляя процСсс Π½Π° 2 ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… этапа: восприятиС ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅.

Π’ основС Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ° - ΠΎΠ³Ρ€ΠΎΠΌΠ½Ρ‹ΠΉ датасСт ΠΈΠ· Π±ΠΎΠ»Π΅Π΅ Ρ‡Π΅ΠΌ 100 тысяч ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ², сгСнСрированных Π² 6 Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… симуляторах, ΠΎΡ‚ ThreeDWorld ΠΈ Physion Π΄ΠΎ Carla.

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π΅ искали Π»Π΅Π³ΠΊΠΈΡ… ΠΏΡƒΡ‚Π΅ΠΉ ΠΈ Π½Π΅ полагались Π½Π° повСрхностныС совпадСния, Π² тСст Π΄ΠΎΠ±Π°Π²ΠΈΠ»ΠΈ «слоТныС Π½Π΅Π³Π°Ρ‚ΠΈΠ²Ρ‹Β» - контрфактичСскиС состояния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π·Π°ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ систСму Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ происходящСС.

Π’Π΅ΡΡŒ процСсс Π±Ρ‹Π» Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ Π½Π° ΠΎΡ†Π΅Π½ΠΊΡƒ восприятия (распознаваниС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², пространства, Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, двиТСния) ΠΈ прогнозирования (симуляция Ρ„ΠΈΠ·ΠΈΠΊΠΈ, Ρ‚Ρ€Π°Π½Π·ΠΈΡ‚ΠΈΠ²Π½Ρ‹ΠΉ ΠΈ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π²Ρ‹Π²ΠΎΠ΄). Для ΠΊΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠΈ слоТности Π·Π°Π΄Π°Ρ‡ Π±Ρ‹Π»ΠΈ установлСны Π±Π°Π·ΠΎΠ²Ρ‹Π΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ, основанныС Π½Π° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°Ρ… людСй.

πŸŸ‘Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

Π‘ простым Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΌ восприятиСм, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ с ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ†Π²Π΅Ρ‚Π° ΠΈΠ»ΠΈ Ρ„ΠΎΡ€ΠΌΡ‹, всС ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠΏΡ€Π°Π²Π»ΡΡŽΡ‚ΡΡ ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ. Однако ΠΊΠΎΠ³Π΄Π° Π΄Π΅Π»ΠΎ Π΄ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ Π΄ΠΎ Ρ‚Ρ€Π΅Ρ…ΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ пространствСнного ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΡ, Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠΈ двиТСния ΠΈΠ»ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ, Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‚ΡΡ ΡΠ΅Ρ€ΡŒΠ΅Π·Π½Ρ‹Π΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹.

Π’Ρ‹ΡΡΠ½ΠΈΠ»Π°ΡΡŒ ΠΈ другая Π»ΡŽΠ±ΠΎΠΏΡ‹Ρ‚Π½Π°Ρ Π΄Π΅Ρ‚Π°Π»ΡŒ: VLM склонны Β«ΡΠΏΡƒΡ‚Ρ‹Π²Π°Ρ‚ΡŒΒ» физичСскиС понятия. НапримСр, Ссли Π² сцСнС ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ†Π²Π΅Ρ‚ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°, модСль ΠΌΠΎΠΆΠ΅Ρ‚ Π²Π½Π΅Π·Π°ΠΏΠ½ΠΎ ΠΎΡˆΠΈΠ±ΠΈΡ‚ΡŒΡΡ Π² ΠΎΡ†Π΅Π½ΠΊΠ΅ Π΅Π³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΈΠ»ΠΈ скорости.

Оказалось, Ρ‡Ρ‚ΠΎ Ρ†Π²Π΅Ρ‚ ΠΈ Ρ„ΠΎΡ€ΠΌΠ° ΡΠ²Π»ΡΡŽΡ‚ΡΡ самыми Π²Π»ΠΈΡΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π°ΠΌΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΊΠ°ΠΆΠ°ΡŽΡ‚ восприятиС Π΄Ρ€ΡƒΠ³ΠΈΡ…, Π½Π΅ связанных с Π½ΠΈΠΌΠΈ характСристик.

🟑Но главная ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° кроСтся Π³Π»ΡƒΠ±ΠΆΠ΅.

Π’ΠΎΡ‡Π½ΠΎΠ΅ восприятиС ΠΌΠΈΡ€Π° ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½Π΅ Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΡƒΠ΅Ρ‚ Ρ‚ΠΎΡ‡Π½ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°.

ИсслСдованиС ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ, Ρ‡Ρ‚ΠΎ Π΄Π°ΠΆΠ΅ ΠΏΡ€ΠΈ идСально Π²Π΅Ρ€Π½ΠΎΠΌ распознавании Ρ‚Π΅ΠΊΡƒΡ‰Π΅Π³ΠΎ состояния сцСны ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΎΠ²Π°Π»ΠΈΠ²Π°ΡŽΡ‚ прСдсказаниС физичСских взаимодСйствий.

Π Π°Π·Ρ€Ρ‹Π² с чСловСчСскими способностями явный: Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π½Π° Ρ‚Ρ€Π°Π½Π·ΠΈΡ‚ΠΈΠ²Π½Ρ‹ΠΉ Π²Ρ‹Π²ΠΎΠ΄ ΠΎΠ½ достигаСт 46%, Π° ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π²Ρ‹Π²ΠΎΠ΄ выполняСтся Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ случайного угадывания.

πŸŸ‘Π‘Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊ подсвСтил Ρ„ΡƒΠ½Π΄Π°ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΉ нСдостаток:

Π£ соврСмСнных VLM ΠΎΡ‚ΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚ Π±Π°Π·ΠΎΠ²Ρ‹Π΅ знания Ρ„ΠΈΠ·ΠΈΠΊΠΈ, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ для симуляции Π΄Π°ΠΆΠ΅ ΠΏΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠΈΡ… событий. Они видят ΠΌΠΈΡ€, Π½ΠΎ Π½Π΅ ΠΏΠΎΠ½ΠΈΠΌΠ°ΡŽΡ‚, ΠΏΠΎ ΠΊΠ°ΠΊΠΈΠΌ Π·Π°ΠΊΠΎΠ½Π°ΠΌ ΠΎΠ½ ΠΆΠΈΠ²Π΅Ρ‚.


πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅: Apache 2.0 License.


πŸŸ‘Π‘Ρ‚Ρ€Π°Π½ΠΈΡ†Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°
🟑Arxiv
πŸŸ‘Π”Π°Ρ‚Π°ΡΠ΅Ρ‚


@ai_machinelearning_big_data

#AI #ML #VLM #Benchmark #Maitrix

BY Machine learning Interview






Share with your friend now:
tgoop.com/machinelearning_interview/1914

View MORE
Open in Telegram


Telegram News

Date: |

Among the requests, the Brazilian electoral Court wanted to know if they could obtain data on the origins of malicious content posted on the platform. According to the TSE, this would enable the authorities to track false content and identify the user responsible for publishing it in the first place. To delete a channel with over 1,000 subscribers, you need to contact user support During a meeting with the president of the Supreme Electoral Court (TSE) on June 6, Telegram's Vice President Ilya Perekopsky announced the initiatives. According to the executive, Brazil is the first country in the world where Telegram is introducing the features, which could be expanded to other countries facing threats to democracy through the dissemination of false content. How to build a private or public channel on Telegram? best-secure-messaging-apps-shutterstock-1892950018.jpg
from us


Telegram Machine learning Interview
FROM American