tgoop.com/machinelearning_interview/1243
Last Update:
LeLaN - ΠΌΠ΅ΡΠΎΠ΄, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΠΈΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Owl-ViT2 ΠΈ OpenVLA Π΄Π»Ρ ΠΌΠ°ΡΠΊΠΈΡΠΎΠ²ΠΊΠΈ Π²ΠΈΠ΄Π΅ΠΎΠ΄Π°Π½Π½ΡΡ
ΠΈΠ· ΡΠ΅Π°Π»ΡΠ½ΠΎΠΉ ΡΡΠ΅Π΄Ρ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΠ·ΡΠΊΠΎΠ²ΡΡ
ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΉ Π΄Π»Ρ Π½Π°Π²ΠΈΠ³Π°ΡΠΈΠΈ ΠΏΠΎ ΠΎΠ±ΡΠ΅ΠΊΡΠ°ΠΌ.
ΠΠΎΠ»ΠΈΡΠΈΠΊΠ° Π½Π°Π²ΠΈΠ³Π°ΡΠΈΠΈ ΠΏΠΎ ΠΎΠ±ΡΠ΅ΠΊΡΠ°ΠΌ, ΠΎΠ±ΡΡΠ΅Π½Π½Π°Ρ Π½Π° ΡΡΠΈΡ
Π΄Π°Π½Π½ΡΡ
, ΠΏΠΎΠΊΠ°Π·Π°Π»Π° Π²ΡΡΠΎΠΊΠΈΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ Π² Π·Π°Π΄Π°ΡΠ΅ Π½Π°Π²ΠΈΠ³Π°ΡΠΈΠΈ ΠΏΠΎ Π½Π΅Π·Π½Π°ΠΊΠΎΠΌΡΠΌ ΠΎΠ±ΡΠ΅ΠΊΡΠ°ΠΌ Π² ΡΠ°Π·Π½ΡΡ
ΡΡΠ»ΠΎΠ²ΠΈΡΡ
: Π²Π½ΡΡΡΠΈ ΠΈ ΡΠ½Π°ΡΡΠΆΠΈ ΠΏΠΎΠΌΠ΅ΡΠ΅Π½ΠΈΠΉ.
LeLaN ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Π°Π½Π½ΠΎΡΠ°ΡΠΈΠΈ VLM Π΄Π»Ρ ΠΌΠ°ΡΠΊΠΈΡΠΎΠ²ΠΊΠΈ Π²ΠΈΠ΄Π΅ΠΎΠ΄Π°Π½Π½ΡΡ
ΠΈΠ· ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ
ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΎΠ²: Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ
ΠΎ Π½Π°Π²ΠΈΠ³Π°ΡΠΈΠΈ ΡΠΎΠ±ΠΎΡΠΎΠ², Π²ΠΈΠ΄Π΅ΠΎΡΠΎΠ»ΠΈΠΊΠΈ Ρ ΡΠΊΡΠΊΡΡΡΠΈΡΠΌΠΈ Ρ YouTube ΠΈ Π΄Π°Π½Π½ΡΠ΅ ΠΈΠ· Π½ΠΎΡΠΈΠΌΡΡ
Π²ΠΈΠ΄Π΅ΠΎΡΠ΅Π³ΠΈΡΡΡΠ°ΡΠΎΡΠΎΠ². ΠΡΠΈ Π°Π½Π½ΠΎΡΠ°ΡΠΈΠΈ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΡΡ ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΈ, ΠΎΡ
Π²Π°ΡΡΠ²Π°ΡΡΠΈΠ΅ ΡΠΈΡΠΎΠΊΠΈΠΉ ΡΠΏΠ΅ΠΊΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² Ρ ΡΠ°Π·Π½ΠΎΠΉ ΡΡΠ΅ΠΏΠ΅Π½ΡΡ Π΄Π΅ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π² ΠΈΡ
ΠΎΠΏΠΈΡΠ°Π½ΠΈΡΡ
.
Π ΠΏΡΠΎΡΠ΅ΡΡΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΠΏΠΎΠ»ΠΈΡΠΈΠΊΠ° Π½Π°Π²ΠΈΠ³Π°ΡΠΈΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΡΠ΅ΡΡΡ ΠΏΠΎ ΡΡΠ΅ΠΌ Π½Π°ΠΏΡΠ°Π²Π»Π΅Π½ΠΈΡΠΌ:
ΠΠΎΡΠ»Π΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ LeLaN Π±ΡΠ»Π° ΠΏΡΠΎΠ²Π΅Π΄Π΅Π½Π° ΡΠ΅ΡΠΈΡ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠΎΠ² ΠΈΠ· Π±ΠΎΠ»Π΅Π΅ 1000 ΠΈΡΠΏΡΡΠ°Π½ΠΈΠΉ, ΠΏΡΠΎΠ²Π΅Π΄Π΅Π½Π½ΡΡ
Π² ΡΠ΅Π°Π»ΡΠ½ΡΡ
ΡΡΠ»ΠΎΠ²ΠΈΡΡ
.
Π Π΅Π·ΡΠ»ΡΡΠ°ΡΡ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°ΡΡ, ΡΡΠΎ LeLaN ΠΏΡΠ΅Π²ΠΎΡΡ
ΠΎΠ΄ΠΈΡ ΡΡΡΠ΅ΡΡΠ²ΡΡΡΠΈΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ zero-shot ΠΏΠΎΠ»ΠΈΡΠΈΠΊ Π½Π°Π²ΠΈΠ³Π°ΡΠΈΠΈ ΠΏΠΎ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡΠΈ ΠΎΡΠΈΠ΅Π½ΡΠΈΡΠΎΠ²Π°ΡΡΡΡ Π² ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ
ΡΡΠ΅Π΄Π°Ρ
, Π½Π°Π΄Π΅ΠΆΠ½ΠΎΡΡΠΈ Π² ΡΡΠ»ΠΎΠ²ΠΈΡΡ
Π½Π΅ΡΠ΅ΡΠΊΠΈΡ
ΠΊΠΎΠΌΠ°Π½Π΄, ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡΠΈ ΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΡ Π·Π° ΠΏΠ΅ΡΠ΅Ρ
ΠΎΠ΄Π°ΠΌΠΈ ΠΈ Π½Π°Π²ΡΠΊΠ΅ ΠΈΠ·Π±Π΅Π³Π°ΡΡ ΡΡΠΎΠ»ΠΊΠ½ΠΎΠ²Π΅Π½ΠΈΠΉ.
ΠΠΎΠ΄, ΠΏΡΠ΅Π΄Π»Π°Π³Π°Π΅ΠΌΡΠΉ Π² ΡΠ΅ΠΏΠΎΠ·ΠΈΡΠΎΡΠΈΠΈ LeLaN, ΡΠ°Π·Π±ΠΈΡ Π½Π° Π΄Π²Π΅ ΡΠ°ΡΡΠΈ: ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΡ
Π΄Π°Π½Π½ΡΡ
ΠΈ Π»ΠΎΠΊΠ°Π»ΡΠ½ΠΎΠ΅ ΡΠ°Π·Π²Π΅ΡΡΡΠ²Π°Π½ΠΈΠ΅ Ρ ΠΏΡΠ΅Π΄Π²Π°ΡΠΈΡΠ΅Π»ΡΠ½ΠΎ ΠΎΠ±ΡΡΠ΅Π½Π½ΡΠΌΠΈ ΠΌΠΎΠ΄Π΅Π»ΡΠΌΠΈ LeLaN Π½Π° ΡΠΎΠ±ΠΎΡΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ΅ Ρ NVIDIA Jetson Orin.
# Clone repository:
git clone https://github.com/NHirose/learning-language-navigation.git
# Set up the conda env:
conda env create -f train/train_lelan.yml
conda activate lelan
# Install the lelan packages:
pip install -e train/
# Install the `diffusion_policy` package:
git clone [email protected]:real-stanford/diffusion_policy.git
pip install -e diffusion_policy/
# Training lelan w/o collision avoidance
python train.py -c ./config/lelan.yaml
@ai_machinelearning_big_data
#AI #ML #LLM #Navigation #Robotics