vision-and-language-navigation

Official repository of "Mind the Error! Detection and Localization of Instruction Errors in Vision-and-Language Navigation". We present the first dataset - R2R-IE-CE - to benchmark instructions errors in VLN. We then propose a method, IEDL.

vision-and-language-navigation vln embodied-ai

Updated Aug 3, 2024
Python

eric-ai-lab / Naivgation-as-wish

Star

Official implementation of the NAACL 2024 paper "Navigation as Attackers Wish? Towards Building Robust Embodied Agents under Federated Learning"

robustness attack-defense federated-learning embodied-agent vision-and-language-navigation

Updated Apr 10, 2024
Python

raphael-sch / map2seq_vln

Star

Code for ORAR Agent for Vision and Language Navigation on Touchdown and map2seq

vision-and-language touchdown embodied-agent street-view vision-and-language-navigation vln map2seq

Updated Nov 3, 2023
Python

joeyy5588 / planning-as-inpainting

Star

Planning as In-Painting: A Diffusion-Based Embodied Task Planning Framework for Environments under Uncertainty

task-planning object-manipulation vision-and-language-navigation embodied-ai

Updated Dec 11, 2023
Python

Feliciaxyao / ICML2024-FSTTA

Star

Fast-Slow Test-time Adaptation for Online Vision-and-Language Navigation

vision-and-language-navigation test-time-adaptation

Updated Sep 1, 2024
Python

xyz9911 / FLAME

Star

FLAME: Learning to Navigate with Multimodal LLM in Urban Environments (arXiv:2408.11051)

embodied-agent vision-and-language-navigation vision-language-model multimodal-large-language-models large-multimodal-models

Updated Aug 21, 2024

eric-ai-lab / FedVLN

Star

[ECCV 2022] Official pytorch implementation of the paper "FedVLN: Privacy-preserving Federated Vision-and-Language Navigation"

federated-learning privacy-preserving-machine-learning vision-and-language-navigation

Updated Oct 8, 2022
C++

YicongHong / Fine-Grained-R2R

Star

Code and data of the Fine-Grained R2R Dataset proposed in the EMNLP 2021 paper Sub-Instruction Aware Vision-and-Language Navigation

vision-and-language-navigation

Updated Oct 26, 2021
Python

batra-mlp-lab / vln-chasing-ghosts

Star

Code for 'Chasing Ghosts: Instruction Following as Bayesian State Tracking' published at NeurIPS 2019

vision-and-language neurips neurips-2019 vision-and-language-navigation vln

Updated Jan 10, 2020
C++

CrystalSixone / VLN-GOAT

Star

Repository for Vision-and-Language Navigation via Causal Learning (Accepted by CVPR 2024)

vision-and-language-navigation

Updated Jul 23, 2024
Python

PrithivirajDamodaran / vision-language-modelling-series

Sponsor

Star

Companion Repo for the Vision Language Modelling YouTube series - https://bit.ly/3PsbsC2 - by Prithivi Da. Open to PRs and collaborations

multimodal-interactions vision-and-language multimodal-deep-learning multimodal-representation vision-and-language-navigation vision-and-language-pre-training

Updated Aug 16, 2022
Jupyter Notebook

YicongHong / Entity-Graph-VLN

Star

Code of the NeurIPS 2021 paper: Language and Visual Entity Relationship Graph for Agent Navigation

deep-learning graph-neural-networks vision-and-language-navigation neurips-2021

Updated Oct 31, 2021
Python

YicongHong / Discrete-Continuous-VLN

Star

Code and Data of the CVPR 2022 paper: Bridging the Gap Between Learning in Discrete and Continuous Environments for Vision-and-Language Navigation

computer-vision deep-learning visual-navigation vision-and-language vision-and-language-navigation embodied-ai cvpr2022

Updated Oct 31, 2023
Python

GT-RIPL / robo-vln

Star

Pytorch code for ICRA'21 paper: "Hierarchical Cross-Modal Agent for Robotics Vision-and-Language Navigation"

python language deep-neural-networks computer-vision deep-learning robotics navigation transformers pytorch artificial-intelligence supervised-learning bert vision-and-language vision-and-language-navigation habitat-api habitat-sim

Updated Jun 27, 2024
Python

eric-ai-lab / awesome-vision-language-navigation

Star

A curated list for vision-and-language navigation. ACL 2022 paper "Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions"

navigation vision-and-language embodied-agent vision-and-language-navigation

Updated May 2, 2024

YicongHong / Recurrent-VLN-BERT

Star

Code of the CVPR 2021 Oral paper: A Recurrent Vision-and-Language BERT for Navigation

transformer bert vision-and-language pre-trained-model vision-and-language-navigation cvpr-oral cvpr2021

Updated Aug 13, 2022
Python

Improve this page

Add a description, image, and links to the vision-and-language-navigation topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the vision-and-language-navigation topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

vision-and-language-navigation

Here are 21 public repositories matching this topic...

Gtothemoon / Contrastive-VisionVAE-Follower

tsujuifu / model_aps

marialymperaiou / knowledge-enhanced-multimodal-learning

joeyy5588 / LACMA

intelligolabs / R2RIE-CE

eric-ai-lab / Naivgation-as-wish

raphael-sch / map2seq_vln

joeyy5588 / planning-as-inpainting

Feliciaxyao / ICML2024-FSTTA

xyz9911 / FLAME

eric-ai-lab / FedVLN

YicongHong / Fine-Grained-R2R

batra-mlp-lab / vln-chasing-ghosts

CrystalSixone / VLN-GOAT

PrithivirajDamodaran / vision-language-modelling-series

YicongHong / Entity-Graph-VLN

YicongHong / Discrete-Continuous-VLN

GT-RIPL / robo-vln

eric-ai-lab / awesome-vision-language-navigation

YicongHong / Recurrent-VLN-BERT

Improve this page

Add this topic to your repo