MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving

📑 arxiv link : https://arxiv.org/pdf/2409.07267

We are preparing for open-source release.

Citation

To cite our work, please use the following BibTeX entry:

@article{zhang2024minidrive,
  title={MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving},
  author={Zhang, Enming and Dai, Xingyuan and Lv, Yisheng and Miao, Qinghai},
  journal={arXiv preprint arXiv:2409.07267},
  year={2024}
}

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
code		code
data		data
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving

Citation

About

Releases

Packages

EMZucas/minidrive

Folders and files

Latest commit

History

Repository files navigation

MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages