longzw1997

ZHUI longzw1997

Achievements

VITA-MLLM/VITA VITA-MLLM/VITA Public

✨✨VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction

Python 2.4k 175
Open-GroundingDino Open-GroundingDino Public

This is the third party implementation of the paper Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection.

Python 642 119
VITA-MLLM/VITA-Audio VITA-MLLM/VITA-Audio Public

✨✨VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large Speech-Language Model

Python 620 51