large-multimodal-models

Star

Here are 28 public repositories matching this topic...

zchoi / Multi-Modal-Large-Language-Learning

Star

Awesome multi-modal large language paper/project, collections of popular training strategies, e.g., PEFT, LoRA.

benchmark awesome multimodal pre-training foundation-models large-language-models large-multimodal-models

Updated Jul 9, 2024

ShareGPT4Omni / ShareGPT4Omni

Star

ShareGPT4Omni: Towards Building Omni Large Multi-modal Models with Comprehensive Multi-modal Annotations

gpt chatgpt large-vision-language-models large-multimodal-models gpt-4v gpt-4o gpt4-omni

Updated Jun 6, 2024

bowen-upenn / MMMA_Rationality

Star

This is the official repository of the paper "Multi-Modal and Multi-Agent Systems Meet Rationality: A Survey"

survey agents multi-agent-systems rationality multimodal foundation-models large-language-models large-multimodal-models

Updated Jun 8, 2024

zjysteven / lmms-finetune

Star

A unified codebase for finetuning (full, lora) large multimodal models, supporting llava-1.5, qwen-vl, llava-interleave, llava-next-video, etc.

finetuning multimodal vision-language foundation-models instruction-tuning large-language-model llava visual-instruction-tuning multimodal-large-language-models large-multimodal-models qwen-vl llava-next

Updated Jul 20, 2024
Python

jameszhou-gl / icl-distribution-shift

Star

Code for "Adapting Large Multimodal Models to Distribution Shifts: The Role of In-Context Learning"

distribution-shift large-multimodal-models

Updated May 21, 2024

rohit901 / VANE-Bench

Star

Contains code and documentation for our VANE-Bench paper.

benchmark-datasets multimodal-deep-learning video-anomaly-detection large-language-models multimodal-large-language-models large-multimodal-models

Updated Jun 18, 2024
Python

ShareGPT4Omni / ShareGPT4V

Star

[ECCV 2024] ShareGPT4V: Improving Large Multi-modal Models with Better Captions

gpt language-model large-language-models chatgpt instruction-tuning vision-language-model large-vision-language-models gpt4v large-multimodal-models gpt-4v eccv2024

Updated Jul 1, 2024
Python

shijian2001 / VQAPromptBench

Star

A Benchmark for VQA prompt sensitivity

benchmark evaluation large-multimodal-models

Updated Jul 17, 2024
Python

MileBench / MileBench

Star

This repo contains evaluation code for the paper "MileBench: Benchmarking MLLMs in Long Context"

benchmark machine-learning natural-language-processing deep-neural-networks computer-vision deep-learning evaluation multimodality visual-question-answering multimodal foundation-models large-language-models llm llms long-context-transformers multimodal-large-language-models large-multimodal-models long-context-modeling

Updated Jul 11, 2024
Python

eric-ai-lab / ProbMed

Star

"Worse than Random? An Embarrassingly Simple Probing Evaluation of Large Multimodal Models in Medical VQA"

evaluation vision-and-language medical-vqa medical-diagnosis llms large-multimodal-models

Updated Jun 24, 2024
Python

VisualWebBench / VisualWebBench

Star

Evaluation framework for paper "VisualWebBench: How Far Have Multimodal LLMs Evolved in Web Page Understanding and Grounding?"

machine-learning natural-language-processing computer-vision deep-learning evaluation question-answering visual-question-answering multimodal multimodal-deep-learning foundation-models large-language-models llm llms mllm multimodal-large-language-models large-multimodal-models

Updated May 31, 2024
Python

MMStar-Benchmark / MMStar

Star

This repo contains evaluation code for the paper "Are We on the Right Way for Evaluating Large Vision-Language Models"

evaluation multimodality multimodal-learning visual-question-answering multimodal large-language-models llm llms large-vision-language-model large-vision-language-models large-multimodal-models lvlms lvlm

Updated Apr 17, 2024
Python

2toinf / IVM

Star

The offical Implementation of "Instruction-Guided Visual Masking"

computer-vision deep-learning robotics multimodal pytorch-implementation instruction-following large-language-models instruction-tuning large-multimodal-models

Updated Jun 3, 2024
Jupyter Notebook

friedrichor / Awesome-Multimodal-Papers

Star

A curated list of awesome Multimodal studies.

deep-learning multimodal-learning multimodal multimodal-deep-learning multimodal-data multimodal-dialogue multimodal-large-language-models large-multimodal-models

Updated Jul 12, 2024
HTML

bzluan / TextCoT

Star

The official repo for “TextCoT: Zoom In for Enhanced Multimodal Text-Rich Image Understanding”.

chain-of-thought large-multimodal-models

Updated Jun 20, 2024
Python

ParadoxZW / LLaVA-UHD-Better

Star

A bug-free and improved implementation of LLaVA-UHD, based on the code from the official repo

multimodal large-language-models llava large-multimodal-models

Updated Jul 6, 2024
Python

xiaoachen98 / Open-LLaVA-NeXT

Star

An open-source implementation of LLaVA-NeXT.

chatbot llama multimodal multi-modality gpt-4 visual-language-learning chatgpt vision-language-model llava large-multimodal-models llama3 gpt4o llava-next

Updated Jun 12, 2024
Python

AIFEG / BenchLMM

Star

[ECCV 2024] BenchLMM: Benchmarking Cross-style Visual Capability of Large Multimodal Models

benchmark cv dataset large-language-models large-multimodal-models

Updated Jul 3, 2024
Python

sshh12 / multi_token

Star

Embed arbitrary modalities (images, audio, documents, etc) into large language models.

multimodal multi-modality large-language-models llm vision-language-model llava large-context large-multimodal-models

Updated Mar 27, 2024
Python

thunlp / LEGENT

Star

Open Platform for Embodied Agents

physics-engine robot-simulator language-grounding embodied-ai large-multimodal-models

Updated Jul 20, 2024
Python

Improve this page

Add a description, image, and links to the large-multimodal-models topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the large-multimodal-models topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

large-multimodal-models

Here are 28 public repositories matching this topic...

zchoi / Multi-Modal-Large-Language-Learning

ShareGPT4Omni / ShareGPT4Omni

bowen-upenn / MMMA_Rationality

zjysteven / lmms-finetune

jameszhou-gl / icl-distribution-shift

rohit901 / VANE-Bench

ShareGPT4Omni / ShareGPT4V

shijian2001 / VQAPromptBench

MileBench / MileBench

eric-ai-lab / ProbMed

VisualWebBench / VisualWebBench

MMStar-Benchmark / MMStar

2toinf / IVM

friedrichor / Awesome-Multimodal-Papers

bzluan / TextCoT

ParadoxZW / LLaVA-UHD-Better

xiaoachen98 / Open-LLaVA-NeXT

AIFEG / BenchLMM

sshh12 / multi_token

thunlp / LEGENT

Improve this page

Add this topic to your repo