minigpt4

Here are 12 public repositories matching this topic...

PaddlePaddle / PaddleMIX

Paddle Multimodal Integration and eXploration, supporting mainstream multi-modal tasks, including end-to-end large-scale multi-modal pretrain models and diffusion model toolbox. Equipped with high performance and flexibility.

Updated Nov 18, 2024
Python

FuxiaoLiu / MMC

Star

[NAACL 2024] MMC: Advancing Multimodal Chart Understanding with LLM Instruction Tuning

chart benchmark resource stock dataset arxiv gpt otter multimodal instruction-tuning llava minigpt4 mplug-owl

Updated Sep 23, 2024
Python

abdur75648 / MedicalGPT

Star

Medical Report Generation And VQA (Adapting XrayGPT to Any Modality)

medical-imaging vqa llama vqa-dataset medical-dataset vicuna llm medical-report-generation llms chatgpt minigpt4 multimodal-llm medicalgpt chatgpt4o xraygpt

Updated Jun 24, 2024
Python

DAMO-NLP-SG / Video-LLaMA

Star

[EMNLP 2023 Demo] Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding

llama large-language-models video-language-pretraining vision-language-pretraining cross-modal-pretraining blip2 minigpt4 multi-modal-chatgpt

Updated Jun 4, 2024
Python

BUAADreamer / Chinese-LLaVA-Med

Star

中文医学多模态大模型 Large Chinese Language-and-Vision Assistant for BioMedicine

ai transformers medical chinese multimodal huggingface-datasets mllm llava minigpt4 gpt4v qwen1-5 llama-factory

Updated May 22, 2024
Python

neemiasbsilva / MiniGPT4-image-caption-generation

Star

Streamline the creation of supervised datasets to facilitate data augmentation for deep learning architectures focused on image captioning. The core framework leverages MiniGPT-4, complemented by the pre-trained Vicuna model, which boasts 13 billion parameters.

caption image-caption-generator minigpt4