Visual Question Answering using BLIP pre-trained model!

This implementation applies the BLIP pre-trained model to solve the icon domain task.


How many dots are there?	36

Description

**Note: The test dataset does not have labels. I evaluated the model via Kaggle competition and got 96% in accuracy manner. Obviously, you can use a partition of the training set as a testing set.

Create data folder

Copy all data following the example form You can download data here

Install requirements.txt

pip install -r requirements.txt

Run finetuning code

python finetuning.py

Run prediction

python predicting.py

References:

Nguyen Van Tuan (2023). JAIST_Advanced Machine Learning_Visual_Question_Answering

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Data		Data
.DS_Store		.DS_Store
README.md		README.md
finetuning.py		finetuning.py
prediction.py		prediction.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Data

Data

.DS_Store

.DS_Store

README.md

README.md

finetuning.py

finetuning.py

prediction.py

prediction.py

requirements.txt

requirements.txt

Repository files navigation

Visual Question Answering using BLIP pre-trained model!

Description

Create data folder

Install requirements.txt

Run finetuning code

Run prediction

References:

About

Releases

Packages

Languages

dino-chiio/blip-vqa-finetune

Folders and files

Latest commit

History

Repository files navigation

Visual Question Answering using BLIP pre-trained model!

Description

Create data folder

Install requirements.txt

Run finetuning code

Run prediction

References:

About

Resources

Stars

Watchers

Forks

Languages