Image caption generator using Chainer

Requirement

Usage

Download dataset

Download flickr8k.zip, flickr30k.zip, or coco.zip from: http://cs.stanford.edu/people/karpathy/deepimagesent/
Extract downloaded zip file, and you'll get dataset.json and vgg_feats.mat.

Convert dataset

$ python src/convert_dataset.py dataset.json dataset.pkl

Parameters:

sentence JSON file of dataset.
output pkl file.

Train dataset

$ python src/train.py -g 0 -s dataset.pkl -i vgg_feats.mat -o model/caption_gen

Options:

-g, --gpu: (optional) GPU device index (default: -1).
-s, --sentence: (required) sentence dataset file path.
-i, --image: (required) image feature file path.
-m, --model: (optional) input model file path without extension.
-o, --output: (required) output model file path without extension.
--iter: (optional) the number of iterations (default: 100).

Convert VGG 19-layer caffemodel to pkl file

$ python src/convert_caffemodel_to_pkl.py VGG_ILSVRC_19_layers.caffemodel vgg19.pkl

Parameters:

caffe model file path.
output pkl file path.

Generate image caption

$ python src/generate_caption.py -s dataset.pkl -i vgg19.pkl -m model/caption_gen_0010.model -l image/list.txt

Options:

-s, sentence: (required) sentence dataset file path.
-i, --image: (required) image model file path.
-m, --model: (required) trained model file path.
-l, --list: (required) image path list file.

Image path list file sample

image/asakusa.jpg
image/tree.jpg

License

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
dataset		dataset
image		image
model		model
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

dataset

dataset

image

image

model

model

src

src

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

Repository files navigation

Image caption generator using Chainer

Requirement

Usage

Download dataset

Convert dataset

Train dataset

Convert VGG 19-layer caffemodel to pkl file

Generate image caption

Image path list file sample

License

About

Releases

Packages

Languages

License

dsanno/chainer-image-caption

Folders and files

Latest commit

History

Repository files navigation

Image caption generator using Chainer

Requirement

Usage

Download dataset

Convert dataset

Train dataset

Convert VGG 19-layer caffemodel to pkl file

Generate image caption

Image path list file sample

License

About

Resources

License

Stars

Watchers

Forks

Languages