GitHub - hpc203/image_captioning-opencv-onnxrun: 使用OpenCV部署图像描述Image_Captioning，包含C++和Python两个版本的程序

本套程序里的模型使用传统CNN做图像描述的，通俗来讲就是输入一张图片，输出一句描述图片里的内容的文字，简称图片生成文字，看图说话，这个功能可以用在智能相册里。

包含encoder和decoder两个模块，其中decoder模块的输入张量是二维的，opencv-dnn在输入这样形状的张量时推理报错，因此decoder模块使用onnxruntime做推理引擎。 onnx文件在百度云盘，链接：https://pan.baidu.com/s/1mVI7_ey_Iu2r_X9DEwAbtg 提取码：vbo9

训练源码在https://github.com/ruotianluo/ImageCaptioning.pytorch

现在火热的多模态大模型clip，连接了图像和语义文字两个领域的。这使得clip天生就适合做图片描述的，但是模型太大，在我的个人笔记本电脑运行会占用大量内存，因此我暂时没有编写用clip做图片生成文字的程序。

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
testimgs		testimgs
README.md		README.md
main.cpp		main.cpp
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

testimgs

testimgs

README.md

README.md

main.cpp

main.cpp

main.py

main.py

Repository files navigation

About

Releases

Packages

Languages

hpc203/image_captioning-opencv-onnxrun

Folders and files

Latest commit

History

Repository files navigation

About

Topics

Resources

Stars

Watchers

Forks

Languages