commodity-etoucher

English|简体中文

commodity-etoucher是一个AI抠图器，实现自动抠图，前景背景融合，还支持自定义风格生成。还支持在线和离线部署方式

本项目源于19年阿里巴巴1688图像算法大赛。演示视频地址请到我的博客查看

功能

生成商品白底图
添加商品前景图
添加商品背景图
生成风格图
本地客户端
网页客户端

更新

使用Skip FCN，将VGG19最后5层feature map作为FCN输入，提高模型精度；
YOLO3对商品图像定位，提升商品图占比;
使用风格迁移，给图片赋予艺术特色，优化图片边缘；
自研算法寻找图像的边缘和方向，加入alpha通道梯段透明化优化图像边缘，详细了解；
使用腐蚀膨胀优化图片；
使用中值滤波过滤图片噪音；
增加背景图替换功能；
增加前景图替换功能
增加本地客户端UI；
将功能部分移植到WEB服务器供线上使用。

注意事项

需要自己下载对应的特征提取模型权重值

快速上手

环境安装

注意pytorch要单独先安装torch >= 1.7.0 pip install -r requirements.txt

文件下载

FCN数据集下载，解压到根目录data文件夹下
YOLO数据集下载，解压到yolov3_master/data目录下

训练在yolov3_master目录下执行，训练YOLO定位模型 python train.py 在根目录下执行，训练FCN语义分割模型 python train.py
使用模型启动本地客户端ui python main.py WEB/img目录下执行启动Django后端服务 python manage.py runserver

技术框架

YOLO模型完成对商品图像定位

FCN模型完成对商品图像分割

Gram矩阵实现风格迁移

图像边缘梯度透明化算法

使用22的filter遍历mask寻找图像边缘，一共有16种情况，这里只认为以下8中情况为有效边缘，即上、下、左、右、左上、右上、左下、右下。以下图左上角情况为例：此时22的filter遍历的情况，黄色小球代表当前遍历像素的位置，固定为向右、向下延伸1pix像素，组成的22的区域；上白下黑说明这是上边缘。在mask图检测到对应边缘后，将原图core（图中小球）对应的区域（33）透明度修改为逐渐透明，其他方向亦是如此。 core透明区域分别为33、55、7*7的边缘图像，透明区域能增强与新背景的融合度。

待办

由于商品图像被遮挡和算法的缺陷。使用GAN对抗神经网络进行修复；
建立数据库对图片存储管理，采用众包思想，将用户抠取的图像用于再训练；
改进算法，提高精度
YOLO3、 FCN增加其他商品定位训练，提高算法的通用性；
将所有模型做成端到端；
WEB功能完善

贡献

欢迎PRs！如果你想为这个项目做贡献，你可以提交pr或issue，待办中有一些可以扩展的功能。我很高兴看到更多的人参与改进并优化它。

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
WEB/img		WEB/img
checkpoints		checkpoints
readme.assets		readme.assets
style		style
test		test
yolov3_master		yolov3_master
.gitignore		.gitignore
BagData.py		BagData.py
FCN.py		FCN.py
README.md		README.md
README_en.md		README_en.md
build_model.py		build_model.py
edge_lucency.py		edge_lucency.py
license		license
load_img.py		load_img.py
loss.py		loss.py
main.py		main.py
requirements.txt		requirements.txt
run_code.py		run_code.py
train.py		train.py
use_fcn.py		use_fcn.py
use_fcn160.py		use_fcn160.py
use_style.py		use_style.py
use_yolo3.py		use_yolo3.py

License

chenmeilong/commodity-etoucher

Folders and files

Latest commit

History

Repository files navigation

commodity-etoucher

功能

更新

注意事项

快速上手

技术框架

YOLO模型完成对商品图像定位

FCN模型完成对商品图像分割

Gram矩阵实现风格迁移

图像边缘梯度透明化算法

待办

贡献

About

Resources

License

Stars

Watchers

Forks

Languages