GitHub - gavinatthu/Shopee-Products-Matching

模式识别大作业(Shopee-Products-Matching)

功能说明

data_loader.py 数据读取、测试集训练集划分等数据相关的库
Methods.py 图片和文本的各种特征提取方法实现
evaluate.py 特征分析、实验结果分析以及统计学相关库函数
demo_XXX.py 执行函数

系统环境

首先需要新建conda虚拟环境

conda create -n shopee_matching python=3.9  
conda activate shopee_matching   
conda install pytorch torchvision torchtext cudatoolkit=11.1

pip(清华TUNA源)安装关键依赖项：

pip install gensim pandas tqdm opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple

代码结构

本项目采用结构化方法面向对象的方法开发，基于python和pytorch实现主要代码功能，并在服务器端(E5, RTX3090)进行训练，所有的特征提取方法封装在Methods.py中，数据读取、测试集训练集划分等数据相关的库封装在data_loader.py中，特征分析、实验结果分析以及统计学相关库函数封装在evaluate.py，执行函数封装在demo_XXX.py中。数据集放在以相对路径表示的文件夹中：

DATA_PATH = '../shopee_product_matching/'

图片特征处理

利用在demo_img.py中根据Pretrained EfficientNet-v5和Pretrained ResNet50进行模型选择：

imgmodel = P_Efnetb5().to(device)
or imgmodel = P_Resnetb5().to(device)

确定了选择的模型之后，使用的默认使用[0]号GPU进行计算：

python demo_img.py

train from Scratch从头开始训练，因为训练Resnet等大型网络需要大量的资源，而且数据集本身过小，所以我们采用LeNet进行训练：

python demo_leNet.py

SIFT特征提取方法：

python demo_SIFT.py

文本特征处理

运行demo_text.py可以同时输出TF_IDF和Fast_Text两种方法的实验结果：

python demo_text.py

利用pretained_BERT进行测试：

python demo_BERT.py

train from Scratch从头开始训练，因为训练BERT等大型网络需要大量的资源，而且数据集本身过小，所以我们采用LeNet进行训练：

python demo_EsNet.py

图片-文本特征处理

运行demo_text_img.py 可以进行图片和文本特征组合的实验结果：

python demo_text_img.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

模式识别大作业(Shopee-Products-Matching)

功能说明

系统环境

代码结构

图片特征处理

文本特征处理

图片-文本特征处理

About

Releases

Packages

Contributors 2

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 76 Commits
.vscode		.vscode
__pycache__		__pycache__
Methods.py		Methods.py
README.md		README.md
data_loader.py		data_loader.py
demo_BERT.py		demo_BERT.py
demo_EsNet.py		demo_EsNet.py
demo_Phash.py		demo_Phash.py
demo_SIFT.py		demo_SIFT.py
demo_img.py		demo_img.py
demo_leNet.py		demo_leNet.py
demo_text.py		demo_text.py
demo_text_img.py		demo_text_img.py
evaluate.py		evaluate.py

gavinatthu/Shopee-Products-Matching

Folders and files

Latest commit

History

Repository files navigation

模式识别大作业(Shopee-Products-Matching)

功能说明

系统环境

代码结构

图片特征处理

文本特征处理

图片-文本特征处理

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages