Skip to content

bingyiyu1/taobaoCategory

Repository files navigation

taobaoCrawler

主要功能

1.爬取淘宝类目信息。

Crawler文件夹下是使用superagent请求淘宝类目信息接口,使用getLeaves请求解析出所有叶子类目,使用叶子类目cid获取对应属性和属性值json文件存在/data/props/${cid}.json`下。 analyser文件夹下是分析脚本。负责提取/data/props文件夹下的文件解析成vid表和pid表。其中pid-重复表是检查是pid的中文名是否有重复(少量都是近义词可以忽略)。

2.解析淘宝官方工具「淘宝助理」导出店铺中商品数据的csv表格成格式。

parse文件夹下的casvParse

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published