JS抓取淘宝和天猫店铺的商品信息(需在Tampermonkey上使用)
引用Jquery简化代码操作,以img为中心抓取;支持淘宝与天猫的category和search页
大概写了3天,起初因为是要给商城类毕设填充数据,所以写了个脚本把淘宝天猫店铺的商品信息扒下来再充上去。
以后有时间的话写多页版(大概)
如有大佬路过,欢迎提出建议或指正。
- 该脚本仅用于抓取单页数据
- 天猫店铺抓取时会移除本店内推荐区域,以免混淆
- 因为天猫的商品图片用的数据流,所以抓取时会自动下拉滚动条
- 抓取失败仅输出提示信息,不输出数据
- 抓取失败一般是搜索为空,如有其它bug请联系反馈
- 打开店铺所有宝贝页,点击页面左侧中间数据抓取按钮开始
- 抓取提示
- 成功,输出json数据到console
- 失败
- 抓取成功可点击确认下载文件data.json
- 结构一览
{
"info": [
{
"shopname": "",
"type": "",
"pageNo": "",
"pageAll": "",
"orderType": "",
"lowPrice": "",
"highPrice": "",
"keyword": "",
"vip": "",
}
],
"data": [
{
"id": "",
"proid": "",
"title": "",
"img": "",
"pric": "",
}
]
}
- 信息说明
- info(店铺及搜索条件信息)
元素 | 类型 | 说明 |
---|---|---|
shopname | string | 店铺名称 |
type | string | 网站类型 |
pageNo | int | 当前页码 |
pageAll | int | 总页码 |
orderType | string | 排序方式 |
lowPrice | float | 最低价格 |
highPrice | float | 最高价格 |
keyword | string | 关键字 |
vip | bool | 店铺VIP商品(天猫) |
- data(商品信息)
元素 | 类型 | 说明 |
---|---|---|
id | int | 序号 |
proid | string | 商品编号 |
title | string | 商品名称 |
img | string | 商品主图地址 |
pric | string | 商品价格 |
MIT License