Skip to content

基于油猴的脚本抓取淘宝和天猫店铺的商品信息(以JSON格式保存)

License

Notifications You must be signed in to change notification settings

LCYBFF/catchProducts_TaobaoTmall

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

26 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GitHub

catchProducts_TaobaoTmall

JS抓取淘宝和天猫店铺的商品信息(需在Tampermonkey上使用)
引用Jquery简化代码操作,以img为中心抓取;支持淘宝与天猫的category和search页

写在前面

大概写了3天,起初因为是要给商城类毕设填充数据,所以写了个脚本把淘宝天猫店铺的商品信息扒下来再充上去。 以后有时间的话写多页版(大概)
如有大佬路过,欢迎提出建议或指正。

环境需求

Tampermonkey

注意事项

  1. 该脚本仅用于抓取单页数据
  2. 天猫店铺抓取时会移除本店内推荐区域,以免混淆
  3. 因为天猫的商品图片用的数据流,所以抓取时会自动下拉滚动条
  4. 抓取失败仅输出提示信息,不输出数据
  5. 抓取失败一般是搜索为空,如有其它bug请联系反馈

操作步骤

  1. 打开店铺所有宝贝页,点击页面左侧中间数据抓取按钮开始

  1. 抓取提示
  • 成功,输出json数据到console

  • 失败

  1. 抓取成功可点击确认下载文件data.json

抓取信息说明

  1. 结构一览
  {
    "info": [
      {
        "shopname": "",
        "type": "",
        "pageNo": "",
        "pageAll": "",
        "orderType": "",
        "lowPrice": "",
        "highPrice": "",
        "keyword": "",
        "vip": "",
      }
    ],  
    "data": [
      {
        "id": "",
        "proid": "",
        "title": "",
        "img": "",
        "pric": "",
      }
    ]
  }
  1. 信息说明
  • info(店铺及搜索条件信息)
元素 类型 说明
shopname string 店铺名称
type string 网站类型
pageNo int 当前页码
pageAll int 总页码
orderType string 排序方式
lowPrice float 最低价格
highPrice float 最高价格
keyword string 关键字
vip bool 店铺VIP商品(天猫)
  • data(商品信息)
元素 类型 说明
id int 序号
proid string 商品编号
title string 商品名称
img string 商品主图地址
pric string 商品价格

开源协议

MIT License

About

基于油猴的脚本抓取淘宝和天猫店铺的商品信息(以JSON格式保存)

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published