Skip to content

zhu-xb/webshopSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

使用scrapy框架制作购物网站爬虫。实现了京东网站的商品信息爬取。

可以根据商品编号爬取商品信息、价格、促销。并保存到数据库中。然后在数据库中用函数计算出促销后的折扣价格。

script.sql是商品信息记录表

爬取的商品都保存到MSSQL数据库中。

数据库连接地址在pipelines.py中配置

settings.py中配置的每10秒爬取一个商品网页DOWNLOAD_DELAY = 10

为了避免被京东封IP,仅爬取自己关注的商品。如需更改爬取商品目录,在spiders/jd.py中的productIds中增加或修改商品ID

About

使用scrapy框架制作购物网站爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published