python-scrapy爬虫-

放假期间无聊写了简单爬虫，现在整理出来开源python提供的scrapy异步爬虫框架来搭建的 https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_pc_1 爬取的网站由于是动态网页上有使用了splash来进行转换为静态网在通过XPath路径来获得数据，最后把数据保存在mysql数据库里面，最后使用python的pyecharts库来将数据可视化 scrapy-splash使用的是Splash HTTP API，所以需要一个splash instance，一般采用docker运行splash，所以需要安装docke SRS文件夹就是scrapy项目结构，其中test_map.html是最后的html

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
SRS		SRS
README.md		README.md
splash配置.jpg		splash配置.jpg
项目的笔记		项目的笔记

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

python-scrapy爬虫-

About

Releases

Packages

Languages

Mpp1486356697/Python-

Folders and files

Latest commit

History

Repository files navigation

python-scrapy爬虫-

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages