Skip to content

hahahawu/spiders

Repository files navigation

spiders

基于python scrapy框架,爬取部分新闻类网站的内容。对于例如网易新闻等的新闻类网站,顺带爬取新闻用户评论以及网站用户信息, 在一定程度上建立出用户关系网络。


网站地址 : 博客中国

网站地址 :光明网

网站地址 : 凤凰网

网站地址 : 人民网

网站地址 : 三秦网

网站地址 : 搜狐新闻

网站地址 :陕西日报

网站地址 :网易新闻

网站地址 : 新华网

网站地址 :中国社会新闻网

Releases

No releases published

Packages

No packages published

Languages