A python spider app.
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
image
parse
.gitignore
DB.py
NetUtils.py
NetUtils.pyc
Parse.py
README.md
Spider.py
Test.py

README.md

关注了几个博主的个人博客,每次查看太麻烦,遂写此程序查看博主的更新状况。

Python 对我还是太陌生啊。

关注的博客列表:

依赖库

  • requests
  • BeautifulSoup4

第一次执行 python Spider.py 时,会拉取网站所有博客内容,并缓存至 cache 目录下。之后执行,则会比对这些缓存,列出更新内容。

运行效果图:

https://raw.githubusercontent.com/BaoXuebin/BlogSpider/master/image/run.png