ParseCSDNBlog 本爬虫程序,运行环境说明 PyCharm 2020.1.1、Python 3.7.5 使用到的第三方依赖库如下: beautifulsoup4==4.9.1 pandas==1.1.1 requests==2.24.0 本程序功能:获取取个人的全部博客标题及链接,发布时间、浏览量、以及收藏量等数据信息,按访问量排序,保存到一份CSV表存储。 注意每个人的博客ID会不同,因此本爬虫使用时要求输入个人的博客ID及页码数,以达到通用的功能。 工具使用 运行 run.py