爬取目标

正文

高级搜索功能需要用户登录，因此采取的策略是先用个人账号登录，然后保存 cookie
微博的评论是通过下拉滚动条来完成加载的，如果评论数量过多，会出现 加载更多 按钮。上述两种行为虽然可以通过 selenium 来模拟，但过程较为繁琐，不推荐。幸运的是，微博评论还保有老版链接，例如 https://weibo.cn/comment/{weibo_id}?page={page_number}，通过请求这个接口来获取评论html页面，然后解析

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitignore		.gitignore
README.md		README.md
config.py		config.py
crawl_comment.py		crawl_comment.py
crawl_link.py		crawl_link.py