Skip to content

爬取知乎指定用户的回答内容,并整理成md文件。

Notifications You must be signed in to change notification settings

longyongchao/crawl-zhihu-user-answers

Repository files navigation

爬取知乎指定用户主页的回答

使用方法

  1. 这里下载webdriver,并根据你的系统把所下载的东西放到./chromedriver_mac64或者./chromedriver_win32中。
  2. 进入欲爬取的用户主页,点击回答标签栏,如:https://www.zhihu.com/people/<欲爬取的知乎用户ID>/answers?page=<页数>
  3. F12,把body标签的内容都复制到pageHtml.html中。
  4. 命令行运行 python main.py ,按提示输入内容后,即可开始爬取。
  5. 爬取到的回答内容将会整理成.md文件保存到./result文件夹中。

注意

  • 使用太频繁有可能被知乎检测到。
  • ./removeHyperlinks.py是用于清除知乎内置超链接的小脚本,与爬虫无关。

About

爬取知乎指定用户的回答内容,并整理成md文件。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages