add 简书地址 发布任正非华为讲话集合 心声社区 + 新浪博客整理
多看阅读效果
XQHttp.py 文件需要配置你自己的Cookie 也就是header 中’Cookie': 值 xq_a_token 和bid
ReadList.txt 填写需要抓取的雪球大V 地址 例如:https://xueqiu.com/2733321298 抓取贴子,言论,API说明: _url = "http://xueqiu.com/v4/statuses/user\_timeline.json?user\_id={0}&page={1}&type=2" 2主贴 5 回复 ""为全部 可自行修改,位于xueqiu_worker.py
如果TGBHttp.py 中Cookie过期,需要更新, 淘股吧(只发布抓取帖子版,完整抓取用户所有日志,跟帖不在此发布)
ReadList.txt配置 帖子地址 例如 龙飞虎 我相信这个帐号的未来会很灿烂! https://www.taoguba.com.cn/Article/175600/0 原贴地址/0 表示默认抓取完全部帖子,原贴地址/x 表示抓取到第x页 ,默认 0 默认配置 提取主贴 + 点亮 + 捧场 + 作者所有回复 如需帖子完整版,配置taoguba_article 解析
原EE-Book介绍:
EE-Book 是一个命令行程序,它可以从网络上爬取内容制作成EPub格式电子书。
网页版 →_→ ee-book.org
名称 | 主页 | 支持类型 |
---|---|---|
知乎 | www.zhihu.com | 问题: zhihu.com/question/{question_id} 答案: zhihu.com/question/{question_id}/answer/{answer_id} 话题: zhihu.com/topic/{topic_id} 用户的全部回答: zhihu.com/people/{people_id} or zhihu.com/people/{people_id}/answers 收藏夹: zhihu.com/collection/{collection_id} 专栏: zhuanlan.zhihu.com/{zhuanlan_id} |
简书 | www.jianshu.com | 用户的所有文章: jianshu.com/users/{people_id}/latest_articles 专题: jianshu.com/collection/{collection_id} 文集: jianshu.com/notebooks/{notebooks_id}/latest or jianshu.com/notebooks/{notebooks_id}/top |
csdn博客 | blog.csdn.net | 用户的所有文章: blog.sina.com.cn/u/{people_id} |
新浪博客 | blog.sina.com.cn | 用户的所有文章: blog.csdn.net/{people_id} |
博客园 | www.cnblogs.com | 用户的所有文章: cnblogs.com/{people_id}/ |
易百教程 | www.yiibai.com | 某个教程的文章: yiibai.com/{tutorial_kind} |
Talk Python To Me | www.talkpython.fm | 文稿: https://talkpython.fm/episodes/all/ |
获得帮助信息:
$ python ee-book -h
举个例子:
$ python ee-book -u jianshu.com/users/b1dd2b2c87a8/latest_articles
稍等片刻, 你就可以得到电子书了:
...当然欢迎
$ pip install -r requirements.txt