模拟登录一些知名的网站,为了方便爬取需要登录的网站
Python
Switch branches/tags
Nothing to show
Clone or download

README.md

fuck-login

本项目不在继续维护了(This project is not maintained)

xchaoinfo 2018.06.08

模拟登录一些常见的网站

主要基于以下的 Python 的第三 library

  1. requests 处理登录
  2. pillow 处理验证码
  3. rsa 处理加密问题

Done

  1. 知乎
  2. 126邮箱
  3. weibo.cn (验证码识别困难,建议不要用这种方式) 和 mweibo.cn (推荐使用)
  4. 百度
  5. WebQQ by opdss 还有点问题
  6. Webweixin by opdss
  7. 微博网页版
  8. lantouzi by opdss
  9. jd.com by henry51
  10. liepin.com by henry51
  11. 拉勾网 by opdss
  12. xueqiu.com by xchaoinfo
  13. v2ex.com by zeekvfu
  14. guokr.com by Zhao Min
  15. blog.CSDN.net by guoruibiao  博客
  16. dlut 大连理工大学校园网相关 by guoruibiao  博客
  17. attop.com by justZERO
  18. github.com by wuxiaoxiaoshen
  19. B站
  20. 豆瓣

Todolist

  1. 重构代码,增加可扩展性
  2. 增加新浪微博网页版的登录 (已解决)
  3. 增加 QQ 空间 和 QQ 邮箱的登录
  4. 重新组织文件结构和代码风格,make it esay to read
  5. 增加可扩展性,方便添加新的功能, 现在开发新功能的例子还很不优雅。

tips of pull request

欢迎大家一起来 pull request

  1. pull request 尽量做到 Py2 和 Py3 版本的兼容。
  2. 增加新的网站登录
  3. 改进错误, Python版本的兼容
  4. 基于模拟登录增加新的功能。

技术交流

捐赠

如果本项目对你有用,欢迎对本项目进行捐赠,捐赠时候请留下你的github ID,当然您也可以匿名捐赠。

something to add

  1. 这个项目开始于 2016.2,有些网站改了规则,可能模拟登录不能使用了,授人以鱼不如授人以渔,后面会维护几个典型的模拟登录,并且会给出每个模拟登录的教程,初步考虑是视频,这样对于刚刚接触爬虫,对于抓包分析技术一脸懵逼的初学者来说比较友好,后面可能会更新图文的教程。教程目前制作中,我新注册了一个微信公众号 xchaoinfo, 教程的更新会在微信公众号提醒,欢迎关注

  2. 项目写了一段时间后,发现代码的风格和程序的易用性,可扩展性,代码的可读性,都存在一定的问题,所以接下来最重要的是重构代码,让大家可以更容易的做出一些自己的小功能。

  3. 如果你觉得某个网站的登录很有代表性,欢迎在 issue 中提出, 如果网站的登录很有意思,我会在后面的更新中加入

  4. 网站的登录机制有可能经常的变动,所以当现在的模拟的登录的规则不能使用的时候,请在 issue 中提出 如果时间允许的话,我会更新。