Skip to content
书籍《Python3 反爬虫原理与绕过实战》配套代码
HTML Python JavaScript CSS
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
.idea 新增代码并编辑 README.md Jun 26, 2019
02/2-3 新增代码并编辑 README.md Jun 26, 2019
04 新增代码并编辑 README.md Jun 26, 2019
05/5-2 新增代码并编辑 README.md Jun 26, 2019
06 新增代码并编辑 README.md Jun 26, 2019
07 新增代码并编辑 README.md Jun 26, 2019
08 新增代码并编辑 README.md Jun 26, 2019
09 Change jigsawCanvas CSS Style Sep 20, 2019
10 新增代码并编辑 README.md Jun 26, 2019
.DS_Store change jigsawCanvas css style Sep 20, 2019
README.md Update README.md Oct 10, 2019

README.md

antispider 为书籍《Python3 反爬虫原理与绕过实战》配套代码

详细目录和封面预览

前往掘金社区查看

前往微信公众号查看

本书共 10 章,除第 1 章环境安装配置外和第 3 章爬虫与反爬虫之外,其他章节涉及的 Python 代码均记录在 antispider 中。包括:

  • 第 2 章 WEB网站的构成和页面渲染
  • 第 4 章 信息校验型反爬虫
  • 第 5 章 动态渲染反爬虫
  • 第 6 章 文本混淆反爬虫
  • 第 7 章 特征识别反爬虫
  • 第 8 章 APP 反爬虫
  • 第 9 章 验证码
  • 第 10 章 综合知识

编号说明

章节与对应代码以数字表示,如第 1 章对应 01 目录。9.1 小节对应 09/9-1 目录。

文件名说明

同一小节的代码文件名为该节编号,但考虑到每个小节会有多段代码,所以以英文 one two three 命名。 如 9.1.1 小节出现的第一段 Python 代码的文件名为 9-1-1-one.py,第二段 Python 代码的文件名为 9-1-1-two.py。

特别说明

1、书中部分代码有固定的文件名称,如 Custom64,那么该文件的名称就是 custom64.py。

2、验证码实现的 HTML/CSS/JS 代码存放在目录 09 中,目录名称为 captcha。

3、部分案例中包含图片或密钥文件,文件已存储在指定目录。

代码运行说明

antispider 项目中的代码均经过运行验证,与书本所述相同。使用时只需要搭配书本所述运行即可。

版权说明

antispider 项目所包含的代码为图书配套代码,仅供书籍读者个人学习研究所用,任何个人与机构不得以任何方式摘抄、转载、公开项目代码。

You can’t perform that action at this time.