# 7.验证码的识别处理
目前，许多网站采取各种各样的措施来反爬虫，
其中一个措施便是使用验证码。 随着技术的发展，
验证码的花样越来越多。
验证码最初是几个数字组合的简单的图形验证码，
后来加入了英文字母和混淆曲线。
有的网站还可能看到中文字符的验证码，这使得识别愈发困难。

后来 12306 验证码的归现使得行为验证码开始发展起来，
用过 12306 的用户肯定多少为它的验证码头疼过。
我们需要识别文字，点击与文字描述相符的图片，验证码完全正确，才能通过。
现在这种交互式验证码越来越多，
如极验滑动验证码需要滑动拼合滑块才可以完成验证，
点触验证码需要完全点击正确结果才可以完成验证，
另外还有滑动宫格验证码、计算题验证码等。

本章涉及的验证码有普通图形验证码、
极验滑动验证码、点触验证码、
微博宫格验证码，
这些验证码识别的方式和思路各有不同。
了解这几个验证码的识别方式之后，我们可以举一反三，
用类似的方法识别其他类型验证码。

## 1.图形验证码处理 —— use tesseract-ocr with tesserocr库 or pytesseract库

以知网的验证码为例，讲解利用OCR技术识别图形验证码的方法

第三方库：tesserocr/pytesseract

项目：将验证码图片放到项目根目录下，用 tesserocr库识别该验证码，

![](CheckCode.png)

In [3]:
from PIL import Image
import pytesseract
img = Image.open("CheckCode.png")
result = pytesseract.image_to_string(img)
print(result)

nigh.


识别和实际结果有偏差，
这是因为验证码内的多余线条干扰了图片的识别。

对于这种情况，我们还需要做一下额外的处理，如转灰度、二值化等操作。

In [32]:
from PIL import Image
import pytesseract
img = Image.open("CheckCode.png").convert("L")
result = pytesseract.image_to_string(img)
print(result)
thre = 129
table = []
for i in range(256):
    table.append(0) if i<thre else table.append(1)
image = img.point(table,'1')
image.show()
res = pytesseract.image_to_string(image)
print("二值化后的验证码：",res)

nigh.
二值化后的验证码： nigh


## 项目：结合wxPython实现一个比较复杂的识别系统

项目文件：OcrScanning.py文件，打包后是OcrScanning.exe文件，
要求有多国语言，有类似记事本的功能，可以写入文件，打开文件等等方式
菜单等等都要具备

## 2.极验滑动验证码的识别

近几年出现了一些新型验证码，
其巾比较有代表性的就是极验验证码，
它需要拖动拼合滑块才可以完成验证，
相对图形验证码来说识别难度上升了几个等级。
本节将讲解极验验证码的识别过程。

目标：我们的目标是用程序来识别并通过极验验证码的验证，包括分析识别思路、
识别缺口位置、生成滑块拖动路径、
模拟实现滑块拼合通过验证等步骤。

使用工具：selenium+Chrome WebDriver

极验验证码官网为：[http://www.geetest.com/](http://www.geetest.com/)。
它是一个专注于提供验证安全的系统，
主要验证方式是拖动滑块拼合图像。
若图像完全拼合，则验证成功，即表单成功提交，
否则需要重新验证.

极验验证码相较于图形验证码来说识别难度更大。
对于极验验证码 3.0 版本，我们首先点击按钮进行智能验证。
如果验证不通过，则会弹出滑动验证的窗口，
拖动滑块拼合图像进行验证。
之后三个加密参数会生成，通过表单提交到后台，
后台还会进行一次验证。

全平台兼容，适用各种交互场景。
极验验证码兼容所有主流浏览器甚至于IE6，
也可以轻松应用在iOS和 Android移动端平台，满足各种业务需求

识别：
对于应用了极验验证码的网站如果我们直接模拟表单提交，
加密参数的构造是个问题，需要分析其加密和校验逻辑，
相对烦琐。所以我们采用直接模拟浏览器动作的方式来完成验证。
在Python中，我们可以使用Selenium来完全模拟人的行为的方式来完成验证，
此验证成本相比直接去识别加密算法少很多。

首先找到一个带有极验验证的网站，如极验官方后台，链接为[https://account.geetest.com/login](https://account.geetest.com/login)
在登录按钮上方有一个极验验证按钮
此按钮为智能验证按钮。
一般来说，如果是同一个会话，一段时间内第二次点击会直接通过验证。
如果智能识别不通过，则会弹出滑动验证窗口，
我们要拖动滑块拼合图像完成二步验证，

综上，所以，识别验证需要完成如下三步。
(1)模拟点击验证按钮。
(2)识别滑动缺口的位置。
(3)模拟拖动滑块

第（1）步操作最简单，我们可以直接用 Selenium模拟点击按钮。

第（2）步操作识别缺口的位置比较关键，这里需要用到图像的相关处理方法。首先观察缺口的样子

缺口的四周边缘有明显的断裂边缘，
边缘和边缘周围有明显的区别。
我们可以实现一个边缘检测算法来找出缺口的位置。
对于极验验证码来说，
我们可以利用和原图对比检测的方式来识别缺口的位置，
因为在没有滑动滑块之前，
缺口并没有呈现。

可以同时获取两张图片。
设定一个对比阔值，然后遍历两张图片，
找出相同位置像素RGB差距超过此阔值的像素点，
那么此像素点的位置就是缺口的位置。

首先我们需要注册一个账号。
### 初始化

In [None]:
#内存中，开辟的一个二进制模式的buffer，可以像文件对象一样操作它
from io import BytesIO
from PIL import Image
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
import time
EMAIL = "mlijuyhgt@126.com"
PASSWORD = "zheng1358#nazi"
#用户名：邮箱   密码：自己的密码
class CheckTest():
    def __init__(self):
        self.url = 'https://account.geetest.com/login'
        self.browser = webdriver.Chrome()
        self.wait = WebDriverWait(self.browser,20)
        self.email = EMAIL
        self.password = PASSWORD
# 模拟点击
    def Onclick(self):
        """function: 获取初始验证按钮"""
        button = self.wait.until(EC.element_to_be_clickable(By.CLASS_NAME,'geetest_radar_tip'))
        return button
# 缺口识别
    def get_screen(self):
        """
        return: 截图的object
        """
        screenshot = self.browser.get_screenshot_as_png()
        screenshot = Image.open(BytesIO(screenshot))
        return screenshot
    def get_pos(self):
        """
        获取验证码位置
        :return 验证码位置元组，相关的上方下方距离坐标等
        """
        img = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME,'geetest_canvas_img')))
        time.sleep(2)
        location = img.location
        size = img.size
        t,b,l,r = location['y'],location['y']+size['height'],location['x'],location['x']+size['width']
        return (t,b,l,r)
    def get_geetest_image(self,name='captcha.png'):
        """
        function:获取验证码图片
        :return:图片对象
        """
        t,b,l,r = self.get_pos()
        print("Position: ",t,b,l,r)
        screen_shot = self.get_screen()
        captcha = screen_shot.crop((l,t,r,b))
        return captcha
t = CheckTest()
but = t.Onclick()
but.click()

#说明：

识别缺口的位置：首先获取前后两张比对图片，二者不一致的地方即为缺口。
获取不带缺口的图片，利用Selenium选取图片元素，
得到其所在位置和宽高，然后获取整个网页的截图，
图片裁切出来即可



## 3.点触验证码识别技术

除了极验验证码，还有另一种常见且应用广泛的验证码，即点触验证码。

样例：![](Clickcheck.png)

直接点击图中符合要求的图。所有答案均正确，验证才会成功。
如果有一个答案错误，验证就会失败。这种验证码就称为点触验证码。

如果依靠图像识别点触验证码，则识别难度非常大。

相关字体经过变形、放缩、模糊处理，如果要借助前面的OCR技术来识别，
识别的精准度会大打折扣，甚至得不到任何结果。因此不能实现。

此外我们也需要将图像重新转化文字，
可以借助各种识图接口，但识别的准确率非常低，
经常会出现匹配不正确或无法匹配的情况。
而且图片清晰度不够，
识别难度会更大，更何况有时需要同时正确识别多张图片，验证才能通过。

### 那么，此类验证码该如何识别？

互联网上有很多验证码服务平台，这些平台 7×24 小时提供验证码识别服务，
一张图片几秒就会获得识别结果，准确率可达90%以上。

这里推荐的是超级鹰，官网为[https://www.chaojiying.com](https://www.chaojiying.com)。
其提供的服务种类非常广泛，可识别的验证码类型非常多，
其中就包括点触验证码等等。

超级鹰平台同样支持简单的图形，验证码识别。
如果OCR识别有难度，
同样可以用本节介绍的方法借助此平台来识别。

具体如有变动以官网为准：
[https://www.chaojiying.com/price.html](https://www.chaojiying.com/price.html)

### 流程：

例如：项目要求是点击相关的图片的文字实现识别，如找到图片中的某某字体等等

1、先注册超级鹰账号井申请软件ID，
注册页面链接为
[https://www.chaojiying.com/user/reg/](https://www.chaojiying.com/user/reg/)
在后台开发商中心添加软件ID。
最后充值一些题分，充值多少可以根据价格和识别量自行决定。

2、获取API

在官方网站下载对应的Python API，链接为：https://www.chaojiying.com/api-14.html。
此API是Python2 版本的，是用requests库来实现的。
我们可以简单更改几个地方，即可将其修改为Python3版本。

修改后的相关信息如下：

In [None]:
#!/usr/bin/env python
# coding:utf-8
import requests
from hashlib import md5

class Chaojiying_Client(object):
    def __init__(self, username, password, soft_id):
        self.username = username
        password =  password.encode('utf8')
        self.password = md5(password).hexdigest()
        self.soft_id = soft_id
        self.base_params = {
            'user': self.username,
            'pass2': self.password,
            'softid': self.soft_id,
        }
        self.headers = {
            'Connection': 'Keep-Alive',
            'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
        }

    def PostPic(self, im, codetype):
        """
        im: 图片字节
        codetype: 题目类型 参考 http://www.chaojiying.com/price.html
        """
        params = {
            'codetype': codetype,
        }
        params.update(self.base_params)
        files = {'userfile': ('ccc.jpg', im)}
        r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers)
        return r.json()

    def ReportError(self, im_id):
        """
        im_id:报错题目的图片ID
        """
        params = {
            'id': im_id,
        }
        params.update(self.base_params)
        r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
        return r.json()

if __name__ == '__main__':
    chaojiying = Chaojiying_Client('超级鹰用户名', '超级鹰用户名的密码', '96001') #用户中心>>软件ID 生成一个替换 96001
    im = open('a.jpg', 'rb').read()                          #本地图片文件路径 来替换 a.jpg 有时WIN系统须要//
    print(chaojiying.PostPic(im, 1902))                      #1902 验证码类型  官方网站>>价格体系

In [None]:
import time
from io import BytesIO
from PIL import Image
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from chaojiying import Chaojiying

EMAIL = 'cqc@cuiqingcai.com'
PASSWORD = ''

CHAOJIYING_USERNAME = 'Germey'
CHAOJIYING_PASSWORD = ''
CHAOJIYING_SOFT_ID = 893590
CHAOJIYING_KIND = 9102


class CrackTouClick():
    def __init__(self):
        self.url = 'http://admin.touclick.com/login.html'
        self.browser = webdriver.Chrome()
        self.wait = WebDriverWait(self.browser, 20)
        self.email = EMAIL
        self.password = PASSWORD
        self.chaojiying = Chaojiying(CHAOJIYING_USERNAME, CHAOJIYING_PASSWORD, CHAOJIYING_SOFT_ID)

    def __del__(self):
        self.browser.close()

    def open(self):
        """
        打开网页输入用户名密码
        :return: None
        """
        self.browser.get(self.url)
        email = self.wait.until(EC.presence_of_element_located((By.ID, 'email')))
        password = self.wait.until(EC.presence_of_element_located((By.ID, 'password')))
        email.send_keys(self.email)
        password.send_keys(self.password)

    def get_touclick_button(self):
        """
        获取初始验证按钮
        :return:
        """
        button = self.wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'touclick-hod-wrap')))
        return button

    def get_touclick_element(self):
        """
        获取验证图片对象
        :return: 图片对象
        """
        element = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'touclick-pub-content')))
        return element

    def get_position(self):
        """
        获取验证码位置
        :return: 验证码位置元组
        """
        element = self.get_touclick_element()
        time.sleep(2)
        location = element.location
        size = element.size
        top, bottom, left, right = location['y'], location['y'] + size['height'], location['x'], location['x'] + size[
            'width']
        return (top, bottom, left, right)

    def get_screenshot(self):
        """
        获取网页截图
        :return: 截图对象
        """
        screenshot = self.browser.get_screenshot_as_png()
        screenshot = Image.open(BytesIO(screenshot))
        return screenshot

    def get_touclick_image(self, name='captcha.png'):
        """
        获取验证码图片
        :return: 图片对象
        """
        top, bottom, left, right = self.get_position()
        print('验证码位置', top, bottom, left, right)
        screenshot = self.get_screenshot()
        captcha = screenshot.crop((left, top, right, bottom))
        captcha.save(name)
        return captcha

    def get_points(self, captcha_result):
        """
        解析识别结果
        :param captcha_result: 识别结果
        :return: 转化后的结果
        """
        groups = captcha_result.get('pic_str').split('|')
        locations = [[int(number) for number in group.split(',')] for group in groups]
        return locations

    def touch_click_words(self, locations):
        """
        点击验证图片
        :param locations: 点击位置
        :return: None
        """
        for location in locations:
            print(location)
            ActionChains(self.browser).move_to_element_with_offset(self.get_touclick_element(), location[0],
                                                                   location[1]).click().perform()
            time.sleep(1)

    def touch_click_verify(self):
        """
        点击验证按钮
        :return: None
        """
        button = self.wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'touclick-pub-submit')))
        button.click()

    def login(self):
        """
        登录
        :return: None
        """
        submit = self.wait.until(EC.element_to_be_clickable((By.ID, '_submit')))
        submit.click()
        time.sleep(10)
        print('登录成功')

    def crack(self):
        """
        破解入口
        :return: None
        """
        self.open()
        # 点击验证按钮
        button = self.get_touclick_button()
        button.click()
        # 获取验证码图片
        image = self.get_touclick_image()
        bytes_array = BytesIO()
        image.save(bytes_array, format='PNG')
        # 识别验证码
        result = self.chaojiying.post_pic(bytes_array.getvalue(), CHAOJIYING_KIND)
        print(result)
        locations = self.get_points(result)
        self.touch_click_words(locations)
        self.touch_click_verify()
        # 判定是否成功
        success = self.wait.until(
            EC.text_to_be_present_in_element((By.CLASS_NAME, 'touclick-hod-note'), '验证成功'))
        print(success)

        # 失败后重试
        if not success:
            self.crack()
        else:
            self.login()


if __name__ == '__main__':
    crack = CrackTouClick()
    crack.crack()

这里定义了一个Chaojiying类，其构造函数接收三个参数，
分别是超级鹰的用户名、密码以及软件ID，保存以备使用。

最重要的一个方法叫作post_pic()，它需要传图片对象和验证码的代号。
该方法会将图片对象 和相关信息发给超级鹰的后台进行识别，
然后将识别成功的json返回。

另一个方法叫作report_error()，它是发生错误的时候的回调。
如果验证码识别错误，调用此方法会返回相应的题分。

通过在线打码平台辅助完成了验证码的识别。
这种识别方法非常强大，几乎任意的验证码都可以识别。
如果遇到难题，借助打码平台无疑是一个极佳的选择。

## 4.微博等宫格验证码的识别技术

微博宫格验证码是一种新型交互式验证码，
每个’白’ 格之间会有一条指示连线，
指示了应该的滑动轨迹。
我们要按照滑动轨迹依次从起始宫格滑动到终止宫格，
才可以完成验证，

访问新浪微博移动版登录页面，就可以看到如上验证码，
链接为[https://passport.weibo.cn/signin/login](https://passport.weibo.cn/signin/login),
不是每次登录都会出现验证码，当频繁登录或者账号存在安全风险的时候，验证码才会出现。

4个点的连接方法有很多：
识别从探寻规律入手。
规律就是，此验证码的四个宫格一定是有连线经过的，
每一条连线上都会 相应的指示箭头，连线的形状多样，
包括C型、Z型、X型等，同一类型的连线轨迹是相同的，唯一不同的就是连线的方向

如果要完全识别滑动宫格顺序，
就需要具体识别出箭头的朝向。 而整个验证码箭头朝向一共有8种，
而且会出现在不同的位置。
如果要写一个箭头方向识别算法，
需要考虑不同箭头所在的位置，找出各个位置箭头的像素点坐标，
计算像素点变化规律，这个工作量就会变得比较大。

这时我们可以考虑用模板匹配的方法，
就是将一些识别目标提前保存并做好标记，这称作模板。
这里将验证码图片做好拖动顺序的标记当做模板。
对比要新识别的目标和每一个模板，如果找到匹配的模板，
则就成功识别出要新识别的目标。 在图像识别中，
模板匹配也是常用的方法，实现简单且易用性好。

我们必须要收集到足够多的模板，模板匹配方法的效果才会好。
而对于微博宫格验证码来说，宫格只有4个，
验证码的样式最多 4×3×2×1=24种，
则我们可以将所有模板都收集下来。

In [None]:
import os
import time
from io import BytesIO
from PIL import Image
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from os import listdir

USERNAME = '15874295385'
PASSWORD = 'fpdpvx119'

TEMPLATES_FOLDER = 'templates/'


class CrackWeiboSlide():
    def __init__(self):
        self.url = 'https://passport.weibo.cn/signin/login?entry=mweibo&r=https://m.weibo.cn/'
        self.browser = webdriver.Chrome()
        self.wait = WebDriverWait(self.browser, 20)
        self.username = USERNAME
        self.password = PASSWORD

    def __del__(self):
        self.browser.close()

    def open(self):
        """
        打开网页输入用户名密码并点击
        :return: None
        """
        self.browser.get(self.url)
        username = self.wait.until(EC.presence_of_element_located((By.ID, 'loginName')))
        password = self.wait.until(EC.presence_of_element_located((By.ID, 'loginPassword')))
        submit = self.wait.until(EC.element_to_be_clickable((By.ID, 'loginAction')))#显式等待
        username.send_keys(self.username)
        password.send_keys(self.password)#递交相关参数
        submit.click()

    def get_position(self):
        """
        获取验证码位置
        :return: 验证码位置元组
        """
        try:
            img = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'patt-shadow')))
        except TimeoutException:
            print('未出现验证码')
            self.open()#重新执行操作，直到出现验证码
        time.sleep(2)
        location = img.location
        size = img.size
        top, bottom, left, right = location['y'], location['y'] + size['height'], location['x'], location['x'] + size[
            'width']
        return (top, bottom, left, right)#返回相关位置的数据

    def get_screenshot(self):
        """
        获取网页截图
        :return: 截图对象
        """
        screenshot = self.browser.get_screenshot_as_png()
        screenshot = Image.open(BytesIO(screenshot))
        return screenshot   #以流的形式打开图片的二进制文件

    def get_image(self, name='captcha.png'):
        """
        获取验证码图片
        :return: 图片对象
        """
        top, bottom, left, right = self.get_position()
        print('验证码位置', top, bottom, left, right)
        screenshot = self.get_screenshot()
        captcha = screenshot.crop((left, top, right, bottom))
        captcha.save(name)
        return captcha    

    def is_pixel_equal(self, image1, image2, x, y):
        """
        判断两个像素是否相同
        :param image1: 图片1
        :param image2: 图片2
        :param x: 位置x
        :param y: 位置y
        :return: 像素是否相同
        """
        # 取两个图片的像素点
        pixel1 = image1.load()[x, y]
        pixel2 = image2.load()[x, y]
        threshold = 20
        if abs(pixel1[0] - pixel2[0]) < threshold and abs(pixel1[1] - pixel2[1]) < threshold and abs(
                pixel1[2] - pixel2[2]) < threshold:
            return True
        else:
            return False

    def same_image(self, image, template):
        """
        识别相似验证码
        :param image: 待识别验证码
        :param template: 模板
        :return:
        在这里比对图片也利用了遍历像素的方法。same_image()方法接收两个参数， 
        image 为待检测的验证码图片对象， template 是模板对象。
        由于二者大小是完全一致的，所以在这里我们遍历了图片的所有像素点。
        比对二者同一位置的像素点，如果像素点相同，计数就加l。 
        最后计算相同的像素点占总 像素的比例。如果该比例超过一定值，那就判定图片完全相同，则匹配成功。 
        这里阈值设定为 0.99, 即如果二者有 0.99 以上的相似比，则代表匹配成功
        """
        # 相似度阈值
        threshold = 0.99
        count = 0
        for x in range(image.width):
            for y in range(image.height):
                # 判断像素是否相同
                if self.is_pixel_equal(image, template, x, y):
                    count += 1
        result = float(count) / (image.width * image.height)
        if result > threshold:
            print('成功匹配')
            return True
        return False



    def detect_image(self, image):
        """
        匹配图片
        :param image: 图片
        :return: 拖动顺序
        """
        for template_name in listdir(TEMPLATES_FOLDER):
            print('正在匹配', template_name)
            template = Image.open(TEMPLATES_FOLDER + template_name)
            if self.same_image(image, template):
                # 返回顺序
                numbers = [int(number) for number in list(template_name.split('.')[0])]
                print('拖动顺序', numbers)
                return numbers

    def move(self, numbers):
        """
        根据顺序拖动
        :param numbers:
        :return:
        """
        # 获得四个按点
        circles = self.browser.find_elements_by_css_selector('.patt-wrap .patt-circ')
        dx = dy = 0
        for index in range(4):
            circle = circles[numbers[index] - 1]
            # 如果是第一次循环
            if index == 0:
                # 点击第一个按点
                ActionChains(self.browser) \
                    .move_to_element_with_offset(circle, circle.size['width'] / 2, circle.size['height'] / 2) \
                    .click_and_hold().perform()
            else:
                # 小幅移动次数
                times = 30
                # 拖动
                for i in range(times):
                    ActionChains(self.browser).move_by_offset(dx / times, dy / times).perform()
                    time.sleep(1 / times)
            # 如果是最后一次循环
            if index == 3:
                # 松开鼠标
                ActionChains(self.browser).release().perform()
            else:
                # 计算下一次偏移
                dx = circles[numbers[index + 1] - 1].location['x'] - circle.location['x']
                dy = circles[numbers[index + 1] - 1].location['y'] - circle.location['y']
    def crack(self):
        """
        破解入口
        :return:
        """
        self.open()
        # 获取验证码图片
        image = self.get_image('captcha.png')
        numbers = self.detect_image(image)
        self.move(numbers)
        time.sleep(10)
        print('识别结束')

if __name__ == '__main__':
    crack = CrackWeiboSlide()
    crack.crack()

