# md5加密

sha1, sha256, md5都属于摘要算法（摘要算法不是加密算法）. 都是在计算hash值. 只是散列的程度不同而已. 这种算法有一个特性. 他们是散列. 不是加密. 而且, 由于hash算法是不可逆的, 所以不存在解密的逻辑.

md5是非常常见的加密逻辑，其特点就是小巧. 速度快. 极难被破解，所以md5依然是国内非常多的互联网公司选择的密码加密算法. 

md5是无法进行还原的，因为其是拿到数据的特征值，进行运算之后的结果。就像无法一篇文章的摘要，完整的还原出整个文章。

## python中实现md5

In [2]:
from hashlib import md5


obj = md5()
obj.update("alex".encode("utf-8"))
# obj.update("wusir".encode('utf-8'))  # 可以添加多个被加密的内容

bs = obj.hexdigest()  # 拿到16进制的md5值
print(bs)

534b44a19bf18d20b71ecc4eb77c572f


网上的md5解密都是在撞库，库里已经存了很多md5加密之后的值(库中是原值和md5值一一对应)，用md5加密好的值去数据库中找，找到了就拿出来原值，找不到就拉倒。

## 如何让其撞库撞不出来？

撞库的库中计算的都是标准的md5代码，我们要避免撞库，就要采取措施：加盐

In [4]:
from hashlib import md5

salt = "我是盐.把我加进去就没人能破解了"
obj = md5(salt.encode("utf-8"))  # 加盐
obj.update("alex".encode("utf-8"))
# obj.update("wusir".encode('utf-8'))  # 可以添加多个被加密的内容

bs = obj.hexdigest()  # 拿到16进制的md5值
print(bs)

22cd6f6e42ca76f0137960eb8a4e28cd


和之前计算出来的md5值是完全不一样的。

加盐，其实就是和下面代码一样，将盐塞到obj中，最后在计算出16进制的md5值。

In [5]:
from hashlib import md5

salt = "我是盐.把我加进去就没人能破解了"
obj = md5()  # 加盐
obj.update(salt.encode("utf-8"))
obj.update("alex".encode("utf-8"))
# obj.update("wusir".encode('utf-8'))  # 可以添加多个被加密的内容

bs = obj.hexdigest()  # 拿到16进制的md5值
print(bs)

22cd6f6e42ca76f0137960eb8a4e28cd


## md5使用场景

- 存储用户的密码
- 用户下载文件的校验（文件一致性，在提供文件时，会提供该文件的md5值）

## sha1, sha256的写法

和md5一模一样

In [6]:
from hashlib import sha1


obj = sha1()
obj.update("alex".encode("utf-8"))
# obj.update("wusir".encode('utf-8'))  # 可以添加多个被加密的内容

bs = obj.hexdigest()  # 拿到16进制的md5值
print(bs)

60c6d277a8bd81de7fdde19201bf9c58a3df08f4


## 特点

1. md5的长度是32位，在抓包中或者调试中看到32位的加密字符，可以尝试使用md5破解一波，看是否是md5.

2. 在某些网站的md5名字是被混淆过的，可能是a可能是b，当我们点击去看这个源码时，如果和md5的源码类似，也可以猜测出是md5
![image.png](attachment:image.png)

#  URLEncode

在我们访问一个url的时候总能看到这样的一种url

```url
https://www.sogou.com/web?query=%E5%90%83%E9%A5%AD%E7%9D%A1%E8%A7%89%E6%89%93%E8%B1%86%E8%B1%86&_asf=www.sogou.com&_ast=&w=01019900&p=40040100&ie=utf8&from=index-nologin&s_from=index&sut=3119&sst0=1630994614300&lkt=0%2C0%2C0&sugsuv=1606978591882752&sugtime=1630994614300
```

此时会发现, 在浏览器上明明是能看到中文的. 但是一旦复制出来. 或者在抓包工具里看到的. 都是这种%. 那么这个%是什么鬼? 也是加密么?

非也, 其实我们在访问一个url的时候. 浏览器会自动的进行urlencode操作. 会对我们请求的url进行编码. 这种编码规则被称为百分号编码. 是专门为url(统一资源定位符)准备的一套编码规则.

其实里面的规则非常简单. 就是把url中的参数部分转化成字节. 每字节的再转化成2个16进制的数字. 前面补%. 
![image.png](attachment:image.png)

**目的是**为了防止url中的参数值中有些特殊字符和url要用的特殊字符冲突(如：`& # / ?` 等)从而影响到服务器的解析，所以将参数部分给转换。

## python模拟URLEncode

编码
- quote 把字符串进行urlencode操作
- urlencode 用来处理字典的
- unquote 还原成普通字符串

In [14]:
from urllib.parse import urlencode, unquote, quote

# 单独编码字符串，即普通字符串的编码
a = 'woshidss'
print(quote(a))  # woshidss, 没有特殊符号，还是原来的样子

b = 'wo shi d s s'
print(quote(b))  # wo%20shi%20d%20s%20s, 有特殊符号，会对特殊符号进行处理


wq = "米饭怎么吃"
print(quote(wq))  # %E7%B1%B3%E9%A5%AD%E6%80%8E%E4%B9%88%E5%90%83，中文都会处理
print(quote(wq, encoding="gbk")) # %C3%D7%B7%B9%D4%F5%C3%B4%B3%D4

# 多个数据统一进行编码
dic = {
    "wq": "米饭怎么吃",
    "new_wq": "想怎么吃就怎么吃"
}

print(urlencode(dic))  # wq=%E7%B1%B3%E9%A5%AD%E6%80%8E%E4%B9%88%E5%90%83&new_wq=%E6%83%B3%E6%80%8E%E4%B9%88%E5%90%83%E5%B0%B1%E6%80%8E%E4%B9%88%E5%90%83
print(urlencode(dic, encoding="utf-8"))  # 也可以指定字符集

# 一个完整的url编码过程
base_url = "http://www.baidu.com/s?"
params = {
    "wd": "大王"
}

url = base_url + urlencode(params)
print(url)  # http://www.baidu.com/s?wd=%E5%A4%A7%E7%8E%8B

woshidss
wo%20shi%20d%20s%20s
%E7%B1%B3%E9%A5%AD%E6%80%8E%E4%B9%88%E5%90%83
%C3%D7%B7%B9%D4%F5%C3%B4%B3%D4
wq=%E7%B1%B3%E9%A5%AD%E6%80%8E%E4%B9%88%E5%90%83&new_wq=%E6%83%B3%E6%80%8E%E4%B9%88%E5%90%83%E5%B0%B1%E6%80%8E%E4%B9%88%E5%90%83
wq=%E7%B1%B3%E9%A5%AD%E6%80%8E%E4%B9%88%E5%90%83&new_wq=%E6%83%B3%E6%80%8E%E4%B9%88%E5%90%83%E5%B0%B1%E6%80%8E%E4%B9%88%E5%90%83
http://www.baidu.com/s?wd=%E5%A4%A7%E7%8E%8B


解码

In [10]:
s = "http://www.baidu.com/s?wd=%E5%A4%A7%E7%8E%8B"
print(unquote(s))  # http://www.baidu.com/s?wd=大王

http://www.baidu.com/s?wd=大王


后续碰到某些网站的cookie或者url参数时会碰到这个东西。
- cookie中的一些特殊字符要进行手动的处理，自己计算出来的，需要转换为urlencode编码
- cookie从浏览器复制出来的是没有问题的，因为浏览器已经帮你处理好了
![image.png](attachment:image.png)
- 但是 一些值不是从网页上复制的，是计算出来的，里面包含一些特殊符号(=、空格、冒号)，需要手工处理，使用quote来完成

# Base64

base64其实很容易理解. 通常被加密后的内容是字节. 而我们的密文是用来传输的(不传输谁加密啊). 但是, 在http协议里想要传输字节是很麻烦的一个事儿. 相对应的. 如果传递的是字符串就好控制的多. 此时base64就应运而生了. 26个大写字母+26个小写字母+10个数字+2个特殊符号(+和/)组成了一组类似64进制的计算逻辑. 这就是base64了. 

其逻辑是：
- 拿到一个字节（8个bit，也就是8个二进制位），变成数字，去找`[A-Z a-z 0-9 +/]`的位置，就可以将有一个字节转为一个字符
- 也就是和base64的字符做关系上的映射

在网络传输中，总是优先考虑字符串。http协议，发送数据的时候，字符串是最好处理的。

base64的本质就是一种映射关系，将字节变成字符串。base64处理的时候，是三个字节一起处理，处理成4个字符。

为什么使用base64? decode也可以将字节变成字符串呀？
- 因为加密之后，是一堆无法辨认的字节，无法使用decode的方式来处理无法识别的字节，会报错，所以使用base64,将一堆无法辨认的字节处理成字符串。

## python实现

In [21]:
import base64

bs = "我要吃饭".encode("utf-8")
# 把字节转化成b64
bs_64 = base64.b64encode(bs)
print(bs_64)
print(bs_64.decode())  # base64.b64encode 返回的是bytes，所以需要decode成字符串

# 把b64字符串转化成字节
s = "5oiR6KaB5ZCD6aWt"
s_data = base64.b64decode(s)  # 返回的是bytes,把b64字符串变为字节
print(s_data)
print(s_data.decode("utf-8")) # 将bytes decode解码为字符串

b'5oiR6KaB5ZCD6aWt'
5oiR6KaB5ZCD6aWt
b'\xe6\x88\x91\xe8\xa6\x81\xe5\x90\x83\xe9\xa5\xad'
我要吃饭


## 总结

一般多用来传递图片资源。

将从网络上传输的base64图片数据，转为字节保存到本地
```python
bs = """iVBORw0KGgoAAAANSUhEUgAAAGQAAAAoCAYAAAAIeF9DAAALHUlEQVR42u1aB3dVVRbmbwgoIKDi
chAYxkEHAWmR6lBCQKpE......"""
bs = base64.b64decode(b64)
with open('tu.jpg', mode="wb") as f:
    f.write(bs)
```

base64加密之后的字符串一般是以多个'='号结尾。等号就是凑数的。

- 因为在转换的过程中，是三个字节转换为四个字母，在最后时，字节不够三个(剩下一个或者是两个字节)，就用'='号进行填充。
- 编码之后的字符串中可能会有等号，也可能没有等号。没有等号就是字节刚好够的时候。

# 对称加密

加密和解密使用同样的key来进行。

所谓对称加密就是加密和解密用的是同一个秘钥. 就好比. 我要给你邮寄一个箱子. 上面怼上锁. 提前我把钥匙给了你一把, 我一把. 那么我在邮寄之前就可以把箱子锁上. 然后快递到你那里. 你用相同的钥匙就可以打开这个箱子. 

条件: 加密和解密用的是同一个秘钥. 那么两边就必须同时拥有钥匙才可以. 

常见的对称加密: AES, DES, 3DES. 我们这里讨论AES和DES

## AES

### python实现

加密注意点：
- 需要加密的数据转为字节后，长度必须是16的倍数，如果不够，需要进行填充到16的倍数。如果恰好. 是16的倍数. 需要多填充16个单位的字节。
- 填充时，要填充的内容是： 如果要填充5个字节 5 => 5个5的ascii，如果填充6个字节  6 => 6个6的ascii，如果填充n个字节 `(pad_len * chr(pad_len)).encode("utf-8")`
- 一般key的长度是多少，最少将数据填充为key的倍数。


In [26]:
# AES加密
from Crypto.Cipher import AES

"""
key的长度
    16: *AES-128*
    24: *AES-192*
    32: *AES-256*
    
MODE 加密模式. 
    常见的ECB, CBC
    以下内容来自互联网~~
    ECB：是一种基础的加密方式，密文被分割成分组长度相等的块（不足补齐），然后单独一个个加密，一个个输出组成密文。
    CBC：是一种循环模式，前一个分组的密文和当前分组的明文异或或操作后再加密，这样做的目的是增强破解难度。
    CFB/OFB：实际上是一种反馈模式，目的也是增强破解的难度。
    FCB和CBC的加密结果是不一样的，两者的模式不同，而且CBC会在第一个密码块运算时加入一个初始化向量。
"""
# 需要填入.                       根据mode设置其他参数，可以看源码来看三个参数的对应关系
# key  => 钥匙   => 必须要给            16位
# iv   => 偏移量, 可以理解为加盐        16位
# mode => 加密的模式. 使用的算法.     MODE_CBC 
aes = AES.new(key=b"alexissbalexissb", mode=AES.MODE_CBC, IV=b"0102030405060708")
data = "我吃饭了"
data_bs = data.encode("utf-8")
#  Data must be padded to 16 byte boundary in CBC mode
# 需要加密的数据必须是16的倍数
# 填充规则: 缺少数据量的个数 * chr(缺少数据量个数)，这是pkcs7的填充逻辑
pad_len = 16 - len(data_bs) % 16
data_bs += (pad_len * chr(pad_len)).encode("utf-8")

bs = aes.encrypt(data_bs)  # 加密完返回的是字节
print(bs)  

b'\xf6z\x0f;G\xdcB,\xccl\xf9\x17qS\x93\x0e'


字节在进行网络传输时不方便，很多网站在数据传输时会将加密完的字节数据处理成base64字符串再进行传输。

In [30]:
import base64

bs_64 = base64.b64encode(bs)  # 字节编码成字符串
print(bs_64)  # bs_64也是一个字节类型，需要解码成字符串
bs_data = bs_64.decode("utf-8")
print(bs_data)  # 此时是个字符串，就可以在网络中传输了

b'9noPO0fcQizMbPkXcVOTDg=='
9noPO0fcQizMbPkXcVOTDg==


解密
- base64还原成字节，一般等号结尾大概率是base64处理后的结果
- 需要知道解密的key和iv, mode,  AES加密

In [57]:
s = "9noPO0fcQizMbPkXcVOTDg=="
# base64
# 第一步.,还原成字节
bs = base64.b64decode(s)
print(bs)

# 第二步.,需要知道解密的key和iv, mode,  AES加密
aes = AES.new(key=b"alexissbalexissb", iv=b"0102030405060708", mode=AES.MODE_CBC)
dec_bs = aes.decrypt(bs)
print(dec_bs)
# 解密之后，填充的字符是在的，要想办法将其去掉，一般网络传输中都使用json，可以用}来截取真实数据
print(dec_bs.decode("utf-8"))


b'\xf6z\x0f;G\xdcB,\xccl\xf9\x17qS\x93\x0e'
b'\xe6\x88\x91\xe5\x90\x83\xe9\xa5\xad\xe4\xba\x86\x04\x04\x04\x04'
我吃饭了


解密之后的填充字节处理，可以拿到最后一个字节，直接拿到的是填充数字的个数，将解密后的字节截取对应数据个

In [58]:
# 拿到最后一个字节
print(dec_bs)
last_b = dec_bs[-1]
print(last_b)  # 说明后面填充了四个数据
dec_bs = dec_bs[:(0-last_b)]
print(dec_bs)
print(dec_bs.decode("utf-8"))

b'\xe6\x88\x91\xe5\x90\x83\xe9\xa5\xad\xe4\xba\x86\x04\x04\x04\x04'
4
b'\xe6\x88\x91\xe5\x90\x83\xe9\xa5\xad\xe4\xba\x86'
我吃饭了


## 补齐数据-加密时数据要为8或者16的倍数

In [5]:
from Crypto.Util.Padding import pad, unpad

bs = b'love'
bs = pad(bs, 16)  # 填充，常用的就是8和16进行填充，一般看的是key的长度，和key的保持一致
print(bs)

# 去掉填充
data = unpad(bs,16)
print(data)

b'love\x0c\x0c\x0c\x0c\x0c\x0c\x0c\x0c\x0c\x0c\x0c\x0c'
b'love'


### 总结

AES.MODE_ECB 该模式下不需要给iv，iv是偏移，在加密之前进行数据的偏移：

下面是个比喻
- 原数据：`[1,2,3]`
- 偏移：`[2,2,2]`
- 偏移后的数据： `[3,4,5]`

一般偏移，就是将数据整体位移多少次。

![image.png](attachment:image.png)

## DES

其写法和AES是一样的

In [75]:
# DES加密解密

from Crypto.Cipher import DES

# key: 8个字节， IV也是8个字节
des = DES.new(b"alexissb", mode=DES.MODE_CBC, IV=b"01020304")
data = "我要吃饭".encode("utf-8")
# # 需要加密的数据必须是8的倍数
# # 填充规则: 缺少数据量的个数 * chr(缺少数据量个数) 
pad_len = 8 - len(data) % 8
data += (pad_len * chr(pad_len)).encode("utf-8")

bs = des.encrypt(data)
print(bs)

b'6HX\xfa\xb2R\xa8\r\xa3\xed\xbd\x00\xdb}\xb0\xb9'


In [74]:
# 解密
des = DES.new(key=b'alexissb', mode=DES.MODE_CBC, IV=b"01020304")
data = b'6HX\xfa\xb2R\xa8\r\xa3\xed\xbd\x00\xdb}\xb0\xb9'
result = des.decrypt(data)
print(result.decode("utf-8"))

我要吃饭


## 总结

加密的key的长度一般和iv的长度是一致的，先进行尝试，不行再尝试其他几种。

## 案例

网址：https://www.endata.com.cn/BoxOffice/BO/Year/index.html

需求：拿到图片中红色部位的数据
![image.png](attachment:image.png)

### 分析

1. 看想要的数据不是在源代码中：

    在源代码中搜索`狙击手`，没有拿到数据。


2. 进行抓包分析
![image.png](attachment:image.png)

3. 分析抓到请求的信息
![image.png](attachment:image.png)

    发现响应的数据是完全看不懂的内容，但是当在页面中切换时，只发送了这一条请求，数据肯定是从这个请求中的响应中拿到的，所以我们就猜测这串看不懂的内容被加密过的。

4. 分析请求过程

    根据调用发现发送请求的代码
    ![image.png](attachment:image.png)

5. 分析响应处理部分代码，打断点，看哪行之后数据解密了
![image.png](attachment:image.png)

6. 发现代码难以看懂，因为代码进行了混淆，将代码拷贝出来，逐步分析还原代码

pycharm 选中数据，ctrl+r进行替换

关注括号的位置

字节转换为字符串不仅仅只有base64那一套

将js代码分析还原，并使用python模拟解密，请看实战文件

# 非对称加密 - RSA

非对称加密. 加密和解密的秘钥不是同一个秘钥. 

这里需要两把钥匙. 一个公钥, 一个私钥.  公钥发送给客户端. 发送端用公钥对数据进行加密. 再发送给接收端, 接收端使用私钥来对数据解密. 由于私钥只存放在接受端这边. 所以即使数据被截获了. 也是无法进行解密的. 

常见的非对称加密算法: RSA, DSA等等, 我们就介绍一个. RSA加密, 也是最常见的一种加密方案

![image.png](attachment:image.png)

只能用公钥加密，私钥解密，反过来是不行的。私钥只保存在服务器端，不给任何人，公钥随便发。

我们爬虫干的事情是电脑客户端的，拿到公钥，加密数据，将加密后的数据给服务器。

## python实现

**1.RSA key的生成**

In [2]:
# rsa加密要用到的包，用来加密数据
from Crypto.Cipher import PKCS1_v1_5  # 导包很蛋疼
# rsakey的包，用来生成RSA的公钥私钥
from Crypto.PublicKey import RSA  # 导入RSA包.

# 创建 一对儿 新的 RSA key .
# 参数必须是给定的值 1024，2048，3072
rsa_key_pair = RSA.generate(2048)  # 数据大. 安全性高

### 获取私钥，有两种format
- pem格式

In [3]:
private_key = rsa_key_pair.export_key()  # 默认是pem文件，获取私钥
print(private_key)  # 根据末尾是等号，和出现的字符范围，可以看出来是base64

b'-----BEGIN RSA PRIVATE KEY-----\nMIIEpAIBAAKCAQEApINVSrn+caIOX9CtBh34EyQsL/EOdPB6B/VnrNmRY7jcaEQg\n2Pf1lCweJM/PhPst3dC4cYDp0UqGxlRi/tKdKoTIzlNfUJB4SkOjMnayS3O1P/ia\nRKNMubqFcBeJQYPxWlFUu7NdlvJIDYZv9Zx3qSSL2NShBTgQVTydCcEvmHSuQWZG\nesCDGHPd3jQj1P87PjhHnj+o9YQYQlzhyiTSVy1e4cL8mCesJSx/8WW4GtwtzQeN\nuLEbC5WhJGzoMP2OqQPRYg3F5nTHj83UwHCWcvDBfKO1rwem/Q1ZFr6oAbEHwH5i\nb5LgIxDk7izKSln2FXTD59AjGScwTJXZL/bcYwIDAQABAoIBAC3Ejd9+tB935sjY\nPLKldsUYfKSPyyZUWpbJOqEXXD/ih4sIXR0PisZAqdgy6jhESuPZc9677xC3S5x0\nkJ/1Bx1zmIvyHOPEdXqvq4DYDc048RVNe9mZlrhbAFGJcrmD1Ar88nZPtbtPRyVg\nH9i0QYQQc0mNCgjyKnUUKloy4SNn7CKCmuqS2kCr2b8Y4RzvYAL5ieNFou32DHbF\naQOMm4h3fpyCsTvfxHGWoAFC8DI3hXb3YqkbrwP917+bHrJT4tysBy1lKxxULUW+\nYOlFs94qLo3sVoCj6cYnqncz8kcTybgdAlFg7QeITCONj7IFCtTpEvpsgEsWyOWK\n836YidECgYEAvbXWnCSrhB9B9JEpPrGKtCbEOHECCRyw+xnA77yzvqu3C02bw99Y\naZftjJLr68QD0CLsuN1LNA/FrX6jv39GJnTbdGFNdLGYIvvJvaOBjT4CSHjeAGfM\nQgzgBZ7U6eQRKQTP6AuHReliU4BJ03yUi7JHvVr1VIaWn9vZOyj54XMCgYEA3f+F\nc6Fr54LEEFXUkzZyFAzIFrgliNNbJlug3q8HfQgGt

In [4]:
# 私钥写入文件
with open("private.pem", mode="wb") as f:
     f.write(private_key)

pem格式的文件

![image.png](attachment:image.png)

- DER格式

In [5]:
private_key1 = rsa_key_pair.export_key(format='DER')
print(private_key1)  # 是普通字节形式

b'0\x82\x04\xa4\x02\x01\x00\x02\x82\x01\x01\x00\xa4\x83UJ\xb9\xfeq\xa2\x0e_\xd0\xad\x06\x1d\xf8\x13$,/\xf1\x0et\xf0z\x07\xf5g\xac\xd9\x91c\xb8\xdchD \xd8\xf7\xf5\x94,\x1e$\xcf\xcf\x84\xfb-\xdd\xd0\xb8q\x80\xe9\xd1J\x86\xc6Tb\xfe\xd2\x9d*\x84\xc8\xceS_P\x90xJC\xa32v\xb2Ks\xb5?\xf8\x9aD\xa3L\xb9\xba\x85p\x17\x89A\x83\xf1ZQT\xbb\xb3]\x96\xf2H\r\x86o\xf5\x9cw\xa9$\x8b\xd8\xd4\xa1\x058\x10U<\x9d\t\xc1/\x98t\xaeAfFz\xc0\x83\x18s\xdd\xde4#\xd4\xff;>8G\x9e?\xa8\xf5\x84\x18B\\\xe1\xca$\xd2W-^\xe1\xc2\xfc\x98\'\xac%,\x7f\xf1e\xb8\x1a\xdc-\xcd\x07\x8d\xb8\xb1\x1b\x0b\x95\xa1$l\xe80\xfd\x8e\xa9\x03\xd1b\r\xc5\xe6t\xc7\x8f\xcd\xd4\xc0p\x96r\xf0\xc1|\xa3\xb5\xaf\x07\xa6\xfd\rY\x16\xbe\xa8\x01\xb1\x07\xc0~bo\x92\xe0#\x10\xe4\xee,\xcaJY\xf6\x15t\xc3\xe7\xd0#\x19\'0L\x95\xd9/\xf6\xdcc\x02\x03\x01\x00\x01\x02\x82\x01\x00-\xc4\x8d\xdf~\xb4\x1fw\xe6\xc8\xd8<\xb2\xa5v\xc5\x18|\xa4\x8f\xcb&TZ\x96\xc9:\xa1\x17\\?\xe2\x87\x8b\x08]\x1d\x0f\x8a\xc6@\xa9\xd82\xea8DJ\xe3\xd9s\xde\xbb\xef\x10\xb7K\x9ct\x90\x9f\xf5

### 获取公钥

In [6]:
public_key = rsa_key_pair.public_key().export_key()  # 获取公钥
print(public_key)

b'-----BEGIN PUBLIC KEY-----\nMIIBIjANBgkqhkiG9w0BAQEFAAOCAQ8AMIIBCgKCAQEApINVSrn+caIOX9CtBh34\nEyQsL/EOdPB6B/VnrNmRY7jcaEQg2Pf1lCweJM/PhPst3dC4cYDp0UqGxlRi/tKd\nKoTIzlNfUJB4SkOjMnayS3O1P/iaRKNMubqFcBeJQYPxWlFUu7NdlvJIDYZv9Zx3\nqSSL2NShBTgQVTydCcEvmHSuQWZGesCDGHPd3jQj1P87PjhHnj+o9YQYQlzhyiTS\nVy1e4cL8mCesJSx/8WW4GtwtzQeNuLEbC5WhJGzoMP2OqQPRYg3F5nTHj83UwHCW\ncvDBfKO1rwem/Q1ZFr6oAbEHwH5ib5LgIxDk7izKSln2FXTD59AjGScwTJXZL/bc\nYwIDAQAB\n-----END PUBLIC KEY-----'


In [7]:
# 公钥写入文件
with open("public.pem", mode='wb') as f:
    f.write(public_key)

注意：公钥和私钥必须在同一份代码中一次生成，不能拆开生成。

生成对私钥公钥就行了，不要每次都生成新的，一直用之前生成的就行。

**2.进行加密**

In [20]:
import base64
s = "我要去你家吃火锅"

# 读取文件. 拿到公钥
f = open("public.pem", mode="rb")
# 加载公钥
rsa_public_key = RSA.import_key(f.read())

# 使用公钥加密
pk_rsa = PKCS1_v1_5.new(rsa_public_key)
mi_bs = pk_rsa.encrypt(s.encode("utf-8"))  # 参数必须是字节，需要将字符串编码成字节
mi_b64 = base64.b64encode(mi_bs).decode()  # 加密之后还是字节，要进行网络传输，还需要变为字符串
print(mi_b64)

Zx8mAD1QzIx7ArqVGskw5LlOwM3emPBkbMDNYQzxDXh74Brz3yp5H2ELp2LFWbevU6FtdMG1Aar+FPih79UZG9Q7+MtJapvubpIR2C55NPMDKnRQgdAGMYO+EozH3BiUw9IPVIc6GXH19UOWDkjyzHe2cJr7QcF21fKGgRffZf2efRxpq5pCeKDwFiQytiZtVkfqO6dyb7b6Onl7iY8/VJ2GlAF0+pETV2XMKmyTjoqDOmurgF/nJTQbf/cTc+42YwujD1ADtnEuUanedeIMSO9NeNcQK1nSCmVSbI1/c5rfS9gauOEKxlKOIebu1982ZlqYEfoxFXPEskmJ2ZcD+Q==


rsa在爬虫阶段是不可能解密的，不过我们当前是可以解密的，我们有私钥

**3.进行解密**

In [100]:
s = base64.b64decode(mi_b64)
# 用私钥解密
# 1.拿到私钥. 生成rsakey
f = open("private.pem", mode="rb")
rsa_private_key = RSA.import_key(f.read())

pkcs_rsa = PKCS1_v1_5.new(rsa_private_key)
ming = pkcs_rsa.decrypt(s, None)
print(ming.decode("utf-8"))

我要去你家吃火锅


## 案例

某大网校登录：https://user.wangxiao.cn/login?url=http%3A%2F%2Fks.wangxiao.cn%2F

主要技能：
- 抓包->debug
- session
- cookie处理
- RSA加密