In [None]:
# 1.什么是Hash
'''
把任意长度的输入，通过某种hash算法，变换成固定长度的输出，该输出就是散列值，也称摘要值，该算法就是哈希函数，也称摘要函数
通过摘要函数对任意长度的数据计算出固定长度的摘要digest，目的是为了提供一个验证文件未被篡改的方法
摘要函数是一个单向函数，计算digest很容易，但通过digest反推原始数据却非常困难
最关键的是，对原始数据做一个比特位的修改，都会导致计算出的摘要完全不同
摘要算法不是加密算法，不能用于加密数据（因为无法通过摘要反推明文），只能用于防止数据被篡改
MD5是最常见的摘要算法，速度很快，生成结果是固定的16字节，通常用一个32位的16进制字符串表示
SHA1算法更安全点，它的结果是20字节长度，通常用一个40位的16进制字符串表示。
而比SHA1更安全的算法是SHA256和SHA512等等，不过越安全的算法越慢，并且摘要长度更长。
'''

In [6]:
# 2.hashlib模块
## update()方法现在只接受bytes类型的数据，不接收str类型
import hashlib

m = hashlib.sha256()     # 通过构造函数获得一个hash对象
m.update(b'Nobody inspects')        # 使用hash对象的update方法添将bytes类型的数据添加到对象中
m.update(b' the spammish repetition')
print(m.digest())                  # 获得bytes类型的消息摘要
print(m.hexdigest())               # 获得16进制str类型的消息摘要
print(m.digest_size)   # 查看消息摘要的位长
print(m.block_size)    # 查看消息摘要的内部块大小

b'\x03\x1e\xdd}Ae\x15\x93\xc5\xfe\\\x00o\xa5u+7\xfd\xdf\xf7\xbcN\x84:\xa6\xaf\x0c\x95\x0fK\x94\x06'
031edd7d41651593c5fe5c006fa5752b37fddff7bc4e843aa6af0c950f4b9406
32
64


In [7]:
# 更加简单写法
hashlib.sha224(b"Nobody inspects the spammish repetition").hexdigest()

'a4337bc45a8fc544c03f52dc550cd6e1e87021bc896588bd79e901e2'

In [8]:
# hashlib.new(name[, data])
'''
一个通用的构造方法，name是某个算法的字符串名称，data是可选的bytes类型待摘要的数据
'''
h = hashlib.new('sha256', b'haha')
h.hexdigest()

'090b235e9eb8f197f2dd927937222c570396d971222d9009a9189e2b6cc0a2c1'

In [10]:
# 3. hashlib模块的两个常量属性
'''
hashlib.algorithms_guaranteed 所有平台中，模块支持的hash算法列表
hashlib.algorithms_available  当前Python解释器环境中，模块支持的hash算法列表
'''
print(hashlib.algorithms_guaranteed)
print(hashlib.algorithms_available)

{'sha256', 'sha224', 'md5', 'sha512', 'sha384', 'sha1'}
{'sha', 'sha256', 'SHA384', 'ecdsa-with-SHA1', 'SHA256', 'sha1', 'MDC2', 'dsaEncryption', 'MD4', 'sha224', 'DSA', 'sha384', 'SHA224', 'DSA-SHA', 'MD5', 'SHA1', 'SHA', 'SHA512', 'mdc2', 'md5', 'md4', 'ripemd160', 'sha512', 'RIPEMD160', 'whirlpool', 'dsaWithSHA'}


In [None]:
# 4.hash对象的两个常量属性
'''
hash.digest_size
hash结果的长度

hash.block_size
hash内部块的大小
'''

In [None]:
# 5.hash对象的属性
'''
hash.name
hash算法名称字符串
'''

In [None]:
# 6. hash对象的方法
'''
hash.update(arg)
更新hash对象。连续的调用该方法相当于连续的追加更新。例如m.update(a); m.update(b)相当于m.update(a+b)。
注意，当数据规模较大的时候，Python的GIL在此时会解锁，用于提高计算速度。
一定要理解update()的作用，由于消息摘要是只针对当前状态产生的，所以每一次update后，再次计算hexdigest()的值都会不一样。

hash.digest()
返回bytes格式的消息摘要

hash.hexdigest()
与digest方法类似，不过返回的是两倍长度的字符串对象，所有的字符都是十六进制的数字。
通常用于邮件传输或非二进制环境中。通常我们比较摘要时，比较的就是这个值！

hash.copy()
返回一个hash对象的拷贝
'''

In [11]:
# 使用场景
'''
最常用的就是密码加密！密码加密不像数据加密，通常不需要反向解析出明文
数据加密一般是需要反向解析的，我们无法从摘要反向解析出数据，加密是没问题了，但你让数据使用者如何获取数据
加盐：额外给原始数据添加一点自定义的数据，使得生成的消息摘要不同于普通方式计算的摘要
'''
md5 = hashlib.md5()
s = 'password' + 'salt'
md5.update(s.encode())
md5.hexdigest()

'b305cadbb3bce54f3aa59c64fec00dea'