hashlib模块定义了一个获取不同哈希加密算法的API，对于特定的hash算法，使用适当的构造器函数或者new()函数来创建hash对象。这些对象使用相同的api,不管使用什么算法。
## hash算法
> hashlib库中包含以下算法：
- md5
- sha1
- sha224
- sha256
- sha384
- sha512

这些算法支持全平台，而另一些可以依赖底层的库。有关每个算法，分别查看algorithm_guaranteed和algorithm_available。

In [5]:
import hashlib

print('Guaranteed: %s' % (','.join(sorted(hashlib.algorithms_guaranteed))))
print()
print('Available: %s' % (','.join(sorted(hashlib.algorithms_available))))

Guaranteed: md5,sha1,sha224,sha256,sha384,sha512

Available: DSA,DSA-SHA,MD4,MD5,RIPEMD160,SHA,SHA1,SHA224,SHA256,SHA384,SHA512,dsaEncryption,dsaWithSHA,ecdsa-with-SHA1,md4,md5,ripemd160,sha,sha1,sha224,sha256,sha384,sha512,whirlpool


## 样本数据
本文所有数据都使用相同的样本数据

In [6]:
lorem = '''Lorem ipsum dolor sit amet, consectetur adipisicing
elit, sed do eiusmod tempor incididunt ut labore et dolore magna
aliqua. Ut enim ad minim veniam, quis nostrud exercitation
ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis
aute irure dolor in reprehenderit in voluptate velit esse cillum
dolore eu fugiat nulla pariatur. Excepteur sint occaecat
cupidatat non proident, sunt in culpa qui officia deserunt
mollit anim id est laborum.'''

## MD5例子
> 为了计算MD5的哈希散列值，对于数据块（这儿是一个转换为字符串的unicode字符串），首先创建一个hash对象，然后加入数据，并计算散列值。

In [9]:
import hashlib
h = hashlib.md5()
h.update(lorem.encode('utf-8'))
print(h.hexdigest())
print()
print(h.digest())

3f2fd2c9e25d60fb0fa5d593b802b7a8

b'?/\xd2\xc9\xe2]`\xfb\x0f\xa5\xd5\x93\xb8\x02\xb7\xa8'


> 案例中使用hexdiget()方法而不是digest()是因为，输出可以被格式化，并清晰的打印出来。如果可以接受二进制散列值输出，则使用digest()

## SHA1例子
> sha1散列值计算方式如下:

In [10]:
h = hashlib.sha1()
h.update(lorem.encode('utf-8'))
print(h.hexdigest())

ea360b288b3dd178fe2625f55b2959bf1dba6eef


## 根据名字创建hash值
> 有时在字符串中通过名字引用函数比使用构造函数更加方便，例如，将散列值存储在配置文件中就很有用j

In [None]:
import argparse
import hashlib
import sys

from hashlib_data import lorem


parser = argparse.ArgumentParser('hashlib demo')
parser.add_argument(
    'hash_name',
    choices=hashlib.algorithms_available,
    help='the name of the hash algorithm to use',
)
parser.add_argument(
    'data',
    nargs='?',
    default=lorem,
    help='the input data to hash, defaults to lorem ipsum',
)
args = parser.parse_args()

h = hashlib.new(args.hash_name)
h.update(args.data.encode('utf-8'))
print(h.hexdigest())

## 增量更新
> update()函数可以重复调用。每次，散列值都根据新增的文本进行更新。相比与将所有文本都读入内存，增量更新效率更高。

In [11]:
import hashlib

h = hashlib.md5()
h.update(lorem.encode('utf-8'))
all_at_once = h.hexdigest()


def chunkize(size, text):
    "Return parts of the text in size-based increments."
    start = 0
    while start < len(text):
        chunk = text[start:start + size]
        yield chunk
        start += size
    return


h = hashlib.md5()
for chunk in chunkize(64, lorem.encode('utf-8')):
    h.update(chunk)
line_by_line = h.hexdigest()

print('All at once :', all_at_once)
print('Line by line:', line_by_line)
print('Same        :', (all_at_once == line_by_line))

All at once : 3f2fd2c9e25d60fb0fa5d593b802b7a8
Line by line: 3f2fd2c9e25d60fb0fa5d593b802b7a8
Same        : True
