# 常用build_in模块

**1.datetime**

datetime是Python处理日期和时间的标准库。

In [None]:
from datetime import datetime
now = datetime.now()# 获取当前datetime
print(now)

In [None]:
stamp = now.timestamp()#datetime转换为timestamp
print(stamp)

In [None]:
localtime = datetime.fromtimestamp(stamp)#timestamp转换为datetime (本地时间)
print(localtime)
utctime = datetime.utcfromtimestamp(stamp)#timestamp转换为datetime (UTC时间)
print(utctime)

In [None]:
cday = datetime.strptime('2015-6-1 18:19:59', '%Y-%m-%d %H:%M:%S')#str转换为datetime
print(cday)

In [None]:
now = datetime.now()#datetime转换为str
print(now.strftime('%a, %b %d %H:%M'))

In [None]:
from datetime import datetime, timedelta
now = datetime.now()
now

In [None]:
#对日期和时间进行加减实际上就是把datetime往后或往前计算，得到新的datetime。
#加减可以直接用+和-运算符，不过需要导入timedelta这个类：
now + timedelta(hours=10)

**2.collections**

collections模块提供了一些有用的集合类，可以根据需要选用。

namedtuple

namedtuple是一个函数，它用来创建一个自定义的tuple对象，并且规定了tuple元素的个数，并可以用属性而不是索引来引用tuple的某个元素。

这样一来，我们用namedtuple可以很方便地定义一种数据类型，它具备tuple的不变性，又可以根据属性来引用，使用十分方便。

In [None]:
from collections import namedtuple
Point = namedtuple('Point', ['x','y'])
p = Point(1,2)
print(p.x)
print(p.y)

deque

deque是为了高效实现插入和删除操作的双向列表，适合用于队列和栈：

In [None]:
from collections import deque
q = deque(['a', 'b', 'c'])
q.append('x')
q.appendleft('y')
q

OrderedDict

使用dict时，Key是无序的。在对dict做迭代时，我们无法确定Key的顺序。

如果要保持Key的顺序，可以用OrderedDict：

注意，OrderedDict的Key会按照插入的顺序排列，不是Key本身排序：

In [None]:
from collections import OrderedDict
d = dict([('a',1), ('b', 2), ('c', 3)])
print(d)
od = OrderedDict([('a',1), ('b', 2), ('c', 3)])
print(od)

**3.base64**

Base64是一种任意二进制到文本字符串的编码方法，常用于在URL、Cookie、网页中传输少量二进制数据

**4.struct**

struct的pack函数把任意数据类型变成bytes：

In [None]:
import struct
struct.pack('>I', 10240099)

unpack把bytes变成相应的数据类型：

In [None]:
struct.unpack('>IH', b'\xf0\xf0\xf0\xf0\x80\x80')

>表示字节顺序是big-endian，也就是网络序
<表示字节顺序是little-endian

其他struct模块定义的数据类型可以参考Python官方文档：
https://docs.python.org/3/library/struct.html#format-characters

**4.hashlib/hmac**

hashlib提供了常见的摘要算法，如MD5，SHA1等等。

什么是摘要算法呢？摘要算法又称哈希算法、散列算法。它通过一个函数，把任意长度的数据转换为一个长度固定的数据串（通常用16进制的字符串表示）。

In [None]:
import hashlib

md5 = hashlib.md5()
md5.update('how to use md5 in python hashlib?'.encode('utf-8'))
print(md5.hexdigest())

Hmac算法：Keyed-Hashing for Message Authentication。它通过一个标准算法，在计算哈希的过程中，把key混入计算过程中。

In [None]:
import hmac
message = b'Hello world'
key = b'secret'
h = hmac.new(key,message,digestmod='MD5')
h.hexdigest()

**5.itertools**

模块itertools提供了非常有用的用于操作迭代对象的函数

In [None]:
import itertools

#无限迭代器，根本停不下来
~~~
natuals = itertools.count(1)
for n in natuals:
    print(n)
'''
...
1
2
3
...
'''   
cs = itertools.cycle('ABC')
for c in cs:
    print(c)
'''
...
'A'
'B'
'C'
'A'
'B'
'C'
...
'''
ns = itertools.repeat('A', 3)
for n in ns:
    print(n)
'''
...
A
A
A
'''
~~~

In [None]:
#可以通过takewhile()等函数根据条件判断来截取出一个有限的序列：
natuals = itertools.count(1)
ns = itertools.takewhile(lambda x: x <= 10, natuals)
list(ns)

In [None]:
#chain()可以把一组迭代对象串联起来，形成一个更大的迭代器：
for c in itertools.chain('ABC', 'XYZ'):
    print(c)

In [None]:
#groupby()把迭代器中相邻的重复元素挑出来放在一起：
for key, group in itertools.groupby('AAABBBCCAAA'):
    print(key, list(group))

**6.contextlib**

任何对象，只要正确实现了上下文管理，就可以用于with语句。

**7.urllib**

urllib提供了一系列用于操作URL的功能。

**8.XML**

**9.HTMLParser**

In [None]:
from html.parser import HTMLParser
from html.entities import name2codepoint

class MyHTMLParser(HTMLParser):

    def handle_starttag(self, tag, attrs):
        print('<%s>' % tag)

    def handle_endtag(self, tag):
        print('</%s>' % tag)

    def handle_startendtag(self, tag, attrs):
        print('<%s/>' % tag)

    def handle_data(self, data):
        print(data)

    def handle_comment(self, data):
        print('<!--', data, '-->')

    def handle_entityref(self, name):
        print('&%s;' % name)

    def handle_charref(self, name):
        print('&#%s;' % name)

parser = MyHTMLParser()
parser.feed('''<html>
<head></head>
<body>
<!-- test html parser -->
    <p>Some <a href=\"#\">html</a> HTML&nbsp;tutorial...<br>END</p>
</body></html>''')