In [None]:
# 常用内建模块


## datetime


In [8]:
from datetime import datetime, timedelta

now = datetime.now()
now.timestamp()
datetime.fromtimestamp(1429417200.0)
cday = datetime.strptime('2015-6-1 18:19:59', '%Y-%m-%d %H:%M:%S')
cday
now.strftime('%a, %b %d %H:%M')
now + timedelta(hours=10)


datetime.datetime(2023, 5, 23, 20, 30, 59, 303574)

## collections


### namedtuple

> `namedtuple`是一个函数，它用来创建一个自定义的`tuple`对象，并且规定了`tuple`元素的个数，并可以用属性而不是索引来引用`tuple`的某个元素。


In [10]:
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])
p = Point(1, 2)
p.x
Circle = namedtuple('Circle', ['x', 'y', 'r'])
c = Circle(1, 2, 4)
c.r


4

### deque

使用`list`存储数据时，按索引访问元素很快，但是插入和删除元素就很慢了，因为`list`是线性存储，数据量大的时候，插入和删除效率很低。

`deque`是为了高效实现插入和删除操作的双向列表，适合用于队列和栈


In [11]:
from collections import deque

q = deque(['a', 'b', 'c'])
q.append('x')
q.appendleft('y')
q


deque(['y', 'a', 'b', 'c', 'x'])

### defaultdict

> 使用`dict`时，如果引用的`Key`不存在，就会抛出`KeyError`。如果希望`key`不存在时，返回一个默认值，就可以用`defaultdict`


In [13]:
from collections import defaultdict

dd = defaultdict(lambda: 'N/A')
dd['k1'] = 1
dd['k1']
dd['k2']


'N/A'

### OrderedDict

> 使用`dict`时，`Key`是无序的。在对`dict`做迭代时，我们无法确定`Key`的顺序。

如果要保持`Key`的顺序，可以用`OrderedDict`


In [18]:
from collections import OrderedDict

d = dict([('a', 1), ('b', 2), ('c', 3)])
print(d)
od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])

# 实现一个FIFO（先进先出）的dict


class LastUpdatedOrderedDict(OrderedDict):

    def __init__(self, capacity):
        super(LastUpdatedOrderedDict, self).__init__()
        self._capacity = capacity

    def __setitem__(self, key, value):
        containsKey = 1 if key in self else 0
        if len(self) - containsKey >= self._capacity:
            last = self.popitem(last=False)
            print('remove:', last)
        if containsKey:
            del self[key]
            print('set:', (key, value))
        else:
            print('add:', (key, value))
        OrderedDict.__setitem__(self, key, value)


{'a': 1, 'b': 2, 'c': 3}


OrderedDict([('a', 1), ('b', 2), ('c', 3)])

### ChainMap

> `ChainMap`可以把一组`dict`串起来并组成一个逻辑上的`dict`。`ChainMap`本身也是一个`dict`，但是查找的时候，会按照顺序在内部的`dict`依次查找。

什么时候使用`ChainMap`最合适？举个例子：应用程序往往都需要传入参数，参数可以通过命令行传入，可以通过环境变量传入，还可以有默认参数。我们可以用`ChainMap`实现参数的优先级查找，即先查命令行参数，如果没有传入，再查环境变量，如果没有，就使用默认参数。


In [None]:
from collections import ChainMap
import os
import argparse

# 默认参数
defalut = {
    'color': 'red',
    'user': 'guest'
}

parser = argparse.ArgumentParser()
parser.add_argument('-u', '--user')
parser.add_argument('-c', '--color')
namespace = parser.parse_args()
command_line_args = {k: v for k, v in vars(namespace).items() if v}
combined  = ChainMap(command_line_args,os.environ,defalut)
print('color=%s' % combined['color'])
print('user=%s' % combined['user'])
#  python3 use_chainmap.py 
#  python3 use_chainmap.py -u bob
#  user=admin color=green python3 use_chainmap.py -u bob

### Counter

> `Counter`是一个简单的计数器，例如，统计字符出现的个数

In [20]:
from collections import Counter

c = Counter('gallahad')
c.update('hello')
c

Counter({'g': 1, 'a': 3, 'l': 4, 'h': 2, 'd': 1, 'e': 1, 'o': 1})

## argparse

> 在命令行程序中，经常需要获取命令行参数。Python内置的`sys.argv`保存了完整的参数列表

In [None]:
import argparse

def main():
    # 定义一个ArgumentParser实例:
    parser = argparse.ArgumentParser(
        prog='backup', # 程序名
        description='Backup MySQL database.', # 描述
        epilog='Copyright(r), 2023' # 说明信息
    )
    # 定义位置参数:
    parser.add_argument('outfile')
    # 定义关键字参数:
    parser.add_argument('--host', default='localhost')
    # 此参数必须为int类型:
    parser.add_argument('--port', default='3306', type=int)
    # 允许用户输入简写的-u:
    parser.add_argument('-u', '--user', required=True)
    parser.add_argument('-p', '--password', required=True)
    parser.add_argument('--database', required=True)
    # gz参数不跟参数值，因此指定action='store_true'，意思是出现-gz表示True:
    parser.add_argument('-gz', '--gzcompress', action='store_true', required=False, help='Compress backup files by gz.')


    # 解析参数:
    args = parser.parse_args()

    # 打印参数:
    print('parsed args:')
    print(f'outfile = {args.outfile}')
    print(f'host = {args.host}')
    print(f'port = {args.port}')
    print(f'user = {args.user}')
    print(f'password = {args.password}')
    print(f'database = {args.database}')
    print(f'gzcompress = {args.gzcompress}')

if __name__ == '__main__':
    main()

# base64

In [22]:
import base64

base64.b64encode(b'binary\x00string')
base64.b64decode(b'YmluYXJ5AHN0cmluZw==')

b'binary\x00string'

## struct

> struct模块来解决bytes和其他二进制数据类型的转换。

In [23]:
import struct
struct.pack('>I',10240099) #>表示字节顺序是big-endian，也就是网络序，I表示4字节无符号整数。


b'\x00\x9c@c'

## hashlib

> Python的`hashlib`提供了常见的摘要算法，如`MD5`，`SHA1`等等。



In [24]:
import hashlib

md5 = hashlib.md5()
md5.update('how to use md5 in python hashlib?'.encode('utf-8'))
md5.hexdigest()

'd26a53750bc40b38b65a520292f69306'

## hmac

> 采用`Hmac`替代我们自己的`salt`算法，可以使程序算法更标准化，也更安全。

In [26]:
import hmac

msg = b'hello'
key = b'secret'
h = hmac.new(key,msg,digestmod='md5')
h.hexdigest()

'bade63863c61ed0b3165806ecd6acefc'

## itertools

> Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数。


In [27]:
import itertools

natuals = itertools.count(1)
ns = itertools.takewhile(lambda x: x <= 10, natuals)
ns

<itertools.takewhile at 0x1963f0ce9c0>

### chain

chain()可以把一组迭代对象串联起来，形成一个更大的迭代器

In [28]:
for c in itertools.chain('ABC', 'XYZ'):
        print(c)

A
B
C
X
Y
Z


### groupby 

> `groupby()`把迭代器中相邻的重复元素挑出来放在一起

In [29]:
for key, group in itertools.groupby('AAABBBCCAAA'):
       print(key, list(group))

A ['A', 'A', 'A']
B ['B', 'B', 'B']
C ['C', 'C']
A ['A', 'A', 'A']


## contextlib

- 任何对象，只要正确实现了上下文管理，就可以用于`with`语句。

- 实现上下文管理是通过`__enter__`和`__exit__`这两个方法实现的


### @contextmanager

编写`__enter__`和`__exit__`仍然很繁琐，因此Python的标准库`contextlib`提供了更简单的写法

### @closing

如果一个对象没有实现上下文，我们就不能把它用于`with`语句。这个时候，可以用`closing()`来把该对象变为上下文对象。例如，用`with`语句使用`urlopen()`

```python
@contextmanager
def closing(thing):
    try:
        yield thing
    finally:
        thing.close()
```

In [30]:
from contextlib import contextmanager

class Query(object):

    def __init__(self, name):
        self.name = name

    def query(self):
        print('Query info about %s...' % self.name)

@contextmanager
def create_query(name):
    print('Begin')
    q = Query(name)
    yield q
    print('End')
    
with create_query('Bob') as q:
    q.query()    

Begin
Query info about Bob...
End


In [None]:
from contextlib import closing
from urllib.request import urlopen

with closing(urlopen('https://www.python.org')) as page:
    for line in page:
        print(line)

## urllib


### Get

### Post

如果要以`POST`发送一个请求，只需要把参数`data`以`bytes`形式传入。

### Handler Proxy

In [None]:
from urllib import request

with request.urlopen('https://api.douban.com/v2/book/2129650') as f:
    data = f.read()
    print('Status:', f.status, f.reason)
    for k, v in f.getheaders():
        print('%s: %s' % (k, v))
    print('Data:', data.decode('utf-8'))

## XML



In [None]:
from xml.parsers.expat import ParserCreate

class DefaultSaxHandler(object):
    def start_element(self, name, attrs):
        print('sax:start_element: %s, attrs: %s' % (name, str(attrs)))

    def end_element(self, name):
        print('sax:end_element: %s' % name)

    def char_data(self, text):
        print('sax:char_data: %s' % text)

xml = r'''<?xml version="1.0"?>
<ol>
    <li><a href="/python">Python</a></li>
    <li><a href="/ruby">Ruby</a></li>
</ol>
'''

handler = DefaultSaxHandler()
parser = ParserCreate()
parser.StartElementHandler = handler.start_element
parser.EndElementHandler = handler.end_element
parser.CharacterDataHandler = handler.char_data
parser.Parse(xml)

## HTMLParser

In [None]:
from html.parser import HTMLParser
from html.entities import name2codepoint

class MyHTMLParser(HTMLParser):

    def handle_starttag(self, tag, attrs):
        print('<%s>' % tag)

    def handle_endtag(self, tag):
        print('</%s>' % tag)

    def handle_startendtag(self, tag, attrs):
        print('<%s/>' % tag)

    def handle_data(self, data):
        print(data)

    def handle_comment(self, data):
        print('<!--', data, '-->')

    def handle_entityref(self, name):
        print('&%s;' % name)

    def handle_charref(self, name):
        print('&#%s;' % name)

parser = MyHTMLParser()
parser.feed('''<html>
<head></head>
<body>
<!-- test html parser -->
    <p>Some <a href=\"#\">html</a> HTML&nbsp;tutorial...<br>END</p>
</body></html>''')