## 常用标准库和第三方库


我们这边只简单介绍几个常用的标准库和第三方库, 包括如下这些
 * 标准库
     * `collections`: 更多高级的容器类型, 例如`namedtuple`(命名元组), `deque`(双端链表), `OrderedDict`(有序字典)
     * `time`: 时间相关类库
     * `datetime`: 日期相关类库(*时区换算)
     * `urllib`: 一般用来处理请求或者构造简单的请求
     * `urllib3`: 功能强大，条理清晰，用于HTTP客户端的Python库
     * `re`: 正则表达式库
     * `os`: 系统底层调用相关操作
     * `sys`: Python内部调用和底层配置等相关
     * `threading`: *多线程
     * `multiprocess`: *多进程
     * `asyncio`: *异步协程
 * 第三方库
     * `requests`: 强大的第三方Http客户端(一般无特殊情况都使用这个)
     * `flask`: 第三方web服务框架
     * `beautifulsoup(bs4)`: html/xml解析类库
     * `Pillow`: 第三方图片处理类库
     * `scrapy`: 爬虫框架, 支持分布式等
     * `numpy`: *科学计算
     * `scipy`: *科学计算
     * `tensorflow`: *深度学习

### 标准库: 时间日期相关

时间与日期相关的操作一般我们直接使用`time`和`datetime`处理即可

In [None]:
# 引入time模块
import time

# 引入datetime模块
#
# 这里使用from ... import ...的形式
# 是因为datetime相关的操作都在`datetime`类中
from datetime import datetime

In [None]:
# 获取当前时间戳
print(time.time())

In [None]:
# 将时间格式化输出
print(time.strftime('%Y-%m-%d %H:%M:%S'))

In [None]:
# 将时间转换为时间戳
print(time.strptime('2019-10-01 12:00:00', '%Y-%m-%d %H:%M:%S'))

In [None]:
# 休眠一段时间
time.sleep(3)

In [None]:
# 构造日期
d = datetime(2019, 10, 1, 12)
print(d)
print(d.date(), '***', d.time())

In [None]:
#
# 时区相关处理建议安装 pytz包
#
import pytz

# 初始化一个UTC时间
t = datetime(2019, 10, 1, tzinfo=pytz.utc)
print(t)

In [None]:
# 获取这个时候北京时间
print(t.astimezone(pytz.timezone('Asia/Shanghai')))
# 获取这个时候的日本时间
print(t.astimezone(pytz.timezone('Asia/Tokyo')))

### 标准库: Http客户端

Http客户端一般情况都是直接使用`requests`, 一般也只是使用`urllib`来处理或者构造URL或者参数

In [None]:
# 引入urllib解析相关的方法
from urllib.parse import urlparse, parse_qs

url = 'https://user@pass:www.baidu.com/search?query=hello&page=1&page_size=20'

In [None]:
# 解析URL
components = urlparse(url)
print(components)

In [None]:
# 解析请求参数
print(parse_qs(components.query))

虽然我们一般不使用urllib或者urllib3来进行网络请求, 但是不代表他们不可以, 只是没有`requests`那么方便而已

In [None]:
# 使用urllib来构造一个请求
import urllib

# 处理post数据
data = {'user': 'aaa', 'pawd': 'bbb'}
form = urllib.parse.urlencode(data).encode('utf-8')

# 构造一个请求
request = urllib.request.Request('http://www.httpbin.org/post?q=1', form)
# 开始进行请求
response = urllib.request.urlopen(request)
# 获取响应内容
print(response.read())

In [None]:
# 使用urllib3构造一个请求
import urllib3

# 获取一个客户端池
http = urllib3.PoolManager()
# 执行请求
r = http.request('post', 'http://www.httpbin.org/post?q=1', {'user': 'aaa', 'pawd': 'bbb'})
# 打印响应结果
print(r.status)
print(r.data)

### 标准库: 正则表达式

正则表达式我们一般使用`re`这个库

In [None]:
# 引入正则表达式库
import re

In [None]:
# 寻找所有数字, match默认是需要全部匹配
m0 = re.match('\d+', 'qqweh1293712as86786das')
print(m0)

m1 = re.search('\d+', 'qqweh1293712as86786das')
print(m1)

### 标准库: 操作系统和Python环境相关

这里一般我们直接使用`os`和`sys`库

In [None]:
# 引入库
import os
import sys

In [None]:
# 获取当前python的命令行参数
print(sys.argv)

In [None]:
# 退出进程
sys.exit()

In [None]:
# 获取当前工作目录
print(os.getcwd())
# 获取当前进程PID和PPID
print(os.getpid(), os.getppid())

In [None]:
# 判断某个目录存不存在
print(os.path.exists('/'))
# 根据相对路径获得绝对路径
print(os.path.abspath('.'))

### 第三方: requests

Python中最常用也是最好用的http客户端类库

一般我们使用`pip`来安装官方仓库中的第三方库, 或者使用`easy_install`进行安装.

In [None]:
# 引入requests
import requests

In [None]:
# 发起一个请求并获得结果
r = requests.post('http://www.httpbin.org/post?q=1', {'user': 'aaa', 'pawd': 'bbb'})
print(r)
print(r.status_code)
print(r.headers)
print(r.text)
print(r.json())

In [None]:
# 自动携带第一次获取的cookies

# 创建会话
session = requests.session()

# 服务端设置一个cookies
r = session.get('http://httpbin.org/cookies/set/cookiename/cookievalue')
print(r.headers)
print(r.raw)

# 第二次请求会自动携带cookies
r = session.get("http://httpbin.org/cookies")
print(r.json())

### 第三方: html内容处理

涉及到html及xml处理, 一般使用`bs4`这个库进行操作

In [None]:
# 引入bs4
from bs4 import BeautifulSoup

# 获取一段HTML内容
r = requests.get('http://www.zxcs.me')
html = r.text
print(html)

In [None]:
# 初始化解析器
soup = BeautifulSoup(html, 'html.parser')
print(soup.prettify())

In [None]:
# 获取所有a标签
print(soup.find_all('a'))

In [None]:
# 使用css选择器搜索
print(soup.select('.title strong'))

### 第三方: http服务

Python中的web服务框架很多, 比较知名的有`flask`(小而美), `django`(大而全). 我们这边简单使用`flask`演示一个简单的web服务

__代码位于`sources/ch05/web_server`__

### 第三方: 图片处理

Python中大部分的图片处理都可以使用`Pillow`进行处理. 更高层次的, 可以使用`opencv`做到更复杂的事情

In [None]:
# 引入Pillow
from PIL import Image

In [None]:
# 加载图片
im = Image.open('dog.jpg')
# 显示图片
im.show()

In [None]:
#进行上下颠倒
out = im.transpose(Image.FLIP_TOP_BOTTOM)
# 保存图片
out.save('1.jpg')

#进行左右颠倒
out =out.transpose(Image.FLIP_LEFT_RIGHT)
# 保存图片
out.save('2.jpg')

# 进行旋转90
out = im.transpose(Image.ROTATE_90)
# 保存图片
out.save('3.jpg')

# 进行旋转180
out = im.transpose(Image.ROTATE_180)
# 保存图片
out.save('4.jpg')

# 进行旋转270
out = im.transpose(Image.ROTATE_270)
# 保存图片
out.save('5.jpg')