- requests更简洁更友好
- 继承了urllib的所有特征
- 底层使用的是urllib3
- 开源地址：https://github.com/requests/requests
- 中文文档：http://2.python-requests.org/zh_CN/latest/user/quickstart.html

- get请求
    - requests.get(url)
    - 同 requests.request("get", url)
    - 可以带有headers和parmas参数 【案例02】
    - 【案例01】
- get返回内容
    - 【案例02】
    
- post
    - rsp = requests.post(url, data=data)
    - 【案例03】
    - data, headers要求dict类型
    
- proxy
    - proxies = {
    -    "http": "address of proxy"
    -    "https": "address of proxy"
    - }
    - rsp = requests.request("get", "http:xxxxxx", proxies=proxies)
    - 代理有可能报错，如果使用人数多，考虑安全问题，可能会被强行关闭
    
- 用户验证
    - 代理验证
        - 可能需要使用HTTP basic Auth，可以这样：
        - 格式为：用户名:密码@代理地址:端口号
        - proxy = {"http":"china:123456@192.168.1.123:80"}
        - rsp = requests.get("http://baidu.com", proxies=proxy)
        
- web客户端验证
    - 如果遇到web客户端验证，需要添加auth=(用户名，密码)
    - auth=("test1", "123456")授权信息
    - rsp = requests.get("http://baidu.com", auth=auth)
    
- cookie
    - # requests可以自动处理cookie信息
    - rsp = requests.get("http://xxxxxx")
    - # 如果对方服务器传送过来cookie信息，则可以通过反馈的cookie属性得到
    - # 返回一个cookiejar实例
    - cookiejar = rsp.cookies
    - # 可以将cookiejar转换成字典
    - cookiedict = requests.utils.dict_from_cookiejar(cookiejar)
    
- session
    - 跟服务器端session不是一个东东
    - 是模拟一次会话，从客户端浏览器链接服务器开始，到客户端浏览器断开
    - 能让我们跨请求时保持某些参数，比如在同一个session实例发出的所有请求之间保持cookie
    
    - # 创建session对象，可以保持cookie值
    - ss = requests.session()
    - headers = {"User-Agent":"xxxxxxxxx"}
    - data = {"name":"xxxxxxxx"}
    - # 此时，由创建的session管理请求，负责发出请求
    - ss.post("http://www.baidu.com", data=data, headers=headers)
    - rsp = ss.get("xxxxxxxxxx")
    
- https请求验证ssl证书
    - 参数verify负责表示是否需要验证ssl证书，默认是True
    - rsp = requests.get("http://xxxxxx", verify=False)
    - # 如果verify=True访问12306，会报错，因为他的证书有问题

In [3]:
# 案例01：get请求

import requests

url = 'http://www.baidu.com'

rsp = requests.get(url)

print(rsp.text)

In [None]:
# 案例02：get返回内容

url = 'http://www.baidu.com'

kw = {
    'wd': '王八蛋'
}
# 参看下方图片
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36'
}

rsp = requests.get(url, params=kw, headers=headers)

print(rsp.text)

![get.png](attachment:get.png)

In [6]:
# 案例03：post

'''
1. 在百度翻译中输入单词girl，发现每敲一个字母后都有请求
2. 请求地址是：http://fanyi.baidu.com/sug
3. 利用Network-All-Headers, 查看，发现FormData的值是 kw：girl （最下边）
4. 检查返回的内容格式content-type，发现是json格式内容 ==》需要用到json包 
'''

import requests
from urllib import parse

'''
大致流程是：
1. 利用data构造内容，然后urlopen打开
2. 返回一个json格式的内容
3. 结果就应该是girl的中文释义
'''

baseurl = 'https://fanyi.baidu.com/sug'

# 存放用来模拟form的数据一定是dict格式
data = {
    # girl是翻译输入的英文内容，应该是有用户输入，此处使用硬编码
    'kw':'girl'
}

headers = {
    # 因为使用post，至少应该包含content-length 字段
    'Content-Length': str(len(data))
}

# 有了data，url，就可以尝试发出请求了
rsp = requests.post(baseurl, data=data)

print(rsp.text)

print(rsp.json())


{"errno":0,"data":[{"k":"girl","v":"n. \u5973\u5b69; \u59d1\u5a18; \u5973\u513f; \u5e74\u8f7b\u5973\u5b50; \u5973\u90ce;"},{"k":"girls","v":"n. \u5973\u5b69; \u59d1\u5a18; \u5973\u513f; \u5e74\u8f7b\u5973\u5b50; \u5973\u90ce;  girl\u7684\u590d\u6570;"},{"k":"girlfriend","v":"n. \u5973\u670b\u53cb; \u5973\u60c5\u4eba; (\u5973\u5b50\u7684)\u5973\u4f34\uff0c\u5973\u53cb;"},{"k":"girl friend","v":" \u672a\u5a5a\u59bb; \u5973\u6027\u670b\u53cb;"},{"k":"Girls' Generation","v":" \u5c11\u5973\u65f6\u4ee3\uff08\u97e9\u56fdSM\u5a31\u4e50\u6709\u9650\u516c\u53f8\u4e8e2007\u5e74\u63a8\u51fa\u7684\u4e5d\u540d\u5973\u5b50\u5c11\u5973\u7ec4\u5408\uff09;"}]}
{'errno': 0, 'data': [{'k': 'girl', 'v': 'n. 女孩; 姑娘; 女儿; 年轻女子; 女郎;'}, {'k': 'girls', 'v': 'n. 女孩; 姑娘; 女儿; 年轻女子; 女郎;  girl的复数;'}, {'k': 'girlfriend', 'v': 'n. 女朋友; 女情人; (女子的)女伴，女友;'}, {'k': 'girl friend', 'v': ' 未婚妻; 女性朋友;'}, {'k': "Girls' Generation", 'v': ' 少女时代（韩国SM娱乐有限公司于2007年推出的九名女子少女组合）;'}]}
