# Requests 库基本使用教程

The website is the API...

requests第三方优秀http请求处理库，它简洁又简单。

## 1. 安装 

pipenv install rquests

## 2. 源码下载 

git clone git://github.com/requests/requests.git

## 3. quickstart 

主要参考：
- http://www.python-requests.org/en/master/user/quickstart/
- https://www.icourse163.org Python网络爬虫与信息提取
    
### 3.1. 发送简单http请求 

requests中最基本的方法是def request(method, url,\**kwargs)  

requests中实现了以下方法：

- get方法：请求指定的页面内容，并返回实体主体；get方法是http请求最常用的方法  
requests 中发送http get请求，通过def get(url, params=None, \**kwargs)这个函数。  

- post方法：向指定资源提交数据（表单／文件）进行处理请求，数据被包含在请求体中；post请求可能导致新的资源的建立和已有资源的改变。 
- head方法：类似get方法，返回的响应中没有具体内容，只有响应报头。 如果URL指向内容巨大，可以先获取head信息。
- put方法：从客户端向服务器传送的数据取代指定的文档的内容（向url位置存储一个资源，覆盖原资源）。 
- patch方法：请求局部更新url位置的资源，即改变该处资源的部分内容。
- delete方法：请求服务器删除指定页面。 
- option方法：允许客户端查看服务器的性能。 

http/1.1 协议还有以下方法：

- connect方法：http／1.1协议中预留给能够将连接改为管道方式的代理服务器。 
- trace方法：回显服务器收到的请求，主要用于测试或诊断。

#### 最常见使用：
r = requests.get('http://www.baidu.com')

#### 访问方法中的参数详情

最好通过阅读源代码来理解或使用。

- param url: URL for the new :class:\`Request\` object.
- param params: (optional) Dictionary or bytes to be sent in the query string for the :class:\`Request`.
- param data: (optional) Dictionary or list of tuples \`\`[(key, value)]\`\` (will be form-encoded), bytes, or file-like object to send in the body of the :class:\`Request\`.
- param json: (optional) json data to send in the body of the :class:\`Request\`.
- param headers: (optional) Dictionary of HTTP Headers to send with the :class:\`Request\`.
- param cookies: (optional) Dict or CookieJar object to send with the :class:\`Request\`.
- param files: (optional) 
- param auth: (optional) Auth tuple to enable Basic/Digest/Custom HTTP Auth.
- param timeout: (optional) How many seconds to wait for the server to send data before giving up, as a float


### 3.2 理解响应与异常

#### Response对象  

发送请求后，会得到Response对象r,r可调用属性有：
- r.status_code : http请求的返回状态，200表示连接成功...
- r.text : http响应内容的字符串形式；
- r.encoding ：从http响应头重猜测的响应内容编码形式；
- r.apparent_encoding ： 从内容中分析出的响应内容编码形式；
- r.content ：http响应内容的二进制形式；
- r.raise_for_status()：检查返回响应代码是否为200，否则返回一个异常。

#### 常见处理流程

1. 发送请求；
2. 检查r.status_code，或调用r.raise_for_status()；
3. 若为2xx，则正常处理；
4. 若为4xx，5xx则异常处理；

### 3.2 异常处理

requests库的异常处理类有以下：
- requests.ConnectionError 网络连接错误异常，如DNS查询失败，拒绝连接等；
- requests.HTTPError http错误异常
- requests.URLRequired URL确实异常
- requests.TooManyRedirects 超过最大重定向次数，产生重定向异常
- requests.ConnectTimeout 连接远程服务器超时异常
- requests.Timeout 请求URL超时异常

### 3.3. 在url中传递参数 

url中很常见的查询串（键值对）通常由get方法发送。 
使用字典方式建立参数键值对，然后令参数params = 字典名 requests 会自动对url进行编码。

### 3.4. 响应内容的获取

仍然以github timeline为例. 可以看到，不像urllib，响应内容自动解码了，大多数的unicode编码可以无痕解码。 当我们构造请求是，有时会猜测响应的编码格式，使用r.encoding可以直接查看，不需要猜了。 赋值r.encoding = 'gbk'或别的编码，可以方便的改变编码，以便你需要特殊编码的情况。

### 3.5.二进制响应内容（图片、文件） 

不需要特殊设置，r.content 返回b'......'就表示响应是二进制的。 
gzip／deflate transfer-encodings压缩格式，也可以自动解码。

### 3.6. json响应内容 

requests中有一个内建的json解码器,使用r.json()就可以使用。  
万一json解码失败，r.json()会抛出异常，例如响应码为204（no content），或响应包含无效的json，就会抛出ValueError：No Json object could be decoded. 错误.  
注意：json解码成功时，并不显示成功，所以为了检查是否成功，使用r.raise_for_status()或检查r.status_code是否是你希望的结果。

### 3.7. 原始响应内容 

很少情况下，我们要查看来自server的原始socket响应，你可能访问r.raw。 如果你想查看，你需要在Initial request中设置stream=True。 获得原始socket后，通常会把他们存在文件里。

In [None]:
"""发送简单http请求并获得响应"""

import requests
#向目标服务器发送http get请求
r = requests.get('https://api.github.com/events')
print(r.text)

#设置headers
url = 'https://www.kuaidaili.com/free/'
headers = {'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
           'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36',
          }
r = requests.get(url,headers=headers)
print(r.status_code)

In [None]:
"""理解Response对象"""
import requests
r = requests.get('https://api.github.com/events')

print(r.status_code)
print('-'*20)
print(r.headers)
print('-'*20)
print(r.encoding)
print('-'*20)
print(r.apparent_encoding)
print('-'*20)
print(r.text)
print('-'*20)
print(r.content)
print('-'*20)

In [None]:
"""理解异常处理的基本方法(代码框架)"""

import requests

def getHTML(url):
    try:
        r = requests.get(url,timeout = 30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "Some exceptions were raised."
    
if __name__ == '__main__':
    url = 'http://www.ba1idu.com'
    print(getHTML(url))

In [None]:
"""理解其他请求方法"""

#向目标服务器发送head请求
r = requests.head('http://httpbin.org/get')
print(r.headers)
print('-'*20)
print(r.text)
print('-'*20)

#向目标服务器发送put/post请求
r = requests.post('http://httpbin.org/put',data = {'key1':'value1','key2':'value2'})
print(r.text)
print('-'*20)
# 等价于requests.request('post','http://httpbin.org/put',data = {'key1':'value1','key2':'value2'})
#向目标服务器发送delete请求
r = requests.delete('http://httpbin.org/delete')
print(r.text)
print('-'*20)
#向目标服务器发送options请求
r = requests.options('http://httpbin.org/get')
print(r.text)
print('-'*20)

In [None]:
"""在url中传递参数，get方法，使用键值对"""
payload = {'key1':'value1','毕业院校':'北航'}
r = requests.get('http://httpbin.org/get',params = payload)
print(r.content)
# you can see that the URL has been correctly encoded by printing the URL:
print(r.url)

# You can pass a list of items as a value:
payload = {'key1':'value1','key2':['value2','value3']}
r = requests.get('http://httpbin.org/get',params = payload)
print(r.url)
print('--'*20)
payload = {'wd':'北航'}
r = requests.get('http://www.baidu.com/s?',params = payload)
print(r.text)

In [None]:
"""响应内容的获取"""
import requests
r = requests.get('https://api.github.com/events')
print(r.text)
print(r.encoding)
r.encoding = 'ISO-8859-1'
print(r.text)
print(r.encoding)

In [None]:
"""二进制形式的响应"""
#例如，根据响应内容，生成图片
from PIL import Image
from io import BytesIO
import requests
jpgurl = 'https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1538158176072&di=7b3823e700e7f0f7358a3147f97d1958&imgtype=0&src=http%3A%2F%2Fimgsrc.baidu.com%2Fimgad%2Fpic%2Fitem%2F10dfa9ec8a1363277999f1ad9b8fa0ec08fac733.jpg'
r = requests.get(jpgurl)
#print(r.content)
i = Image.open(BytesIO(r.content))
i.save('./123.jpg')

In [None]:
import requests
r = requests.get('https://api.github.com/events')
#print(r.content)
#if r.status_code == 200:
    #if not r.raise_for_status():
r.json()

In [None]:
"""获得原始socket响应内容"""
import requests

r = requests.get('https://api.github.com/events',stream = True)
#尝试输出
#print(r.raw)
#print(r.raw.read(10))

#尝试输出到文件
#iter_content会帮你处理原始数据，它会自动化的解码gzip和deflate传输编码。
#raw属性是原始字节流，不能传输响应内容，如果你真的需要访问返回的字节流，就可以用raw。
#在下载流文件时，下面的方法是推荐的。chunk的大小可以自由设定，这视你的buffer大小。

filename = 'rawsocket.bin'
with open(filename,'wb') as fd:
    for chunk in r.iter_content(chunk_size=128):
        fd.write(chunk)

In [None]:
import requests

requests.__file__