# requests库介绍

1. `requests` 库简介

`requests` 是一个简洁而强大的 Python HTTP 库，它让发送 HTTP 请求变得非常简单。相比 Python 内置的 `urllib` 库，`requests` 更加人性化，易于使用。它被誉为“人类友好的 HTTP 库”。

2. 安装 `requests`

在开始之前，你需要先安装 `requests` 库。使用 pip 可以轻松安装：

```bash
pip install requests
```

3. 发送请求

`requests` 库提供了多种方法来发送不同类型的 HTTP 请求，最常用的包括：

*   `requests.get()`：发送 GET 请求，用于获取资源。
*   `requests.post()`：发送 POST 请求，用于提交数据。

以下是一些基本示例：

3.1 GET 请求


In [17]:
import requests

url = 'https://data.stats.gov.cn/easyquery.htm'

# 发送 GET 请求
response = requests.get(url)

# 检查响应状态码
print(response.status_code)  # 200 表示成功

200


In [18]:
# 获取响应内容
print(response.text)        # 以文本形式返回响应内容








<!doctype html>
<html>
<head>
<meta charset="utf-8">






<script id="allmobilize" charset="utf-8" src="http://a.yunshipei.com/3cf4bf099041a90552a48c9d178339b6/allmobilize.min.js"></script>
<meta http-equiv="Cache-Control" content="no-siteapp" />
<meta name="format-detection" content="telephone=no,email=no,address=no">
<link rel="alternate" media="handheld" href="#" />

<link rel="shortcut icon" href="/images/favourite.ico">
<link rel="stylesheet" type="text/css" href="/css/base.css">
<link rel="stylesheet" type="text/css" href="/css/main.css">
<!--高级查询样式--> 
<link rel="stylesheet" type="text/css" href="/css/high.css">
<link rel="stylesheet" type="text/css" href="/js/nav/nav.css">
<!--树控件样式-->
<link rel="stylesheet" type="text/css" href="/js/ztree/zTreeStyle/zTreeStyle.css"/>
<!--弹窗样式-->
<link rel="stylesheet" type="text/css" href="/js/tips/css/tips.css" />
<!--下拉样式-->
<link rel="stylesheet" type="text/css" href="/js/dropList/css/dropList.css" />

<script type="text/javascript"

In [19]:
print(response.content)     # 以字节流形式返回响应内容

b'\r\n\r\n\r\n\r\n\r\n\r\n\r\n<!doctype html>\r\n<html>\r\n<head>\r\n<meta charset="utf-8">\r\n\r\n\r\n\r\n\r\n\r\n\r\n<script id="allmobilize" charset="utf-8" src="http://a.yunshipei.com/3cf4bf099041a90552a48c9d178339b6/allmobilize.min.js"></script>\r\n<meta http-equiv="Cache-Control" content="no-siteapp" />\r\n<meta name="format-detection" content="telephone=no,email=no,address=no">\r\n<link rel="alternate" media="handheld" href="#" />\r\n\r\n<link rel="shortcut icon" href="/images/favourite.ico">\r\n<link rel="stylesheet" type="text/css" href="/css/base.css">\r\n<link rel="stylesheet" type="text/css" href="/css/main.css">\r\n<!--\xe9\xab\x98\xe7\xba\xa7\xe6\x9f\xa5\xe8\xaf\xa2\xe6\xa0\xb7\xe5\xbc\x8f--> \r\n<link rel="stylesheet" type="text/css" href="/css/high.css">\r\n<link rel="stylesheet" type="text/css" href="/js/nav/nav.css">\r\n<!--\xe6\xa0\x91\xe6\x8e\xa7\xe4\xbb\xb6\xe6\xa0\xb7\xe5\xbc\x8f-->\r\n<link rel="stylesheet" type="text/css" href="/js/ztree/zTreeStyle/zTreeStyle.cs

In [20]:
# 获取响应头
print(response.headers)

{'Date': 'Thu, 19 Dec 2024 10:45:10 GMT', 'Content-Type': 'text/html; charset=utf-8', 'Transfer-Encoding': 'chunked', 'Connection': 'keep-alive', 'Set-Cookie': 'wzws_sessionid=gTM5MmIxMKBnY/k2gmZjNWVlMYAxMTcuMTQzLjEyNy4xMjg=; Path=/; HttpOnly, JSESSIONID=SPTehLiuzyaFa5-2CjgSw1vI1t26bXFm_VD6MVoNpZjyrSO8oTD2!-272712535; path=/; HttpOnly, u=1; HttpOnly', 'X-ORACLE-DMS-ECID': '7d9910b6-c6ac-4068-8fe2-c2a930d9d8a3-000caa47', 'X-Frame-Options': 'SAMEORIGIN', 'X-ORACLE-DMS-RID': '0', 'Content-Language': 'zh-CN', 'WZWS-RAY': '1129-1734633915.241-w-waf01yzm-w-waf06yzm'}


In [21]:
# 获取 URL
print(response.url)

https://data.stats.gov.cn/easyquery.htm


**3.2 带参数的 GET 请求**

可以通过 `params` 参数传递 URL 参数：


In [14]:
import requests

params = {'cn': 'C01'}
response = requests.get(url, params=params)
print(response.url) # 输出：https://httpbin.org/get?key1=value1&key2=value2
print(response.status_code)

https://data.stats.gov.cn/easyquery.htm?cn=C01
200


**3.3 POST 请求**

可以通过 `data` 参数传递请求体数据：

In [None]:
import requests

data = {'key1': 'value1', 'key2': 'value2'}
response = requests.post('https://httpbin.org/post', data=data)
print(response.text)
print(response.json())

如果需要发送 JSON 数据，可以使用 `json` 参数：

In [None]:
import requests
import json

data = {'key1': 'value1', 'key2': 'value2'}
response = requests.post('https://httpbin.org/post', json=data)
print(response.json())

# 也可以先将字典转换为json字符串，再通过data参数传递
json_data = json.dumps(data)
response = requests.post('https://httpbin.org/post', data=json_data)
print(response.json())

如果需要发送文件，可以使用file参数：

In [None]:
import requests
import json

datafile = {'file': open('./example.pdf')}
response = requests.post('https://httpbin.org/post', files=datafile)
print(response.json())

4. 响应对象

`requests` 返回的 `response` 对象包含了服务器的响应信息，常用的属性包括：

*   `response.status_code`：HTTP 状态码（例如：200, 404, 500）。
*   `response.text`：以文本形式返回响应内容（会自动解码）。
*   `response.content`：以字节流形式返回响应内容。
*   `response.headers`：响应头信息。
*   `response.json()`：将 JSON 格式的响应内容解析为 Python 字典。
*   `response.url`：请求的 URL。
*   `response.encoding`：响应的编码方式，可以手动修改：`response.encoding = 'utf-8'`

5. 其他常用功能

*   **超时设置：**使用 `timeout` 参数设置请求超时时间（单位：秒）。

    ```python
    response = requests.get('https://www.example.com', timeout=5)
    ```

*   **处理 Cookie：** `requests` 会自动处理 Cookie。

*   **会话（Session）：**使用 `Session` 对象可以保持会话状态，例如保持登录状态。

    ```python
    session = requests.Session()
    session.get('https://httpbin.org/cookies/set/sessioncookie/123456789')
    response = session.get('https://httpbin.org/cookies')
    print(response.text)
    ```

*   **代理：**使用 `proxies` 参数设置代理。

    ```python
    proxies = {
        'http': 'http://10.10.1.10:3128',
        'https': 'http://10.10.1.10:1080',
    }
    response = requests.get('https://www.example.com', proxies=proxies)
    ```

**6. 异常处理**

在发送请求时，可能会遇到各种异常，例如网络错误、超时等。可以使用 `try...except` 语句来处理异常：

```python
import requests
from requests.exceptions import RequestException

try:
    response = requests.get('https://www.example.com', timeout=5)
    response.raise_for_status()  # 检查状态码，如果不是 2xx 则抛出异常
    print(response.text)
except RequestException as e:
    print(f"发生错误：{e}")
```

`response.raise_for_status()` 方法会在状态码不是 2xx 的情况下抛出 `HTTPError` 异常，方便进行错误处理。

