## **Python `requests` 库详解**

### **课程目标**

- 学习如何使用 `requests` 库发送 HTTP 请求
- 理解 GET 和 POST 请求的区别
- 学习如何处理响应数据
- 学会发送带参数的请求、文件上传和处理异常

---

### **1. `requests` 库简介**

- `requests` 是一个用于简化 HTTP 请求的 Python 库，使发送网络请求更容易。

- 安装：

  ```bash
  pip install requests
  ```

### **2. HTTP 协议简介**

- HTTP 是一种用于通信的协议。常见的请求方法包括：
  - **GET**：获取资源
  - **POST**：向服务器提交数据
  - **PUT**：更新资源
  - **DELETE**：删除资源

---

### **3. GET 请求**

GET 请求用于从服务器获取数据。`httpbin` 提供了测试 GET 请求的接口。

#### 示例代码：

In [9]:
import requests

# 向 httpbin 发送 GET 请求
response = requests.get('https://httpbin.org/get')

# 打印状态码，状态码为 200 表示请求成功
print(f'状态码: {response.status_code}')

# 打印响应内容（文本格式）
print(f'响应内容: {response.text}')

# 如果服务器返回 JSON，可以使用 .json() 解析为字典
data = response.json()
print(f'解析后的 JSON 数据: {data}')


状态码: 200
响应内容: {
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate, br, zstd", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.32.3", 
    "X-Amzn-Trace-Id": "Root=1-68649048-214511760b3a2db537e5cf52"
  }, 
  "origin": "106.251.226.162", 
  "url": "https://httpbin.org/get"
}

解析后的 JSON 数据: {'args': {}, 'headers': {'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate, br, zstd', 'Host': 'httpbin.org', 'User-Agent': 'python-requests/2.32.3', 'X-Amzn-Trace-Id': 'Root=1-68649048-214511760b3a2db537e5cf52'}, 'origin': '106.251.226.162', 'url': 'https://httpbin.org/get'}


#### 讲解：

1. `requests.get()` 用于发送 GET 请求。
2. `response.status_code` 是服务器返回的状态码，200 表示成功。
3. `response.text` 是服务器返回的响应内容，通常是字符串。
4. 如果响应内容是 JSON 格式，`response.json()` 可以将其解析为 Python 字典。

---

### **4. GET 请求带参数**

有时候需要通过 URL 参数向服务器传递信息。这时我们可以使用 `params` 参数来传递查询参数。

#### 示例代码：

In [11]:
import requests

# 构建查询参数
params = {
    'name': 'Alice',
    'age': 25
}

# 发送带参数的 GET 请求
response = requests.get('https://httpbin.org/get', params=params)

# 打印请求的 URL，包含了查询参数
print(f'请求的 URL: {response.url}')

# 打印返回的响应内容
print(f'响应内容: {response.text}')


请求的 URL: https://httpbin.org/get?name=Alice&age=25
响应内容: {
  "args": {
    "age": "25", 
    "name": "Alice"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate, br, zstd", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.32.3", 
    "X-Amzn-Trace-Id": "Root=1-686495bd-0b77fe545823a12f527d92b3"
  }, 
  "origin": "106.251.226.162", 
  "url": "https://httpbin.org/get?name=Alice&age=25"
}



#### 讲解：

1. 使用 `params` 参数将查询字符串附加到 URL 中，例如：`?name=Alice&age=25`。
2. `response.url` 可以查看包含查询参数的完整 URL。
3. `httpbin.org/get` 会返回服务器接收到的所有参数，便于测试。

---

### **5. POST 请求**

POST 请求用于向服务器提交数据。`httpbin` 提供了一个 `post` 接口用于测试。

#### 示例代码：

In [12]:
import requests

# 要发送的数据
data = {
    'username': 'test_user1',
    'password': 'test_pass1'
}

# 发送 POST 请求
response = requests.post('https://httpbin.org/post', data=data)

# 打印状态码
print(f'状态码: {response.status_code}')

# 打印返回的 JSON 响应
print(f'响应内容: {response.json()}')


状态码: 200
响应内容: {'args': {}, 'data': '', 'files': {}, 'form': {'password': 'test_pass1', 'username': 'test_user1'}, 'headers': {'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate, br, zstd', 'Content-Length': '39', 'Content-Type': 'application/x-www-form-urlencoded', 'Host': 'httpbin.org', 'User-Agent': 'python-requests/2.32.3', 'X-Amzn-Trace-Id': 'Root=1-68649645-152b699431d58e7f296cf3fb'}, 'json': None, 'origin': '106.251.226.162', 'url': 'https://httpbin.org/post'}


#### 讲解：

1. `requests.post()` 用于发送 POST 请求，提交的数据通过 `data` 参数传递。
2. `httpbin.org/post` 会返回服务器接收到的 POST 数据，便于调试。
3. 服务器返回的响应通常为 JSON，使用 `.json()` 方法解析。

---

### **6. 上传文件**

可以使用 `requests` 发送文件数据，例如上传文件到服务器。

#### 示例代码

In [13]:
import requests

# 要上传的文件
files = {
    'file': open('example.txt', 'rb')
}

# 发送文件上传请求
response = requests.post('https://httpbin.org/post', files=files)

# 打印返回的响应内容
print(f'响应内容: {response.json()}')


响应内容: {'args': {}, 'data': '', 'files': {'file': 'dddddddddddd'}, 'form': {}, 'headers': {'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate, br, zstd', 'Content-Length': '159', 'Content-Type': 'multipart/form-data; boundary=9383b9541c09f06f5936dbd727d67ae7', 'Host': 'httpbin.org', 'User-Agent': 'python-requests/2.32.3', 'X-Amzn-Trace-Id': 'Root=1-68649681-0a75ff085c410c323e7a5514'}, 'json': None, 'origin': '106.251.226.162', 'url': 'https://httpbin.org/post'}


#### 讲解：

1. `files` 参数用于上传文件，文件需要以二进制模式打开（`rb`）。
2. `httpbin.org/post` 会返回服务器接收到的文件信息。

---

### **7. 自定义请求头**

有时需要在请求中添加自定义的 HTTP 头，比如 `User-Agent` 或 `Authorization`。

#### 示例代码：

In [15]:
import requests

# 自定义 HTTP 头
headers = {
    'User-Agent': 'my-app/1.0dddddddd'
}

# 发送带自定义头的 GET 请求
response = requests.get('https://httpbin.org/get', headers=headers)

# 打印返回的响应内容
print(f'响应内容: {response.text}')


响应内容: {
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate, br, zstd", 
    "Host": "httpbin.org", 
    "User-Agent": "my-app/1.0dddddddd", 
    "X-Amzn-Trace-Id": "Root=1-686496f8-0d1e791c35bd9ee52a83b6a7"
  }, 
  "origin": "106.251.226.162", 
  "url": "https://httpbin.org/get"
}



#### 讲解：

1. `headers` 参数用于添加自定义 HTTP 头。
2. 常见的头包括 `User-Agent`（标识客户端）和 `Authorization`（身份认证）。

---

### **8. 处理异常**

在网络请求中，可能会出现连接失败、超时等问题。可以通过捕获异常进行处理。

#### 示例代码：

In [17]:
import requests

try:
    # 设置超时时间为 5 秒
    response = requests.get('https://httpbin.org/delay/10', timeout=12)
    print(f'状态码: {response.status_code}')
except requests.Timeout:
    print('请求超时')
except requests.RequestException as e:
    print(f'请求失败: {e}')


状态码: 200


#### 讲解：

1. `timeout` 参数用于设置请求超时时间。
2. 使用 `try-except` 块捕获异常，例如 `requests.Timeout` 处理超时异常，`requests.RequestException` 处理所有请求相关的异常。

---

### **9. 会话与 Cookie**

`requests.Session` 对象允许你跨多个请求保持某些参数（例如 Cookie）。

#### 示例代码：

In [18]:
import requests

# 创建一个会话对象
session = requests.Session()

# 发送请求，设置 Cookie
session.get('https://httpbin.org/cookies/set/sessioncookie/123456789')

# 发送另一个请求，查看 Cookie
response = session.get('https://httpbin.org/cookies')

# 打印返回的响应内容，查看 Cookie 是否被保留
print(f'响应内容: {response.text}')


响应内容: {
  "cookies": {
    "sessioncookie": "123456789"
  }
}



 `requests` 库get请求实例

In [21]:
import requests

# 设置请求的 URL
url = "https://movie.douban.com/top250"

# 定义请求头，模拟浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}

# 发送 GET 请求
response = requests.get(url, headers=headers)
# response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
    # 将网页内容保存到本地文件
    with open("douban_top250.html", "w", encoding='utf-8') as file:
        file.write(response.text)
    print("网页保存成功!")
else:
    print(f"请求失败，状态码: {response.status_code}")


网页保存成功!


### 代码解释：

1. **请求页面**：使用 `requests.get` 向目标 URL 发送 HTTP GET 请求。我们通过设置 `headers` 来模仿浏览器请求，避免被服务器拒绝（有些服务器会限制非浏览器请求）。

2. **检查响应状态码**：通过 `response.status_code` 检查请求是否成功，通常状态码为 200 表示成功。

3. **保存网页内容**：如果请求成功，我们将通过 `response.text` 获取网页的 HTML 内容，并将其保存到本地文件 `douban_top250.html` 中。使用 `open()` 函数创建文件，并通过 `file.write()` 将内容写入文件。

4. **处理错误**：如果请求失败（例如网络问题或服务器错误），程序会打印状态码，方便调试。

http://localhost:8000/login.html 作为我们服务器网站

In [22]:
import requests

# 创建会话对象，保持会话
session = requests.Session()

# 定义登录页面和登录后页面的URL
login_url = 'http://127.0.0.1:5000/login'
home_url = 'http://127.0.0.1:5000/'

# 定义登录表单数据
login_data = {
    'username': 'zzu',  # 用户名
    'password': '123456'  # 密码
}

# 第一步：获取登录页面
response = session.get(home_url)

# 检查登录页面请求是否成功
if response.status_code == 200:
    print("成功访问登录页面")

    # 第二步：发送 POST 请求，提交登录表单
    login_response = session.post(login_url, data=login_data)

    # 检查是否登录成功
    if login_response.status_code == 200:
        print("登录成功")

        # 第三步：保存登录后的页面
        with open('logged_in_page.html', 'w', encoding='utf-8') as file:
            file.write(login_response.text)

        print("登录后的页面已保存为 'logged_in_page.html'")
    else:
        print(f"登录失败，状态码: {login_response.status_code}")
else:
    print(f"无法访问登录页面，状态码: {response.status_code}")


成功访问登录页面
登录成功
登录后的页面已保存为 'logged_in_page.html'


#### 1. 什么是 API？

API（**应用程序编程接口**）是一种让两个程序通过网络互相通信的工具。它规定了你可以如何向服务器请求数据，服务器如何给你响应。

- **通俗理解**：API 就像一家餐馆里的服务员。你告诉服务员你想吃什么（发送请求），服务员会按照你的要求把菜送到你面前（返回响应）。
- **请求**：你需要遵循 API 规定的格式告诉服务器你需要什么数据。
- **响应**：服务器会按照定义好的格式把你想要的数据返回给你。

#### 2. 为什么 API 很重要？

API 提供了一种快速、可靠的方式获取结构化的数据。比如，如果你想获取股票价格、天气预报、或地图信息，API 会比从网页上手动抓取信息（爬虫）更方便。

#### 3. API 是如何工作的？

- **客户端发送请求**：你按照 API 的规定格式发送请求（比如一个网址），带上必要的参数（像城市代码或股票代码）。
- **服务器返回响应**：API 服务器处理请求并返回数据，这些数据一般是结构化的，比如 JSON 格式。

  - **请求**：客户端发送请求，说明想要什么数据。
  - **响应**：服务器返回指定格式的响应，包含客户端想要的数据。

#### 4. API 和爬虫有什么区别？

- **API**：API 是按照规定格式直接请求数据，服务器会给你整理好、格式化的数据。API 的数据通常是经过优化，响应更快、数据结构清晰。
- **爬虫**：爬虫是通过抓取网页 HTML 代码并解析其中的数据。这种方式虽然可以获取数据，但数据格式杂乱，可能需要手动提取和清理。

#### 5. 为什么大部分 API 是收费的？

服务器提供 API 服务通常是收费的，因为：

- **服务器资源成本**：API 提供的服务通常需要大量的计算和存储资源。
- **数据整理成本**：API 提供的是已经整理好、结构化的数据，节省了你自己从网页抓取和整理数据的时间。
- **服务质量**：收费的 API 通常提供更高的可靠性、稳定性和技术支持。

#### 6. 实际例子：天气 API

假设我们要获取郑州市的天气数据。API 提供了一个接口，你只需要提供郑州市的城市代码，API 就会给你返回该城市的天气数据。

##### 请求格式：

```
http://t.weather.itboy.net/api/weather/city/101180101
```

- **请求内容**：城市代码（如：101180101 为郑州的城市代码）。
- **响应内容**：包含该城市的当前温度、湿度、空气质量、未来天气等。

##### Python 示例代码：

In [23]:
import requests

def fetch_weather_data(city_code):
    url = f"http://t.weather.itboy.net/api/weather/city/{city_code}"
    response = requests.get(url)
    if response.status_code == 200:
        return response.json()
    else:
        return None

# 获取郑州天气信息
city_code = '101180101'
weather_data = fetch_weather_data(city_code)
print(weather_data)

{'message': 'success感谢又拍云(upyun.com)提供CDN赞助', 'status': 200, 'date': '20250702', 'time': '2025-07-02 09:51:48', 'cityInfo': {'city': '郑州市', 'citykey': '101180101', 'parent': '河南', 'updateTime': '06:30'}, 'data': {'shidu': '88%', 'pm25': 9.0, 'pm10': 15.0, 'quality': '优', 'wendu': '28.8', 'ganmao': '各类人群可自由活动', 'forecast': [{'date': '02', 'high': '高温 37℃', 'low': '低温 27℃', 'ymd': '2025-07-02', 'week': '星期三', 'sunrise': '05:16', 'sunset': '19:42', 'aqi': 25, 'fx': '南风', 'fl': '4级', 'type': '多云', 'notice': '阴晴之间，谨防紫外线侵扰'}, {'date': '03', 'high': '高温 39℃', 'low': '低温 29℃', 'ymd': '2025-07-03', 'week': '星期四', 'sunrise': '05:16', 'sunset': '19:42', 'aqi': 30, 'fx': '西南风', 'fl': '3级', 'type': '多云', 'notice': '阴晴之间，谨防紫外线侵扰'}, {'date': '04', 'high': '高温 40℃', 'low': '低温 30℃', 'ymd': '2025-07-04', 'week': '星期五', 'sunrise': '05:17', 'sunset': '19:42', 'aqi': 32, 'fx': '西南风', 'fl': '3级', 'type': '多云', 'notice': '阴晴之间，谨防紫外线侵扰'}, {'date': '05', 'high': '高温 41℃', 'low': '低温 31℃', 'ymd': '2025-07-05',

练习题目：通过 API 获取天气预报数据 目的： 本次练习的目标是帮助学生熟悉如何使用 Python 中的 requests 库与 API 进行交互，学习解析 JSON 格式的数据，并将提取出的信息以结构化的方式展示给用户。

要求： 编写一个 Python 脚本，通过访问天气预报 API 来获取指定城市的天气数据。学生可以使用 中国天气网 提供的不同城市代码来查询对应城市的天气情况。

代码中需要完成以下功能：

向 http://t.weather.itboy.net/api/weather/city/{city_code} 发送 GET 请求，其中 {city_code} 为城市代码。 提取并展示以下信息： 当前城市及其天气更新时间。 当前的温度、湿度、空气质量、感冒提醒等。 未来几天的天气预报，包括日期、天气类型（如晴、阴、雨等）、温度范围、风向、空气质量指数、以及其他天气提醒。 昨天的天气情况，类似未来几天的预报内容。 程序中需要处理网络请求失败或无法获取天气数据的情况，给用户输出友好的提示信息。

学生可以从 中国天气网 https://www.weather.com.cn/weather1d/101180101.shtml中选择不同城市的代码，替换示例代码中的 city_code 参数，查看其他城市的天气情况。常见城市的代码可以通过查看网页地址中的数字获取，如：

北京：101010100 上海：101020100 广州：101280101 郑州：101180101 代码示例： 可以参考如下 Python 代码示例，并根据需求进行修改：

In [25]:
import requests

def fetch_weather_data(city_code):
    url = f"http://t.weather.itboy.net/api/weather/city/{city_code}"
    try:
        response = requests.get(url)
        if response.status_code != 200:
            raise Exception(f"HTTP error! status: {response.status_code}")
        return response.json()
    except Exception as error:
        print('Could not fetch weather data:', error)
        return None

def print_weather_forecast(city_code):
    weather_data = fetch_weather_data(city_code)
    if not weather_data:
        print("No weather data available.")
        return

    city_info = weather_data['cityInfo']
    city = city_info['city']
    print(f"天气预报城市：{city}\n更新时间：{city_info['updateTime']}")

    data = weather_data['data']
    print(f"当前温度：{data['wendu']}℃，湿度：{data['shidu']}，空气质量：{data['quality']}。{data['ganmao']}\n")

    forecast = data['forecast']
    print("未来几天的天气预报：")
    for day in forecast:
        print(f"{day['date']}日({day['week']}), {day['ymd']}")
        print(f"    {day['type']}, {day['low']}到{day['high']}, 风向：{day['fx']} {day['fl']}, 空气质量指数：{day['aqi']}")
        print(f"    {day['notice']}\n")

    yesterday = data['yesterday']
    print("昨日天气：")
    print(f"{yesterday['date']}日({yesterday['week']}), {yesterday['ymd']}")
    print(f"    {yesterday['type']}, {yesterday['low']}到{yesterday['high']}, 风向：{yesterday['fx']} {yesterday['fl']}, 空气质量指数：{yesterday['aqi']}")
    print(f"    {yesterday['notice']}\n")

if __name__ == '__main__':
    city_code = '101010100'  # 示例：郑州市的城市代码
    print_weather_forecast(city_code)


天气预报城市：北京市
更新时间：09:40
当前温度：33.5℃，湿度：87%，空气质量：良。极少数敏感人群应减少户外活动

未来几天的天气预报：
02日(星期三), 2025-07-02
    阴, 低温 25℃到高温 29℃, 风向：东南风 2级, 空气质量指数：52
    不要被阴云遮挡住好心情

03日(星期四), 2025-07-03
    小雨, 低温 24℃到高温 29℃, 风向：东北风 2级, 空气质量指数：40
    雨虽小，注意保暖别感冒

04日(星期五), 2025-07-04
    多云, 低温 26℃到高温 40℃, 风向：西北风 2级, 空气质量指数：59
    阴晴之间，谨防紫外线侵扰

05日(星期六), 2025-07-05
    小雨, 低温 27℃到高温 40℃, 风向：西北风 2级, 空气质量指数：35
    雨虽小，注意保暖别感冒

06日(星期日), 2025-07-06
    多云, 低温 28℃到高温 39℃, 风向：东南风 2级, 空气质量指数：55
    阴晴之间，谨防紫外线侵扰

07日(星期一), 2025-07-07
    阴, 低温 26℃到高温 36℃, 风向：东南风 1级, 空气质量指数：54
    不要被阴云遮挡住好心情

08日(星期二), 2025-07-08
    中雨, 低温 25℃到高温 27℃, 风向：东南风 2级, 空气质量指数：45
    记得随身携带雨伞哦

09日(星期三), 2025-07-09
    小雨, 低温 25℃到高温 26℃, 风向：东北风 1级, 空气质量指数：51
    雨虽小，注意保暖别感冒

10日(星期四), 2025-07-10
    阴, 低温 24℃到高温 30℃, 风向：东北风 1级, 空气质量指数：46
    不要被阴云遮挡住好心情

11日(星期五), 2025-07-11
    小雨, 低温 24℃到高温 28℃, 风向：东北风 1级, 空气质量指数：59
    雨虽小，注意保暖别感冒

12日(星期六), 2025-07-12
    小雨, 低温 25℃到高温 33℃, 风向：南风 1级, 空气质量指数：43
    雨虽小，注意保暖别感冒

13日(星期日), 2025-07-13
    小雨,

理解 API 请求与响应的基本流程。
选一个免费 API（例如天气 API 或股票 API），编写 Python 程序，获取并展示你想要的特定数据。
示例：选择一个城市，通过天气 API 获取该城市的天气信息，并在控制台展示温度、湿度等数据。
思考 API 的优势：为什么用 API 比直接从网页抓取数据（爬虫）更有效？

https://www.juhe.cn/ 一个api集合