# Web开发基础知识学习路线

## 📚 学习目标
在进入Web框架学习之前，掌握以下核心概念：

### 🎯 核心知识点
1. **HTTP协议基础** - 理解Web通信的基础
2. **RESTful API设计** - 现代API设计规范
3. **JSON数据处理** - 数据交换格式
4. **requests库使用** - Python HTTP客户端
5. **API测试工具** - Postman使用技巧
6. **Web安全基础** - 认证授权概念
7. **错误处理与日志** - 生产级代码规范

### 🛠️ 实践项目
- 构建简单的API客户端
- 实现完整的CRUD操作
- 集成第三方API服务
- 搭建API测试套件

---

## 📖 学习路径
按照以下顺序逐步学习，每个章节都包含理论知识和实践代码。


# 第一章：HTTP协议基础

## 1.1 什么是HTTP？

HTTP（HyperText Transfer Protocol）是超文本传输协议，是Web的基础。它定义了客户端和服务器之间的通信规则。

### 核心概念：
- **客户端-服务器模型**：浏览器（客户端）向服务器发送请求，服务器返回响应
- **无状态协议**：每个请求都是独立的，服务器不会记住之前的请求
- **基于TCP/IP**：HTTP运行在TCP/IP协议之上

## 1.2 HTTP请求结构

一个HTTP请求包含：
1. **请求行**：方法 + URL + 协议版本
2. **请求头**：包含客户端信息
3. **空行**：分隔头部和正文
4. **请求正文**：POST/PUT等方法的数据

```
GET /api/users HTTP/1.1     → 请求行
Host: api.example.com       → 请求头
User-Agent: Mozilla/5.0     → 请求头
Accept: application/json    → 请求头

以上是get请求，通常没有请求正文

```

## 1.3 HTTP响应结构

一个HTTP响应包含：
1. **状态行**：协议版本 + 状态码 + 状态文本
2. **响应头**：包含服务器信息
3. **空行**：分隔头部和正文  
4. **响应正文**：实际的数据内容

```
HTTP/1.1 200 OK                     → 状态行（协议版本+状态码+状态文本）
Content-Type: application/json      → 响应头
Content-Length: 123                 → 响应头
                                空行 → 分隔符
{"message": "success"}              → 响应正文
```


## 1.4 HTTP方法详解

| 方法 | 用途 | 是否幂等 | 是否安全 |
|------|------|----------|----------|
| GET | 获取资源 | ✅ | ✅ |
| POST | 创建资源 | ❌ | ❌ |
| PUT | 更新/创建资源 | ✅ | ❌ |
| DELETE | 删除资源 | ✅ | ❌ |
| PATCH | 部分更新资源 | ❌ | ❌ |
| HEAD | 获取响应头 | ✅ | ✅ |
| OPTIONS | 获取支持的方法 | ✅ | ✅ |

为什么创建资源要用"POST"这个单词？
- "POST"这个词来源于邮政系统的"投递/发布"含义 - 就像你把信件投递到邮箱一样，POST请求是把新数据"投递/发布"到服务器上。这个类比使其含义直观易懂。

PUT和POST都可以创建资源，二者有什么不同？
- [点击查看](./知识点/put_vs_post_demo.ipynb)

### 关键概念：
- **幂等性**：多次执行相同操作，结果相同
- **安全性**：不会改变服务器状态

## 1.5 HTTP状态码

### 1xx - 信息性状态码
- `100 Continue` - POST/PUT请求 | 大文件上传时，服务器告知客户端继续发送请求体
### 2xx - 成功状态码
- `200 OK` - GET请求 | 获取数据成功，POST/PUT/PATCH | 更新成功但返回数据
- `201 Created` - POST请求 | 创建新资源成功（但不返回数据），PUT请求 | 首次创建资源成功
    - 为什么这里的put要说“首次创建资源成功”？而POST只是“创建新资源成功”
        - `这是为了强调PUT的幂等性特征。PUT请求在首次创建资源时返回201，而后续对同一资源的PUT请求（即使内容相同）应该返回200，因为这时是更新而非创建。相比之下，POST每次都是创建新资源，所以只要创建成功就返回201，不需要区分首次与否。`
- `204 No Content` - DELETE请求 | 删除成功，PUT/PATCH请求 | 更新成功但无返回内容
### 3xx - 重定向状态码
- `301 Moved Permanently` - GET请求 | 网站改版、域名变更，搜索引擎索引更新
- `302 Found` - GET请求 | 临时跳转、登录后重定向、A/B测试
- `304 Not Modified` - GET请求 | 浏览器缓存生效，资源未修改时返回
### 4xx - 客户端错误
- `400 Bad Request` - 所有请求 | JSON格式错误、参数缺失、数据类型错误
- `401 Unauthorized` - 所有需要认证的请求 | 未提供Token、Token过期、登录失效
- `403 Forbidden` - 所有请求 | 权限不足、IP被封禁、资源访问被拒绝
- `404 Not Found` - GET请求 | 页面不存在，POST/PUT/DELETE | 资源ID不存在
- `422 Unprocessable Entity` - POST/PUT/PATCH请求 | 数据验证失败、业务逻辑错误
### 5xx - 服务器错误
- `500 Internal Server Error` - 所有请求 | 代码异常、数据库连接失败、未处理的错误
- `502 Bad Gateway` - 所有请求 | Nginx/Apache代理后端服务失败、负载均衡器错误
- `503 Service Unavailable` - 所有请求 | 服务器维护、过载保护、数据库不可用


In [1]:
# 1.6 实践：理解HTTP基础
# 让我们先安装必要的库
import requests
import json
from urllib.parse import urlparse, parse_qs
from typing import Dict, Any
import logging

# 配置日志（生产级习惯）
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)
logger = logging.getLogger(__name__)

# 示例1：解析URL结构
def analyze_url(url: str) -> Dict[str, Any]:
    """
    分析URL的各个组成部分
    
    Args:
        url: 要分析的URL
        
    Returns:
        包含URL各部分的字典
    """
    parsed = urlparse(url)
    
    result = {
        'scheme': parsed.scheme,      # 协议 (http/https)
        'netloc': parsed.netloc,      # 网络位置 (域名:端口)
        'path': parsed.path,          # 路径
        'params': parsed.params,      # 参数
        'query': parsed.query,        # 查询字符串
        'fragment': parsed.fragment,  # 片段标识符
        'query_params': parse_qs(parsed.query)  # 解析后的查询参数
    }
    
    return result

# 测试URL解析
test_url = "https://api.github.com/users/octocat?tab=repositories&sort=updated#profile"
url_parts = analyze_url(test_url)

print("=== URL结构分析 ===")
for key, value in url_parts.items():
    print(f"{key}: {value}")
    
logger.info(f"成功解析URL: {test_url}")


2025-06-13 17:00:52,285 - __main__ - INFO - 成功解析URL: https://api.github.com/users/octocat?tab=repositories&sort=updated#profile


=== URL结构分析 ===
scheme: https
netloc: api.github.com
path: /users/octocat
params: 
query: tab=repositories&sort=updated
fragment: profile
query_params: {'tab': ['repositories'], 'sort': ['updated']}


# 第二章：RESTful API设计原则

## 2.1 什么是REST？

REST（Representational State Transfer）是一种软件架构风格，定义了一组约束条件和原则。

### REST的核心原则：

1. **客户端-服务器架构**：分离关注点
2. **无状态**：每个请求包含所有必要信息
3. **可缓存**：响应可以被缓存
4. **统一接口**：标准化的接口设计
5. **分层系统**：架构可以分层
6. **按需代码**（可选）：服务器可以向客户端发送可执行代码

## 2.2 RESTful API设计规范

### 2.2.1 资源命名规范

- 使用名词而不是动词
- 使用复数形式
- 使用小写字母和连字符

```
✅ 正确示例：
GET /api/users          # 获取用户列表
GET /api/users/123      # 获取特定用户
POST /api/users         # 创建新用户
PUT /api/users/123      # 更新用户
DELETE /api/users/123   # 删除用户

❌ 错误示例：
GET /api/getUsers       # 不要在URL中使用动词
GET /api/user           # 应该使用复数
GET /api/Users          # 应该使用小写
```

### 2.2.2 HTTP方法与CRUD操作的对应关系

| HTTP方法 | CRUD操作 | 描述 | 示例 |
|----------|----------|------|------|
| GET | Read | 获取资源 | `GET /api/users` |
| POST | Create | 创建资源 | `POST /api/users` |
| PUT | Update | 完整更新资源 | `PUT /api/users/123` |
| PATCH | Update | 部分更新资源 | `PATCH /api/users/123` |
| DELETE | Delete | 删除资源 | `DELETE /api/users/123` |


In [2]:
# 2.3 实践：设计RESTful API响应格式

from typing import Optional, List, Union
from dataclasses import dataclass, asdict  #  dataclass装饰器会自动执行__init__，省去了自己手动赋值
from datetime import datetime
import json

@dataclass
class APIResponse:
    """标准化的API响应格式
    这是一个用于演示和学习目的的示例响应类。在实际的Web应用中，APIResponse通常会与真实的Web框架
    （如FastAPI、Flask或Django）集成，根据实际的请求处理结果来构建响应，而不是像示例中那样手动构造。
    """
    success: bool
    message: str
    data: Optional[Union[dict, list]] = None
    errors: Optional[List[str]] = None
    timestamp: Optional[str] = None
    
    def __post_init__(self):        # __post_init__会在__init__执行完后立即自动执行，这是dataclass的方法，不是python自带的魔术方法
        if self.timestamp is None:
            self.timestamp = datetime.now().isoformat()
    
    def to_dict(self) -> dict:
        """转换为字典格式"""
        return asdict(self)
    
    def to_json(self) -> str:
        """转换为JSON字符串"""
        return json.dumps(self.to_dict(), ensure_ascii=False, indent=2)

# 示例：不同场景的API响应
def demo_api_responses():
    """仅用于展示不同场景下API响应的标准格式。"""
    
    print("=== RESTful API响应格式示例 ===\n")
    
    # 1. 成功获取单个资源
    success_single = APIResponse(
        success=True,
        message="用户信息获取成功",
        data={
            "id": 1,
            "name": "张三",
            "email": "zhangsan@example.com",
            "created_at": "2024-01-01T10:00:00"
        }
    )
    print("1. 成功获取单个资源：")
    print(success_single.to_json())
    print()
    
    # 2. 成功获取资源列表
    success_list = APIResponse(
        success=True,
        message="用户列表获取成功",
        data={
            "users": [
                {"id": 1, "name": "张三", "email": "zhangsan@example.com"},
                {"id": 2, "name": "李四", "email": "lisi@example.com"}
            ],
            "pagination": {
                "current_page": 1,
                "per_page": 10,
                "total": 2,
                "total_pages": 1
            }
        }
    )
    print("2. 成功获取资源列表：")
    print(success_list.to_json())
    print()
    
    # 3. 创建资源成功
    create_success = APIResponse(
        success=True,
        message="用户创建成功",
        data={
            "id": 3,
            "name": "王五",
            "email": "wangwu@example.com",
            "created_at": "2024-01-15T14:30:00"
        }
    )
    print("3. 创建资源成功：")
    print(create_success.to_json())
    print()
    
    # 4. 客户端错误
    client_error = APIResponse(
        success=False,
        message="请求参数验证失败",
        errors=[
            "email字段不能为空",
            "密码长度至少6位"
        ]
    )
    print("4. 客户端错误：")
    print(client_error.to_json())
    print()
    
    # 5. 服务器错误
    server_error = APIResponse(
        success=False,
        message="服务器内部错误",
        errors=["数据库连接失败"]
    )
    print("5. 服务器错误：")
    print(server_error.to_json())

# 执行示例
demo_api_responses()


=== RESTful API响应格式示例 ===

1. 成功获取单个资源：
{
  "success": true,
  "message": "用户信息获取成功",
  "data": {
    "id": 1,
    "name": "张三",
    "email": "zhangsan@example.com",
    "created_at": "2024-01-01T10:00:00"
  },
  "errors": null,
  "timestamp": "2025-06-13T17:19:42.923728"
}

2. 成功获取资源列表：
{
  "success": true,
  "message": "用户列表获取成功",
  "data": {
    "users": [
      {
        "id": 1,
        "name": "张三",
        "email": "zhangsan@example.com"
      },
      {
        "id": 2,
        "name": "李四",
        "email": "lisi@example.com"
      }
    ],
    "pagination": {
      "current_page": 1,
      "per_page": 10,
      "total": 2,
      "total_pages": 1
    }
  },
  "errors": null,
  "timestamp": "2025-06-13T17:19:42.923776"
}

3. 创建资源成功：
{
  "success": true,
  "message": "用户创建成功",
  "data": {
    "id": 3,
    "name": "王五",
    "email": "wangwu@example.com",
    "created_at": "2024-01-15T14:30:00"
  },
  "errors": null,
  "timestamp": "2025-06-13T17:19:42.923863"
}

4. 客户端错误：
{
  "su

# 第三章：JSON数据处理

## 3.1 什么是JSON？

JSON（JavaScript Object Notation）是一种轻量级的数据交换格式。虽然名字包含JavaScript，但它是语言无关的标准格式。

### JSON的特点：
- **轻量级**：比XML更简洁
- **可读性强**：易于人类阅读和编写
- **广泛支持**：几乎所有编程语言都支持
- **Web友好**：是REST API的标准数据格式

## 3.2 JSON语法规则

### 数据类型：
- **字符串**：双引号包围 `"hello"`
- **数字**：整数或浮点数 `42`, `3.14`
- **布尔值**：`true` 或 `false`
- **null**：空值 `null`
- **对象**：键值对集合 `{"key": "value"}`
- **数组**：值的有序列表 `[1, 2, 3]`

### 语法规则：
- 数据以键值对形式存在
- 键必须是字符串，值可以是任意JSON数据类型
- 键值对之间用逗号分隔
- 对象用花括号 `{}` 包围
- 数组用方括号 `[]` 包围

```json
{
  "name": "张三",
  "age": 30,
  "married": true,
  "children": null,
  "hobbies": ["reading", "swimming"],
  "address": {
    "city": "北京",
    "zipcode": "100000"
  }
}
```


In [None]:
# 3.3 Python中的JSON处理

import json
from typing import Dict, List, Any, Optional
from datetime import datetime, date
from decimal import Decimal
import os

# 3.3.1 基础JSON操作
def basic_json_operations():
    """演示Python中的基础JSON操作"""
    
    print("=== Python JSON基础操作 ===\n")
    
    # 1. Python对象转JSON字符串 (序列化)
    python_data = {
        "name": "张三",
        "age": 30,
        "married": True,
        "children": None,
        "hobbies": ["reading", "swimming", "coding"],
        "address": {
            "city": "北京",
            "zipcode": "100000"
        }
    }
    
    # dumps(): 对象 -> JSON字符串
    json_string = json.dumps(python_data, ensure_ascii=False, indent=2)
    print("1. Python对象转JSON字符串：")
    print(json_string)
    print(type(json_string))  # <class 'str'>
    print()
    
    # 2. JSON字符串转Python对象 (反序列化)  
    # loads(): JSON字符串 -> 对象
    parsed_data = json.loads(json_string)
    print("2. JSON字符串转Python对象：")
    print(parsed_data)
    print(type(parsed_data))  # <class 'dict'>
    print()
    
    # 3. 文件操作
    filename = "sample_data.json"
    
    # dump(): 对象 -> JSON文件
    with open(filename, 'w', encoding='utf-8') as f:
        json.dump(python_data, f, ensure_ascii=False, indent=2)
    print(f"3. 数据已保存到文件: {filename}")
    
    # load(): JSON文件 -> 对象
    with open(filename, 'r', encoding='utf-8') as f:
        loaded_data = json.load(f)
    print("4. 从文件加载的数据：")
    print(loaded_data)
    
    # 清理文件
    os.remove(filename)
    print(f"清理临时文件: {filename}")

# 执行基础操作示例
basic_json_operations()


In [None]:
# 3.3.2 高级JSON处理技巧

class JSONProcessor:
    """专业级JSON处理类"""
    
    @staticmethod
    def safe_json_loads(json_str: str, default: Any = None) -> Any:
        """安全的JSON解析，带错误处理"""
        try:
            return json.loads(json_str)
        except json.JSONDecodeError as e:
            logger.error(f"JSON解析失败: {e}")
            return default
        except Exception as e:
            logger.error(f"未知错误: {e}")
            return default
    
    @staticmethod
    def safe_json_dumps(obj: Any, default: str = "null") -> str:
        """安全的JSON序列化，处理不可序列化对象"""
        try:
            return json.dumps(obj, ensure_ascii=False, indent=2, 
                            default=JSONProcessor._json_serializer)
        except Exception as e:
            logger.error(f"JSON序列化失败: {e}")
            return default
    
    @staticmethod
    def _json_serializer(obj: Any) -> Any:
        """自定义JSON序列化器，处理特殊类型"""
        if isinstance(obj, (datetime, date)):
            return obj.isoformat()
        elif isinstance(obj, Decimal):
            return float(obj)
        elif hasattr(obj, '__dict__'):
            return obj.__dict__
        else:
            return str(obj)

# 演示高级JSON处理
def advanced_json_demo():
    """演示高级JSON处理技巧"""
    
    print("=== 高级JSON处理技巧 ===\n")
    
    # 1. 处理包含特殊类型的数据
    complex_data = {
        "name": "测试用户",
        "created_at": datetime.now(),
        "birthday": date(1990, 1, 1),
        "balance": Decimal("999.99"),
        "metadata": {
            "last_login": datetime.now(),
            "preferences": ["dark_mode", "notifications"]
        }
    }
    
    print("1. 包含特殊类型的数据：")
    json_str = JSONProcessor.safe_json_dumps(complex_data)
    print(json_str)
    print()
    
    # 2. 处理错误的JSON
    invalid_json = '{"name": "test", "age": 30,}'  # 多余的逗号
    print("2. 处理无效JSON：")
    result = JSONProcessor.safe_json_loads(invalid_json, default={"error": "解析失败"})
    print(f"解析结果: {result}")
    print()
    
    # 3. 深度嵌套数据处理
    nested_data = {
        "level1": {
            "level2": {
                "level3": {
                    "data": "深度嵌套的数据",
                    "timestamp": datetime.now()
                }
            }
        }
    }
    
    print("3. 深度嵌套数据：")
    nested_json = JSONProcessor.safe_json_dumps(nested_data)
    print(nested_json)
    
    # 4. 提取嵌套数据的辅助函数
    def get_nested_value(data: dict, path: str, default: Any = None) -> Any:
        """
        从嵌套字典中安全获取值
        
        Args:
            data: 目标字典
            path: 点分隔的路径，如 'level1.level2.data'
            default: 默认值
            
        Returns:
            找到的值或默认值
        """
        keys = path.split('.')
        current = data
        
        try:
            for key in keys:
                current = current[key]
            return current
        except (KeyError, TypeError):
            return default
    
    parsed_nested = json.loads(nested_json)
    deep_value = get_nested_value(parsed_nested, 'level1.level2.level3.data')
    print(f"\n4. 提取深度嵌套值: {deep_value}")

# 执行高级示例
advanced_json_demo()


# 第四章：requests库详解

## 4.1 什么是requests库？

`requests` 是Python中最流行的HTTP客户端库，被誉为"为人类设计的HTTP库"。它简化了HTTP请求的发送过程。

### 为什么选择requests？
- **简单易用**：API设计直观，易于理解
- **功能强大**：支持所有HTTP方法和特性
- **自动处理**：自动处理编码、重定向、连接池等
- **广泛使用**：Python社区标准HTTP库

## 4.2 安装requests

```bash
# 使用pip安装
pip install requests

# 使用conda安装
conda install requests
```

## 4.3 基础使用方法

### 4.3.1 发送GET请求

```python
import requests

# 基础GET请求
response = requests.get('https://api.github.com/users/octocat')

# 带参数的GET请求
params = {'q': 'python', 'sort': 'stars'}
response = requests.get('https://api.github.com/search/repositories', params=params)
```

### 4.3.2 发送POST请求

```python
# 发送JSON数据
data = {'name': '张三', 'email': 'zhangsan@example.com'}
response = requests.post('https://api.example.com/users', json=data)

# 发送表单数据
form_data = {'username': 'user', 'password': 'pass'}
response = requests.post('https://api.example.com/login', data=form_data)
```

### 4.3.3 处理响应

```python
response = requests.get('https://api.github.com/users/octocat')

# 状态码
print(response.status_code)  # 200

# 响应内容
print(response.text)         # 文本格式
print(response.json())       # JSON格式（如果是JSON响应）
print(response.content)      # 二进制格式

# 响应头
print(response.headers)      # 响应头信息
```


In [None]:
# 4.4 实践：构建专业的API客户端

import requests
from typing import Dict, Any, Optional, Union
import time
from urllib.parse import urljoin
from requests.adapters import HTTPAdapter
from urllib3.util.retry import Retry

class APIClient:
    """专业级API客户端类"""
    
    def __init__(self, base_url: str, timeout: int = 30):
        """
        初始化API客户端
        
        Args:
            base_url: API基础URL
            timeout: 请求超时时间（秒）
        """
        self.base_url = base_url.rstrip('/')
        self.timeout = timeout
        self.session = requests.Session()
        
        # 配置重试策略
        retry_strategy = Retry(
            total=3,                    # 总重试次数
            backoff_factor=1,           # 重试间隔递增因子
            status_forcelist=[429, 500, 502, 503, 504],  # 需要重试的状态码
        )
        
        adapter = HTTPAdapter(max_retries=retry_strategy)
        self.session.mount("http://", adapter)
        self.session.mount("https://", adapter)
        
        # 设置默认头部
        self.session.headers.update({
            'User-Agent': 'Python-APIClient/1.0',
            'Accept': 'application/json',
            'Content-Type': 'application/json'
        })
    
    def set_auth_token(self, token: str, auth_type: str = 'Bearer'):
        """设置认证令牌"""
        self.session.headers.update({
            'Authorization': f'{auth_type} {token}'
        })
    
    def _make_request(self, method: str, endpoint: str, **kwargs) -> requests.Response:
        """发送HTTP请求的内部方法"""
        url = urljoin(self.base_url + '/', endpoint.lstrip('/'))
        
        try:
            response = self.session.request(
                method=method,
                url=url,
                timeout=self.timeout,
                **kwargs
            )
            
            # 记录请求信息
            logger.info(f"{method} {url} - Status: {response.status_code}")
            
            # 检查响应状态
            response.raise_for_status()
            
            return response
            
        except requests.exceptions.Timeout:
            logger.error(f"请求超时: {url}")
            raise
        except requests.exceptions.ConnectionError:
            logger.error(f"连接错误: {url}")
            raise
        except requests.exceptions.HTTPError as e:
            logger.error(f"HTTP错误: {e}")
            raise
        except Exception as e:
            logger.error(f"未知错误: {e}")
            raise
    
    def get(self, endpoint: str, params: Optional[Dict] = None) -> Dict[str, Any]:
        """发送GET请求"""
        response = self._make_request('GET', endpoint, params=params)
        return response.json()
    
    def post(self, endpoint: str, data: Optional[Dict] = None, 
             json_data: Optional[Dict] = None) -> Dict[str, Any]:
        """发送POST请求"""
        kwargs = {}
        if json_data:
            kwargs['json'] = json_data
        elif data:
            kwargs['data'] = data
            
        response = self._make_request('POST', endpoint, **kwargs)
        return response.json() if response.content else {}
    
    def put(self, endpoint: str, json_data: Dict) -> Dict[str, Any]:
        """发送PUT请求"""
        response = self._make_request('PUT', endpoint, json=json_data)
        return response.json() if response.content else {}
    
    def delete(self, endpoint: str) -> bool:
        """发送DELETE请求"""
        response = self._make_request('DELETE', endpoint)
        return response.status_code == 204

# 示例：使用GitHub API
def github_api_demo():
    """演示GitHub API的使用"""
    
    print("=== GitHub API演示 ===\n")
    
    # 创建GitHub API客户端
    github = APIClient('https://api.github.com')
    
    try:
        # 1. 获取用户信息
        print("1. 获取GitHub用户信息：")
        user_info = github.get('/users/octocat')
        print(f"用户名: {user_info['name']}")
        print(f"公开仓库数: {user_info['public_repos']}")
        print(f"粉丝数: {user_info['followers']}")
        print()
        
        # 2. 搜索仓库
        print("2. 搜索Python相关仓库：")
        search_params = {
            'q': 'language:python',
            'sort': 'stars',
            'order': 'desc',
            'per_page': 3
        }
        search_results = github.get('/search/repositories', params=search_params)
        
        for repo in search_results['items']:
            print(f"- {repo['full_name']} (⭐ {repo['stargazers_count']})")
        print()
        
        # 3. 获取仓库信息
        print("3. 获取特定仓库信息：")
        repo_info = github.get('/repos/python/cpython')
        print(f"仓库: {repo_info['full_name']}")
        print(f"描述: {repo_info['description']}")
        print(f"主要语言: {repo_info['language']}")
        print(f"Star数: {repo_info['stargazers_count']}")
        
    except Exception as e:
        print(f"API调用失败: {e}")

# 执行GitHub API演示
github_api_demo()


# 第五章：Postman API测试工具

## 5.1 什么是Postman？

Postman是一个功能强大的API开发环境，用于测试、开发和文档化API。它提供了直观的界面来发送HTTP请求和查看响应。

### 核心功能：
- **请求构建**：可视化构建各种HTTP请求
- **环境管理**：管理不同环境的变量
- **测试脚本**：编写自动化测试
- **文档生成**：自动生成API文档
- **团队协作**：分享和协作API集合

## 5.2 Postman安装和基础设置

### 5.2.1 安装Postman

1. 访问 [https://www.postman.com/downloads/](https://www.postman.com/downloads/)
2. 下载适合你操作系统的版本
3. 安装并启动Postman

### 5.2.2 基础界面介绍

- **左侧边栏**：集合(Collections)、历史记录、环境变量
- **中央工作区**：请求构建器、响应查看器
- **右侧边栏**：文档、注释、代码生成

## 5.3 创建第一个请求

### 步骤1：新建请求
1. 点击"New"按钮
2. 选择"Request"
3. 输入请求名称
4. 选择或创建集合保存请求

### 步骤2：配置请求
1. **选择HTTP方法**：GET, POST, PUT, DELETE等
2. **输入URL**：完整的API端点地址
3. **设置请求头**：Content-Type, Authorization等
4. **添加请求体**：JSON数据、表单数据等

### 步骤3：发送请求
1. 点击"Send"按钮
2. 查看状态码、响应时间、响应大小
3. 检查响应内容：JSON、HTML、XML等

## 5.4 实用技巧和最佳实践

### 5.4.1 环境变量管理

```javascript
// 设置环境变量
pm.environment.set("api_url", "https://api.example.com");
pm.environment.set("auth_token", "your_token_here");

// 使用环境变量
// 在URL中使用: {{api_url}}/users
// 在Header中使用: Authorization: Bearer {{auth_token}}
```

### 5.4.2 预请求脚本

```javascript
// 在请求发送前执行的脚本
// 生成时间戳
pm.environment.set("timestamp", new Date().getTime());

// 生成随机数
pm.environment.set("random_id", Math.floor(Math.random() * 1000));
```

### 5.4.3 测试脚本

```javascript
// 检查状态码
pm.test("Status code is 200", function () {
    pm.response.to.have.status(200);
});

// 检查响应时间
pm.test("Response time is less than 200ms", function () {
    pm.expect(pm.response.responseTime).to.be.below(200);
});

// 检查响应内容
pm.test("Response has name field", function () {
    var jsonData = pm.response.json();
    pm.expect(jsonData).to.have.property('name');
});

// 提取响应数据到变量
var jsonData = pm.response.json();
pm.environment.set("user_id", jsonData.id);
```


## 5.5 Postman实战练习

### 练习1：GitHub API测试
1. **创建新集合**："GitHub API Tests"
2. **设置环境变量**：
   - `github_api`: `https://api.github.com`
   - `username`: `octocat`

3. **创建请求**：
   - **GET用户信息**：`{{github_api}}/users/{{username}}`
   - **GET用户仓库**：`{{github_api}}/users/{{username}}/repos`
   - **搜索仓库**：`{{github_api}}/search/repositories?q=language:python&sort=stars`

4. **添加测试脚本**：
```javascript
// 检查响应状态
pm.test("Status code is 200", function () {
    pm.response.to.have.status(200);
});

// 检查响应时间
pm.test("Response time is reasonable", function () {
    pm.expect(pm.response.responseTime).to.be.below(2000);
});

// 检查用户信息
pm.test("User has login field", function () {
    var jsonData = pm.response.json();
    pm.expect(jsonData).to.have.property('login');
    pm.expect(jsonData.login).to.eql('octocat');
});
```

### 练习2：JSONPlaceholder API CRUD操作
使用 `https://jsonplaceholder.typicode.com` 练习完整的CRUD操作：

1. **GET所有帖子**：`/posts`
2. **GET特定帖子**：`/posts/1`
3. **POST创建帖子**：`/posts`
   ```json
   {
     "title": "我的第一篇文章",
     "body": "这是文章内容",
     "userId": 1
   }
   ```
4. **PUT更新帖子**：`/posts/1`
5. **DELETE删除帖子**：`/posts/1`

### 练习3：API认证测试
1. 模拟Bearer Token认证
2. 模拟API Key认证
3. 测试认证失败场景

---

## 5.6 Postman集合管理

### 组织结构建议：
```
📁 Project Name
├── 📁 Authentication
│   ├── 🔵 Login
│   ├── 🔵 Refresh Token
│   └── 🔵 Logout
├── 📁 Users
│   ├── 🔵 Get All Users
│   ├── 🔵 Get User by ID
│   ├── 🔵 Create User
│   ├── 🔵 Update User
│   └── 🔵 Delete User
└── 📁 Posts
    ├── 🔵 Get All Posts
    ├── 🔵 Get Post by ID
    ├── 🔵 Create Post
    ├── 🔵 Update Post
    └── 🔵 Delete Post
```

### 导入导出集合：
- **导出**：右键集合 → Export → 选择格式
- **导入**：Import按钮 → 选择文件或URL
- **分享**：右键集合 → Share → 生成链接


# 第六章：Web安全基础与认证授权

## 6.1 Web安全基础概念

### 6.1.1 常见的Web安全威胁

1. **SQL注入**：通过输入恶意SQL代码来攻击数据库
2. **XSS（跨站脚本攻击）**：在网页中注入恶意脚本
3. **CSRF（跨站请求伪造）**：冒用用户身份执行恶意操作
4. **身份认证绕过**：非法获取用户权限
5. **敏感数据泄露**：未加密或保护不当的数据被窃取

### 6.1.2 安全防护原则

- **最小权限原则**：用户只能访问必要的资源
- **纵深防御**：多层安全防护
- **输入验证**：严格验证所有用户输入
- **输出编码**：防止恶意脚本执行
- **加密传输**：使用HTTPS加密通信

## 6.2 认证（Authentication）vs 授权（Authorization）

### 6.2.1 认证（Authentication）
- **定义**：验证用户身份的过程
- **问题**：你是谁？
- **方式**：用户名/密码、Token、生物识别等

### 6.2.2 授权（Authorization）
- **定义**：确定用户能做什么的过程
- **问题**：你能做什么？
- **方式**：角色权限、访问控制列表（ACL）等

## 6.3 常见认证方式

### 6.3.1 Basic Authentication
```
Authorization: Basic dXNlcm5hbWU6cGFzc3dvcmQ=
```
- **优点**：简单易实现
- **缺点**：不安全，密码容易被破解

### 6.3.2 Bearer Token
```
Authorization: Bearer eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...
```
- **优点**：安全性高，可包含用户信息
- **缺点**：Token管理复杂

### 6.3.3 API Key
```
X-API-Key: your-api-key-here
```
- **优点**：简单，适合服务间通信
- **缺点**：缺乏用户上下文

## 6.4 JWT（JSON Web Token）详解

### 6.4.1 JWT结构
JWT由三部分组成，用点号分隔：
```
header.payload.signature
```

1. **Header**：包含算法和Token类型
```json
{
  "alg": "HS256",
  "typ": "JWT"
}
```

2. **Payload**：包含声明（claims）
```json
{
  "sub": "1234567890",
  "name": "John Doe",
  "iat": 1516239022,
  "exp": 1516242622
}
```

3. **Signature**：用于验证Token的完整性

### 6.4.2 JWT的优势
- **无状态**：服务器不需要存储Session
- **跨域**：可以在不同域名间使用
- **可扩展**：可以包含自定义声明
- **安全**：使用签名防止篡改


In [None]:
# 6.5 实践：JWT处理与认证

import base64
import hmac
import hashlib
import json
import time
from typing import Dict, Any, Optional

class SimpleJWT:
    """简化的JWT实现，用于学习理解"""
    
    def __init__(self, secret_key: str):
        self.secret_key = secret_key
    
    def _base64_url_encode(self, data: bytes) -> str:
        """Base64 URL编码"""
        return base64.urlsafe_b64encode(data).decode('utf-8').rstrip('=')
    
    def _base64_url_decode(self, data: str) -> bytes:
        """Base64 URL解码"""
        # 补充缺失的填充字符
        padding = 4 - (len(data) % 4)
        if padding != 4:
            data += '=' * padding
        return base64.urlsafe_b64decode(data)
    
    def create_token(self, payload: Dict[str, Any], 
                    expires_in: int = 3600) -> str:
        """
        创建JWT Token
        
        Args:
            payload: 载荷数据
            expires_in: 过期时间（秒）
            
        Returns:
            JWT Token字符串
        """
        # 1. 创建Header
        header = {
            "alg": "HS256",
            "typ": "JWT"
        }
        
        # 2. 创建Payload，添加时间戳
        current_time = int(time.time())
        payload.update({
            "iat": current_time,  # 签发时间
            "exp": current_time + expires_in  # 过期时间
        })
        
        # 3. 编码Header和Payload
        header_encoded = self._base64_url_encode(
            json.dumps(header, separators=(',', ':')).encode('utf-8')
        )
        payload_encoded = self._base64_url_encode(
            json.dumps(payload, separators=(',', ':')).encode('utf-8')
        )
        
        # 4. 创建签名
        message = f"{header_encoded}.{payload_encoded}"
        signature = hmac.new(
            self.secret_key.encode('utf-8'),
            message.encode('utf-8'),
            hashlib.sha256
        ).digest()
        signature_encoded = self._base64_url_encode(signature)
        
        # 5. 组合JWT
        return f"{header_encoded}.{payload_encoded}.{signature_encoded}"
    
    def verify_token(self, token: str) -> Optional[Dict[str, Any]]:
        """
        验证JWT Token
        
        Args:
            token: JWT Token字符串
            
        Returns:
            解码后的载荷，验证失败返回None
        """
        try:
            # 分割Token
            parts = token.split('.')
            if len(parts) != 3:
                logger.error("Token格式错误")
                return None
            
            header_encoded, payload_encoded, signature_encoded = parts
            
            # 验证签名
            message = f"{header_encoded}.{payload_encoded}"
            expected_signature = hmac.new(
                self.secret_key.encode('utf-8'),
                message.encode('utf-8'),
                hashlib.sha256
            ).digest()
            
            received_signature = self._base64_url_decode(signature_encoded)
            
            if not hmac.compare_digest(expected_signature, received_signature):
                logger.error("Token签名验证失败")
                return None
            
            # 解码载荷
            payload = json.loads(self._base64_url_decode(payload_encoded))
            
            # 检查过期时间
            if 'exp' in payload:
                if time.time() > payload['exp']:
                    logger.error("Token已过期")
                    return None
            
            return payload
            
        except Exception as e:
            logger.error(f"Token验证失败: {e}")
            return None

# 演示JWT使用
def jwt_demo():
    """演示JWT的创建和验证"""
    
    print("=== JWT认证演示 ===\n")
    
    # 创建JWT处理器
    jwt_handler = SimpleJWT("my-secret-key-2024")
    
    # 1. 创建Token
    user_payload = {
        "user_id": 123,
        "username": "john_doe",
        "email": "john@example.com",
        "role": "user"
    }
    
    token = jwt_handler.create_token(user_payload, expires_in=3600)
    print("1. 生成的JWT Token：")
    print(f"{token[:50]}...{token[-50:]}")  # 只显示前后50个字符
    print()
    
    # 2. 解析Token结构
    parts = token.split('.')
    print("2. Token结构分析：")
    print(f"Header: {json.loads(base64.urlsafe_b64decode(parts[0] + '==='))}")
    print(f"Payload: {json.loads(base64.urlsafe_b64decode(parts[1] + '==='))}")
    print(f"Signature: {parts[2][:20]}...")
    print()
    
    # 3. 验证Token
    print("3. Token验证：")
    decoded_payload = jwt_handler.verify_token(token)
    if decoded_payload:
        print("✅ Token验证成功")
        print(f"用户ID: {decoded_payload['user_id']}")
        print(f"用户名: {decoded_payload['username']}")
        print(f"角色: {decoded_payload['role']}")
        print(f"签发时间: {time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(decoded_payload['iat']))}")
        print(f"过期时间: {time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(decoded_payload['exp']))}")
    else:
        print("❌ Token验证失败")
    print()
    
    # 4. 测试无效Token
    print("4. 测试无效Token：")
    invalid_token = token[:-10] + "invalid123"  # 修改签名
    if jwt_handler.verify_token(invalid_token):
        print("❌ 无效Token验证通过（不应该发生）")
    else:
        print("✅ 无效Token被正确拒绝")

# 执行JWT演示
jwt_demo()


# 第七章：错误处理与日志记录

## 7.1 Python异常处理最佳实践

### 7.1.1 异常处理原则
1. **具体捕获**：捕获具体的异常类型，而不是使用裸露的`except:`
2. **及早失败**：问题发生时立即抛出异常
3. **优雅降级**：在可能的情况下提供备选方案
4. **记录日志**：记录异常详情便于调试

### 7.1.2 HTTP请求异常处理

```python
import requests
from requests.exceptions import (
    RequestException, ConnectionError, Timeout, 
    HTTPError, TooManyRedirects
)

def safe_api_call(url, timeout=10):
    try:
        response = requests.get(url, timeout=timeout)
        response.raise_for_status()  # 检查HTTP状态码
        return response.json()
    
    except ConnectionError:
        # 网络连接问题
        logger.error(f"无法连接到服务器: {url}")
        return {"error": "连接失败"}
    
    except Timeout:
        # 请求超时
        logger.error(f"请求超时: {url}")
        return {"error": "请求超时"}
    
    except HTTPError as e:
        # HTTP错误状态码
        logger.error(f"HTTP错误 {e.response.status_code}: {url}")
        return {"error": f"HTTP {e.response.status_code}"}
    
    except ValueError:
        # JSON解析错误
        logger.error(f"响应不是有效的JSON: {url}")
        return {"error": "数据格式错误"}
    
    except RequestException as e:
        # 其他requests相关错误
        logger.error(f"请求异常: {e}")
        return {"error": "请求失败"}
```

## 7.2 日志记录最佳实践

### 7.2.1 日志级别
- **DEBUG**：详细的调试信息
- **INFO**：一般信息
- **WARNING**：警告信息
- **ERROR**：错误信息
- **CRITICAL**：严重错误

### 7.2.2 日志格式规范
```
时间戳 - 模块名 - 级别 - 消息
2024-01-15 10:30:45,123 - api_client - INFO - 请求成功: GET /users
```

### 7.2.3 结构化日志
```python
import logging
import json
from datetime import datetime

class JSONFormatter(logging.Formatter):
    def format(self, record):
        log_entry = {
            "timestamp": datetime.utcnow().isoformat(),
            "level": record.levelname,
            "module": record.name,
            "message": record.getMessage(),
            "function": record.funcName,
            "line": record.lineno
        }
        
        if record.exc_info:
            log_entry["exception"] = self.formatException(record.exc_info)
            
        return json.dumps(log_entry, ensure_ascii=False)
```


In [None]:
# 7.3 实践：构建健壮的API客户端

import logging
import json
import os
from datetime import datetime
from typing import Dict, Any, Optional
import requests
from requests.exceptions import RequestException, ConnectionError, Timeout, HTTPError

# 配置专业级日志系统
class APILogger:
    """API专用日志记录器"""
    
    def __init__(self, name: str = "api_client", log_file: str = "api.log"):
        self.logger = logging.getLogger(name)
        self.logger.setLevel(logging.DEBUG)
        
        # 防止重复添加处理器
        if not self.logger.handlers:
            # 文件处理器
            file_handler = logging.FileHandler(log_file, encoding='utf-8')
            file_handler.setLevel(logging.DEBUG)
            
            # 控制台处理器
            console_handler = logging.StreamHandler()
            console_handler.setLevel(logging.INFO)
            
            # 格式化器
            formatter = logging.Formatter(
                '%(asctime)s - %(name)s - %(levelname)s - %(message)s'
            )
            
            file_handler.setFormatter(formatter)
            console_handler.setFormatter(formatter)
            
            self.logger.addHandler(file_handler)
            self.logger.addHandler(console_handler)
    
    def debug(self, message: str, **kwargs):
        """记录调试信息"""
        self.logger.debug(self._format_message(message, **kwargs))
    
    def info(self, message: str, **kwargs):
        """记录一般信息"""
        self.logger.info(self._format_message(message, **kwargs))
    
    def warning(self, message: str, **kwargs):
        """记录警告信息"""
        self.logger.warning(self._format_message(message, **kwargs))
    
    def error(self, message: str, **kwargs):
        """记录错误信息"""
        self.logger.error(self._format_message(message, **kwargs))
    
    def critical(self, message: str, **kwargs):
        """记录严重错误"""
        self.logger.critical(self._format_message(message, **kwargs))
    
    def _format_message(self, message: str, **kwargs) -> str:
        """格式化日志消息"""
        if kwargs:
            extra_info = json.dumps(kwargs, ensure_ascii=False)
            return f"{message} | {extra_info}"
        return message

# 自定义异常类
class APIError(Exception):
    """API基础异常类"""
    def __init__(self, message: str, status_code: Optional[int] = None, 
                 response_data: Optional[Dict] = None):
        super().__init__(message)
        self.status_code = status_code
        self.response_data = response_data

class APIConnectionError(APIError):
    """API连接异常"""
    pass

class APITimeoutError(APIError):
    """API超时异常"""
    pass

class APIAuthenticationError(APIError):
    """API认证异常"""
    pass

# 健壮的API客户端
class RobustAPIClient:
    """健壮的API客户端，包含完整的错误处理和日志记录"""
    
    def __init__(self, base_url: str, timeout: int = 30, 
                 max_retries: int = 3, retry_delay: float = 1.0):
        self.base_url = base_url.rstrip('/')
        self.timeout = timeout
        self.max_retries = max_retries
        self.retry_delay = retry_delay
        self.session = requests.Session()
        self.logger = APILogger()
        
        # 设置默认头部
        self.session.headers.update({
            'User-Agent': 'RobustAPIClient/1.0',
            'Accept': 'application/json',
            'Content-Type': 'application/json'
        })
        
        self.logger.info("API客户端初始化完成", 
                        base_url=base_url, timeout=timeout)
    
    def _make_request_with_retry(self, method: str, url: str, 
                               **kwargs) -> requests.Response:
        """带重试机制的请求方法"""
        last_exception = None
        
        for attempt in range(self.max_retries + 1):
            try:
                self.logger.debug(f"发送请求 (尝试 {attempt + 1}/{self.max_retries + 1})",
                                method=method, url=url)
                
                response = self.session.request(
                    method=method,
                    url=url,
                    timeout=self.timeout,
                    **kwargs
                )
                
                self.logger.info("请求成功",
                               method=method, url=url, 
                               status_code=response.status_code,
                               response_time=response.elapsed.total_seconds())
                
                return response
                
            except ConnectionError as e:
                last_exception = APIConnectionError(f"连接失败: {str(e)}")
                self.logger.warning(f"连接失败 (尝试 {attempt + 1})", 
                                  method=method, url=url, error=str(e))
                
            except Timeout as e:
                last_exception = APITimeoutError(f"请求超时: {str(e)}")
                self.logger.warning(f"请求超时 (尝试 {attempt + 1})", 
                                  method=method, url=url, error=str(e))
                
            except RequestException as e:
                last_exception = APIError(f"请求异常: {str(e)}")
                self.logger.error(f"请求异常 (尝试 {attempt + 1})", 
                                method=method, url=url, error=str(e))
                break  # 对于其他异常不重试
            
            # 如果不是最后一次尝试，等待一段时间再重试
            if attempt < self.max_retries:
                import time
                time.sleep(self.retry_delay * (2 ** attempt))  # 指数退避
        
        # 所有重试都失败了
        self.logger.error("所有重试都失败", method=method, url=url)
        raise last_exception
    
    def get(self, endpoint: str, params: Optional[Dict] = None) -> Dict[str, Any]:
        """发送GET请求"""
        url = f"{self.base_url}/{endpoint.lstrip('/')}"
        
        try:
            response = self._make_request_with_retry('GET', url, params=params)
            
            # 检查状态码
            if response.status_code == 401:
                raise APIAuthenticationError("认证失败", 
                                           status_code=response.status_code)
            elif response.status_code >= 400:
                raise APIError(f"HTTP错误 {response.status_code}", 
                             status_code=response.status_code,
                             response_data=response.json() if response.content else None)
            
            return response.json() if response.content else {}
            
        except json.JSONDecodeError:
            self.logger.error("JSON解析失败", url=url, content=response.text[:200])
            raise APIError("响应数据格式错误")
    
    def post(self, endpoint: str, data: Optional[Dict] = None, 
             json_data: Optional[Dict] = None) -> Dict[str, Any]:
        """发送POST请求"""
        url = f"{self.base_url}/{endpoint.lstrip('/')}"
        
        kwargs = {}
        if json_data:
            kwargs['json'] = json_data
        elif data:
            kwargs['data'] = data
        
        try:
            response = self._make_request_with_retry('POST', url, **kwargs)
            
            if response.status_code == 401:
                raise APIAuthenticationError("认证失败", 
                                           status_code=response.status_code)
            elif response.status_code >= 400:
                raise APIError(f"HTTP错误 {response.status_code}", 
                             status_code=response.status_code,
                             response_data=response.json() if response.content else None)
            
            return response.json() if response.content else {}
            
        except json.JSONDecodeError:
            self.logger.error("JSON解析失败", url=url, content=response.text[:200])
            raise APIError("响应数据格式错误")

# 使用示例
def robust_api_demo():
    """演示健壮的API客户端使用"""
    
    print("=== 健壮API客户端演示 ===\n")
    
    # 创建客户端
    client = RobustAPIClient("https://jsonplaceholder.typicode.com")
    
    try:
        # 1. 正常请求
        print("1. 正常GET请求：")
        posts = client.get("/posts", params={"_limit": 3})
        print(f"获取到 {len(posts)} 个帖子")
        print(f"第一个帖子标题: {posts[0]['title']}")
        print()
        
        # 2. POST请求
        print("2. POST请求：")
        new_post = {
            "title": "测试帖子",
            "body": "这是一个测试帖子的内容",
            "userId": 1
        }
        created_post = client.post("/posts", json_data=new_post)
        print(f"创建帖子成功，ID: {created_post.get('id')}")
        print()
        
        # 3. 错误处理演示
        print("3. 错误处理演示：")
        try:
            # 尝试访问不存在的端点
            client.get("/nonexistent-endpoint")
        except APIError as e:
            print(f"捕获到API错误: {e}")
            print(f"状态码: {e.status_code}")
        
    except Exception as e:
        print(f"演示过程中发生错误: {e}")
    
    # 清理日志文件
    if os.path.exists("api.log"):
        os.remove("api.log")
        print("清理日志文件")

# 执行演示
robust_api_demo()


# 第八章：环境变量与配置管理

## 8.1 为什么需要环境变量？

### 安全性考虑：
- 避免在代码中硬编码敏感信息（API密钥、数据库密码等）
- 防止敏感信息泄露到版本控制系统

### 灵活性考虑：
- 在不同环境（开发、测试、生产）使用不同配置
- 部署时可以轻松修改配置而无需修改代码

### 最佳实践：
- 配置从环境中读取
- 使用默认值作为后备选项
- 明确区分必需和可选配置

## 8.2 Python中的环境变量处理

### 8.2.1 使用os.environ
```python
import os

# 读取环境变量
api_key = os.environ.get('API_KEY')  # 如果不存在返回None
api_key = os.environ.get('API_KEY', 'default_value')  # 设置默认值

# 检查必需的环境变量
if 'DATABASE_URL' not in os.environ:
    raise ValueError("DATABASE_URL环境变量是必需的")

database_url = os.environ['DATABASE_URL']
```

### 8.2.2 使用python-dotenv
```bash
pip install python-dotenv
```

创建`.env`文件：
```
# .env文件
API_KEY=your-secret-api-key
DATABASE_URL=postgresql://user:pass@localhost/db
DEBUG=True
MAX_CONNECTIONS=10
```

Python代码：
```python
from dotenv import load_dotenv
import os

# 加载.env文件
load_dotenv()

# 现在可以像普通环境变量一样使用
api_key = os.getenv('API_KEY')
debug = os.getenv('DEBUG', 'False').lower() == 'true'
max_connections = int(os.getenv('MAX_CONNECTIONS', '5'))
```

## 8.3 配置管理最佳实践

### 8.3.1 配置层次结构
1. **环境变量**（最高优先级）
2. **配置文件**
3. **命令行参数**
4. **默认值**（最低优先级）

### 8.3.2 数据类型处理
```python
# 布尔值
debug = os.getenv('DEBUG', 'False').lower() in ['true', '1', 'yes', 'on']

# 整数
port = int(os.getenv('PORT', '8000'))

# 列表
allowed_hosts = os.getenv('ALLOWED_HOSTS', 'localhost').split(',')

# JSON配置
import json
complex_config = json.loads(os.getenv('COMPLEX_CONFIG', '{}'))
```


In [None]:
# 8.4 实践：构建专业的配置管理系统

import os
import json
from typing import Any, Dict, List, Optional, Union, Type
from dataclasses import dataclass, field
from pathlib import Path

class ConfigError(Exception):
    """配置相关异常"""
    pass

class ConfigManager:
    """专业级配置管理器"""
    
    def __init__(self, env_file: Optional[str] = None):
        """
        初始化配置管理器
        
        Args:
            env_file: .env文件路径，如果为None则自动查找
        """
        self._load_env_file(env_file)
        self._config_cache = {}
    
    def _load_env_file(self, env_file: Optional[str] = None):
        """加载环境变量文件"""
        if env_file is None:
            # 自动查找.env文件
            possible_paths = ['.env', '.env.local', '.env.development']
            for path in possible_paths:
                if Path(path).exists():
                    env_file = path
                    break
        
        if env_file and Path(env_file).exists():
            self._parse_env_file(env_file)
            print(f"✅ 已加载环境变量文件: {env_file}")
        else:
            print("ℹ️  未找到环境变量文件，使用系统环境变量")
    
    def _parse_env_file(self, env_file: str):
        """解析.env文件"""
        try:
            with open(env_file, 'r', encoding='utf-8') as f:
                for line_num, line in enumerate(f, 1):
                    line = line.strip()
                    
                    # 跳过空行和注释
                    if not line or line.startswith('#'):
                        continue
                    
                    # 解析键值对
                    if '=' in line:
                        key, value = line.split('=', 1)
                        key = key.strip()
                        value = value.strip()
                        
                        # 去除引号
                        if value.startswith('"') and value.endswith('"'):
                            value = value[1:-1]
                        elif value.startswith("'") and value.endswith("'"):
                            value = value[1:-1]
                        
                        # 设置环境变量（如果尚未设置）
                        if key not in os.environ:
                            os.environ[key] = value
                    else:
                        print(f"警告: .env文件第{line_num}行格式错误: {line}")
                        
        except Exception as e:
            raise ConfigError(f"解析环境变量文件失败: {e}")
    
    def get(self, key: str, default: Any = None, 
            required: bool = False, type_cast: Optional[Type] = None) -> Any:
        """
        获取配置值
        
        Args:
            key: 配置键名
            default: 默认值
            required: 是否必需
            type_cast: 类型转换
            
        Returns:
            配置值
        """
        # 检查缓存
        cache_key = f"{key}_{type(default).__name__}_{type_cast}"
        if cache_key in self._config_cache:
            return self._config_cache[cache_key]
        
        # 获取原始值
        value = os.environ.get(key, default)
        
        # 检查必需参数
        if required and value is None:
            raise ConfigError(f"必需的配置参数 '{key}' 未找到")
        
        # 类型转换
        if value is not None and type_cast:
            try:
                value = self._convert_type(value, type_cast)
            except (ValueError, TypeError) as e:
                raise ConfigError(f"配置参数 '{key}' 类型转换失败: {e}")
        
        # 缓存结果
        self._config_cache[cache_key] = value
        return value
    
    def _convert_type(self, value: str, target_type: Type) -> Any:
        """类型转换"""
        if target_type == bool:
            return str(value).lower() in ['true', '1', 'yes', 'on']
        elif target_type == int:
            return int(value)
        elif target_type == float:
            return float(value)
        elif target_type == list:
            return [item.strip() for item in value.split(',') if item.strip()]
        elif target_type == dict:
            return json.loads(value)
        else:
            return target_type(value)
    
    def get_database_config(self) -> Dict[str, Any]:
        """获取数据库配置"""
        return {
            'host': self.get('DB_HOST', 'localhost'),
            'port': self.get('DB_PORT', 5432, type_cast=int),
            'name': self.get('DB_NAME', required=True),
            'user': self.get('DB_USER', required=True),
            'password': self.get('DB_PASSWORD', required=True),
            'pool_size': self.get('DB_POOL_SIZE', 10, type_cast=int),
        }
    
    def get_api_config(self) -> Dict[str, Any]:
        """获取API配置"""
        return {
            'host': self.get('API_HOST', '0.0.0.0'),
            'port': self.get('API_PORT', 8000, type_cast=int),
            'debug': self.get('DEBUG', False, type_cast=bool),
            'secret_key': self.get('SECRET_KEY', required=True),
            'allowed_hosts': self.get('ALLOWED_HOSTS', ['localhost'], type_cast=list),
        }
    
    def get_external_services_config(self) -> Dict[str, Any]:
        """获取外部服务配置"""
        return {
            'github_api_key': self.get('GITHUB_API_KEY'),
            'redis_url': self.get('REDIS_URL', 'redis://localhost:6379'),
            'email_smtp_host': self.get('EMAIL_SMTP_HOST'),
            'email_smtp_port': self.get('EMAIL_SMTP_PORT', 587, type_cast=int),
        }

# 创建示例配置文件
def create_sample_env_file():
    """创建示例.env文件"""
    env_content = """# 数据库配置
DB_HOST=localhost
DB_PORT=5432
DB_NAME=myapp
DB_USER=myuser
DB_PASSWORD=mypassword
DB_POOL_SIZE=20

# API配置
API_HOST=0.0.0.0
API_PORT=8000
DEBUG=true
SECRET_KEY=your-super-secret-key-here
ALLOWED_HOSTS=localhost,127.0.0.1,yourdomain.com

# 外部服务
GITHUB_API_KEY=ghp_your_github_token_here
REDIS_URL=redis://localhost:6379/0
EMAIL_SMTP_HOST=smtp.gmail.com
EMAIL_SMTP_PORT=587

# 日志配置
LOG_LEVEL=INFO
LOG_FILE=app.log
"""
    
    with open('.env.example', 'w', encoding='utf-8') as f:
        f.write(env_content)
    
    print("✅ 已创建 .env.example 文件")
    return env_content

# 配置管理演示
def config_management_demo():
    """演示配置管理系统的使用"""
    
    print("=== 配置管理系统演示 ===\n")
    
    # 1. 创建示例配置文件
    print("1. 创建示例配置文件：")
    create_sample_env_file()
    print()
    
    # 2. 模拟设置一些环境变量
    print("2. 设置环境变量：")
    os.environ['DB_NAME'] = 'demo_db'
    os.environ['DB_USER'] = 'demo_user'
    os.environ['DB_PASSWORD'] = 'demo_pass'
    os.environ['SECRET_KEY'] = 'demo-secret-key'
    os.environ['DEBUG'] = 'true'
    os.environ['API_PORT'] = '8080'
    print("已设置演示用的环境变量")
    print()
    
    # 3. 初始化配置管理器
    print("3. 初始化配置管理器：")
    config = ConfigManager()
    print()
    
    # 4. 获取各类配置
    print("4. 获取配置信息：")
    
    try:
        # 数据库配置
        db_config = config.get_database_config()
        print("数据库配置:")
        for key, value in db_config.items():
            print(f"  {key}: {value}")
        print()
        
        # API配置
        api_config = config.get_api_config()
        print("API配置:")
        for key, value in api_config.items():
            print(f"  {key}: {value}")
        print()
        
        # 单个配置获取示例
        print("单个配置获取示例:")
        debug_mode = config.get('DEBUG', False, type_cast=bool)
        print(f"Debug模式: {debug_mode}")
        
        port = config.get('API_PORT', 8000, type_cast=int)
        print(f"API端口: {port} (类型: {type(port).__name__})")
        
        hosts = config.get('ALLOWED_HOSTS', ['localhost'], type_cast=list)
        print(f"允许的主机: {hosts}")
        
    except ConfigError as e:
        print(f"配置错误: {e}")
    
    # 清理示例文件
    if Path('.env.example').exists():
        Path('.env.example').unlink()
        print("\n清理示例文件")

# 执行演示
config_management_demo()


# 第九章：实践项目与综合练习

## 9.1 项目一：GitHub API客户端

### 项目目标：
构建一个完整的GitHub API客户端，集成前面学到的所有知识点。

### 功能要求：
1. **用户管理**：获取用户信息、仓库列表、粉丝信息
2. **仓库操作**：搜索仓库、获取仓库详情、星标管理
3. **认证支持**：支持Personal Access Token认证
4. **错误处理**：完善的异常处理和重试机制
5. **配置管理**：使用环境变量管理配置
6. **日志记录**：完整的操作日志
7. **数据缓存**：实现简单的内存缓存

### 技术栈：
- `requests` - HTTP客户端
- `python-dotenv` - 环境变量管理
- `logging` - 日志记录
- `json` - 数据处理
- `typing` - 类型注解

## 9.2 项目二：天气API聚合服务

### 项目目标：
创建一个天气API聚合服务，从多个天气API获取数据并提供统一接口。

### 功能要求：
1. **多数据源**：集成OpenWeatherMap、WeatherAPI等
2. **数据聚合**：合并多个数据源的信息
3. **缓存机制**：避免频繁API调用
4. **限流保护**：API调用频率限制
5. **数据格式化**：统一的响应格式
6. **错误恢复**：主API失败时使用备用API

## 9.3 项目三：RESTful API测试套件

### 项目目标：
构建一个通用的RESTful API测试工具。

### 功能要求：
1. **测试用例管理**：支持多种测试场景
2. **断言支持**：状态码、响应时间、数据验证
3. **报告生成**：HTML格式的测试报告
4. **并发测试**：支持并发请求测试
5. **性能监控**：响应时间统计
6. **数据驱动**：从文件读取测试数据


In [None]:
# 9.4 实践：简化版GitHub API客户端

import requests
import json
import time
import os
from typing import Dict, Any, List, Optional
from dataclasses import dataclass
from datetime import datetime, timedelta
import logging

# 设置日志
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

@dataclass
class GitHubUser:
    """GitHub用户数据类"""
    login: str
    name: Optional[str]
    email: Optional[str]
    public_repos: int
    followers: int
    following: int
    created_at: str
    avatar_url: str
    
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> 'GitHubUser':
        """从字典创建用户对象"""
        return cls(
            login=data['login'],
            name=data.get('name'),
            email=data.get('email'),
            public_repos=data['public_repos'],
            followers=data['followers'],
            following=data['following'],
            created_at=data['created_at'],
            avatar_url=data['avatar_url']
        )

@dataclass
class GitHubRepo:
    """GitHub仓库数据类"""
    name: str
    full_name: str
    description: Optional[str]
    html_url: str
    language: Optional[str]
    stargazers_count: int
    forks_count: int
    created_at: str
    updated_at: str
    
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> 'GitHubRepo':
        """从字典创建仓库对象"""
        return cls(
            name=data['name'],
            full_name=data['full_name'],
            description=data.get('description'),
            html_url=data['html_url'],
            language=data.get('language'),
            stargazers_count=data['stargazers_count'],
            forks_count=data['forks_count'],
            created_at=data['created_at'],
            updated_at=data['updated_at']
        )

class GitHubAPIClient:
    """GitHub API客户端"""
    
    def __init__(self, token: Optional[str] = None):
        """
        初始化GitHub API客户端
        
        Args:
            token: GitHub Personal Access Token
        """
        self.base_url = "https://api.github.com"
        self.session = requests.Session()
        self.cache = {}
        self.cache_ttl = 300  # 5分钟缓存
        
        # 设置认证
        if token:
            self.session.headers.update({
                'Authorization': f'token {token}'
            })
        
        # 设置通用头部
        self.session.headers.update({
            'Accept': 'application/vnd.github.v3+json',
            'User-Agent': 'Python-GitHub-Client/1.0'
        })
        
        logger.info("GitHub API客户端初始化完成")
    
    def _get_from_cache(self, key: str) -> Optional[Any]:
        """从缓存获取数据"""
        if key in self.cache:
            data, timestamp = self.cache[key]
            if time.time() - timestamp < self.cache_ttl:
                logger.debug(f"从缓存获取数据: {key}")
                return data
            else:
                # 缓存过期，删除
                del self.cache[key]
        return None
    
    def _set_cache(self, key: str, data: Any):
        """设置缓存"""
        self.cache[key] = (data, time.time())
        logger.debug(f"数据已缓存: {key}")
    
    def _make_request(self, endpoint: str, params: Optional[Dict] = None) -> Dict[str, Any]:
        """发送API请求"""
        url = f"{self.base_url}/{endpoint.lstrip('/')}"
        
        # 检查缓存
        cache_key = f"{endpoint}_{params}"
        cached_data = self._get_from_cache(cache_key)
        if cached_data:
            return cached_data
        
        try:
            logger.info(f"发送API请求: {endpoint}")
            response = self.session.get(url, params=params, timeout=10)
            
            # 检查速率限制
            if response.status_code == 403:
                rate_limit_remaining = response.headers.get('X-RateLimit-Remaining', '0')
                if rate_limit_remaining == '0':
                    reset_time = int(response.headers.get('X-RateLimit-Reset', time.time()))
                    wait_time = reset_time - int(time.time())
                    logger.warning(f"API速率限制，等待 {wait_time} 秒")
                    time.sleep(max(wait_time, 1))
                    return self._make_request(endpoint, params)
            
            response.raise_for_status()
            data = response.json()
            
            # 缓存数据
            self._set_cache(cache_key, data)
            
            # 记录速率限制信息
            rate_limit_remaining = response.headers.get('X-RateLimit-Remaining')
            if rate_limit_remaining:
                logger.debug(f"API调用剩余次数: {rate_limit_remaining}")
            
            return data
            
        except requests.RequestException as e:
            logger.error(f"API请求失败: {e}")
            raise
    
    def get_user(self, username: str) -> GitHubUser:
        """获取用户信息"""
        data = self._make_request(f"/users/{username}")
        return GitHubUser.from_dict(data)
    
    def get_user_repos(self, username: str, per_page: int = 30) -> List[GitHubRepo]:
        """获取用户的仓库列表"""
        params = {'per_page': per_page, 'sort': 'updated'}
        data = self._make_request(f"/users/{username}/repos", params)
        return [GitHubRepo.from_dict(repo) for repo in data]
    
    def search_repositories(self, query: str, sort: str = 'stars', 
                          order: str = 'desc', per_page: int = 30) -> List[GitHubRepo]:
        """搜索仓库"""
        params = {
            'q': query,
            'sort': sort,
            'order': order,
            'per_page': per_page
        }
        data = self._make_request("/search/repositories", params)
        return [GitHubRepo.from_dict(repo) for repo in data['items']]
    
    def get_repo(self, owner: str, repo: str) -> GitHubRepo:
        """获取仓库信息"""
        data = self._make_request(f"/repos/{owner}/{repo}")
        return GitHubRepo.from_dict(data)
    
    def get_rate_limit(self) -> Dict[str, Any]:
        """获取API速率限制信息"""
        return self._make_request("/rate_limit")

# 使用示例
def github_client_demo():
    """演示GitHub API客户端的使用"""
    
    print("=== GitHub API客户端演示 ===\n")
    
    # 初始化客户端（可以传入token以获得更高的速率限制）
    client = GitHubAPIClient()
    
    try:
        # 1. 获取用户信息
        print("1. 获取用户信息：")
        user = client.get_user('octocat')
        print(f"用户名: {user.login}")
        print(f"真实姓名: {user.name}")
        print(f"公开仓库数: {user.public_repos}")
        print(f"粉丝数: {user.followers}")
        print(f"关注数: {user.following}")
        print(f"注册时间: {user.created_at}")
        print()
        
        # 2. 获取用户仓库
        print("2. 获取用户仓库（最新3个）：")
        repos = client.get_user_repos('octocat', per_page=3)
        for repo in repos:
            print(f"- {repo.name}")
            print(f"  描述: {repo.description}")
            print(f"  语言: {repo.language}")
            print(f"  ⭐ {repo.stargazers_count} 🍴 {repo.forks_count}")
            print(f"  更新时间: {repo.updated_at}")
            print()
        
        # 3. 搜索Python相关仓库
        print("3. 搜索Python相关仓库（前3个）：")
        search_results = client.search_repositories('language:python', per_page=3)
        for repo in search_results:
            print(f"- {repo.full_name}")
            print(f"  描述: {repo.description}")
            print(f"  ⭐ {repo.stargazers_count}")
            print()
        
        # 4. 获取特定仓库信息
        print("4. 获取特定仓库信息：")
        repo = client.get_repo('python', 'cpython')
        print(f"仓库: {repo.full_name}")
        print(f"描述: {repo.description}")
        print(f"主要语言: {repo.language}")
        print(f"Star数: {repo.stargazers_count}")
        print(f"Fork数: {repo.forks_count}")
        print()
        
        # 5. 检查API速率限制
        print("5. API速率限制信息：")
        rate_limit = client.get_rate_limit()
        core_limit = rate_limit['resources']['core']
        print(f"每小时限制: {core_limit['limit']}")
        print(f"剩余次数: {core_limit['remaining']}")
        reset_time = datetime.fromtimestamp(core_limit['reset'])
        print(f"重置时间: {reset_time}")
        
    except Exception as e:
        print(f"演示过程中发生错误: {e}")
        logger.error(f"GitHub API客户端演示失败: {e}")

# 执行演示
github_client_demo()


# 第十章：总结与下一步

## 10.1 学习成果总结

通过本课程的学习，你已经掌握了以下核心知识点：

### ✅ 已掌握的技能

#### HTTP协议基础
- HTTP请求/响应结构
- HTTP方法和状态码
- URL结构和参数处理
- 请求头和响应头的使用

#### RESTful API设计
- REST架构原则
- 资源命名规范
- CRUD操作映射
- API响应格式标准化

#### JSON数据处理
- JSON语法和数据类型
- Python中的JSON操作
- 类型转换和错误处理
- 嵌套数据提取技巧

#### requests库精通
- 基础HTTP请求发送
- 会话管理和连接池
- 认证和头部设置
- 超时和重试机制

#### API测试工具
- Postman基础操作
- 环境变量管理
- 测试脚本编写
- 集合组织和分享

#### Web安全基础
- 常见安全威胁识别
- 认证与授权概念
- JWT原理和实现
- 安全最佳实践

#### 错误处理与日志
- 异常处理模式
- 日志记录规范
- 结构化日志实现
- 调试技巧

#### 配置管理
- 环境变量使用
- 配置文件管理
- 类型转换和验证
- 多环境配置策略

## 10.2 代码质量检查清单

在进入Web框架学习之前，确保你的代码符合以下标准：

### 🔍 代码规范
- [ ] 使用类型注解
- [ ] 遵循PEP 8命名规范
- [ ] 编写文档字符串
- [ ] 适当的注释说明

### 🛡️ 错误处理
- [ ] 捕获具体异常类型
- [ ] 提供有意义的错误信息
- [ ] 实现优雅降级
- [ ] 记录错误日志

### 📝 日志记录
- [ ] 使用适当的日志级别
- [ ] 包含足够的上下文信息
- [ ] 避免记录敏感信息
- [ ] 结构化日志格式

### ⚙️ 配置管理
- [ ] 从环境变量读取配置
- [ ] 提供合理的默认值
- [ ] 验证配置参数
- [ ] 区分不同环境配置

### 🧪 测试覆盖
- [ ] 单元测试覆盖主要功能
- [ ] 集成测试覆盖API调用
- [ ] 错误场景测试
- [ ] 性能测试基准

## 10.3 下一步学习路径

### 🎯 即将学习的Web框架

#### 1. FastAPI（推荐首选）
**优势**：
- 现代化设计，自动API文档
- 原生异步支持
- 类型安全，自动验证
- 高性能，易于学习

**适合场景**：
- API服务开发
- 微服务架构
- 现代Web应用

#### 2. Flask（轻量级选择）
**优势**：
- 简单灵活，学习曲线平缓
- 丰富的扩展生态
- 社区成熟，文档完善

**适合场景**：
- 小型Web应用
- 原型开发
- 教学学习

#### 3. Django（全功能框架）
**优势**：
- 功能完整，开箱即用
- 强大的ORM和管理界面
- 企业级特性支持

**适合场景**：
- 大型Web应用
- 内容管理系统
- 企业级开发

### 📚 继续深入的知识点

#### 数据库操作
- SQLAlchemy ORM使用
- 数据库迁移管理
- 查询优化技巧
- 连接池配置

#### 异步编程
- async/await语法
- 异步HTTP客户端
- 异步数据库操作
- 并发编程模式

#### 部署和运维
- Docker容器化
- 云平台部署
- 监控和日志收集
- 性能优化技巧

#### 高级话题
- 微服务架构
- 消息队列使用
- 缓存策略
- API网关设计

## 10.4 实践建议

### 📝 动手项目
1. **个人博客系统**：实现CRUD操作
2. **任务管理API**：包含用户认证
3. **数据聚合服务**：集成多个外部API
4. **实时聊天应用**：使用WebSocket

### 🤝 社区参与
- 参与开源项目贡献
- 加入Python开发者社群
- 分享学习经验和项目
- 参加技术会议和讲座

### 📖 持续学习
- 关注技术博客和文档
- 实践最新的开发模式
- 学习行业最佳实践
- 保持对新技术的敏感度

---

## 🎉 恭喜完成Web开发基础学习！

你现在已经具备了进入Web框架学习的所有前置知识。继续保持学习的热情，在实践中不断提升技能！

记住：**最好的学习方式就是动手实践。开始构建你的第一个Web应用吧！**
