<a href="https://colab.research.google.com/github/FlyAIBox/LLM-101/blob/main/chapter01-llm-env/python-base/learning-python3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Python 3 基础学习教程 - 面向大模型技术初学者

> **教程说明**：本教程专为大模型（LLM）技术初学者设计，涵盖Python编程的核心概念，并结合大模型开发中的实际应用场景。


## Jupyter Notebook 使用指南

### 基本操作
当你在 Jupyter notebook 中编辑单元格时，需要按 **`<Shift> + <Enter>`** 重新运行单元格。这将使你所做的更改对其他单元格可用。

使用 **`<Enter>`** 在你正在编辑的单元格内创建新行。

### 单元格类型

#### 代码单元格（Code Cell）
- 重新运行将执行你编写的任何Python语句
- 要编辑现有的代码单元格，请点击它
- 代码执行结果会显示在单元格下方

#### Markdown 单元格（Markdown Cell）
- 重新运行将渲染 markdown 文本
- 要编辑现有的 markdown 单元格，请双击它
- 用于编写说明文档和教程内容

---

## 大模型技术中的Python重要性

在大模型（LLM）开发中，Python是最主要的编程语言。掌握Python基础对于：
- **API调用**：与OpenAI、Claude等大模型服务交互
- **数据处理**：处理文本、JSON、CSV等格式数据
- **提示词工程**：构建和优化提示词模板
- **Agent开发**：创建智能代理和自动化工具
- **RAG系统**：构建检索增强生成系统

<hr>

## Jupyter Notebook 常用操作指南

![Jupyter Notebook](https://cdn.jsdelivr.net/gh/Fly0905/note-picture@main/imag/202509151439200.png)

在 Jupyter notebook 窗口顶部附近，有一行菜单选项（`文件`、`编辑`、`查看`、`运行` 等）和一行工具栏图标（保存、添加单元格、剪切、复制、粘贴、运行等）。

### 单元格管理

#### 插入和删除单元格
- 使用"加号"图标在当前选中的单元格下方插入新单元格
- 使用菜单中的"插入" -> "在上方插入单元格"在上方插入
- 使用"删除"按钮或键盘快捷键删除选中的单元格

#### 清除输出和重启内核
- 使用菜单中的"内核" -> "重启"重启Python内核
- 点击"清除所有输出并重启"清除所有输出结果
- 使用"内核" -> "中断"停止正在运行的代码

#### 保存和下载笔记本
- 使用"文件" -> "保存"或Ctrl+S保存当前笔记本
- 使用"文件" -> "下载为" -> "IPython Notebook (.ipynb)"下载笔记本文件
- 支持多种格式导出：HTML、PDF、Python脚本等

### 大模型开发中的最佳实践
- **定期保存**：在编写大模型相关代码时，经常保存避免数据丢失
- **分步执行**：将复杂的API调用分解为多个单元格，便于调试
- **注释详细**：为每个代码块添加清晰的注释，说明其在大模型工作流中的作用

<hr>

## 学习资源与参考资料

### Python 官方文档
- [Python 3 官方教程](https://docs.python.org/3/tutorial/index.html) - Python官方入门教程
- [Python 3 语言参考](https://docs.python.org/3/reference/index.html) - 完整的语言规范
- [Python 标准库](https://docs.python.org/3/library/index.html) - 内置模块和函数

### Jupyter Notebook 相关
- [Jupyter Notebook 官方文档](https://jupyter-notebook.readthedocs.io/en/latest/notebook.html)
- [MyBinder 使用指南](https://mybinder.readthedocs.io/en/latest/introduction.html)
- [Markdown 语法参考](https://daringfireball.net/projects/markdown/syntax)

### 大模型技术相关资源
- [OpenAI API 文档](https://platform.openai.com/docs) - OpenAI API 使用指南
- [Hugging Face Transformers](https://huggingface.co/docs/transformers) - 预训练模型库
- [LangChain 文档](https://python.langchain.com/) - 大模型应用开发框架
- [FastAPI 文档](https://fastapi.tiangolo.com/) - 构建API服务的现代框架

### 推荐学习路径
1. **Python基础** → 2. **数据处理** → 3. **API调用** → 4. **大模型集成** → 5. **项目实战**

<hr>

## 服务器环境信息检查🔧

在开始部署模型之前，我们需要了解当前的运行环境。这个步骤非常重要，因为：

### 🎯 检查目的
1. **硬件确认**: 确保有足够的 GPU 显存运行模型
2. **系统兼容**: 验证操作系统和 Python 版本
3. **资源评估**: 了解可用的 CPU、内存和存储空间
4. **环境配置**: 检查 CUDA 版本和相关依赖

### 📊 检查内容
- **操作系统**: Linux 发行版和版本
- **CPU 信息**: 处理器型号和核心数
- **内存状态**: 总内存和可用内存
- **GPU 配置**: 显卡型号和显存大小
- **CUDA 版本**: 深度学习框架支持
- **Python 环境**: 解释器版本
- **磁盘空间**: 可用存储空间

In [1]:
# 🔍 环境信息检查脚本
#
# 本脚本的作用：
# 1. 安装 pandas 库用于数据表格展示
# 2. 检查系统的各项配置信息
# 3. 生成详细的环境报告表格
#
# 对于初学者来说，这个步骤帮助你：
# - 了解当前运行环境的硬件配置
# - 确认是否满足模型运行的最低要求
# - 学习如何通过代码获取系统信息

# 安装 pandas 库 - 用于创建和展示数据表格
# pandas 是 Python 中最流行的数据处理和分析库
!pip install pandas==2.2.2

import platform # 导入 platform 模块以获取系统信息
import os # 导入 os 模块以与操作系统交互
import subprocess # 导入 subprocess 模块以运行外部命令
import pandas as pd # 导入 pandas 模块，通常用于数据处理，这里用于创建表格
import shutil # 导入 shutil 模块以获取磁盘空间信息

# 获取 CPU 信息的函数，包括核心数量
def get_cpu_info():
    cpu_info = "" # 初始化 CPU 信息字符串
    physical_cores = "N/A"
    logical_cores = "N/A"

    if platform.system() == "Windows": # 如果是 Windows 系统
        cpu_info = platform.processor() # 使用 platform.processor() 获取 CPU 信息
        try:
            # 获取 Windows 上的核心数量 (需要 WMI)
            import wmi
            c = wmi.WMI()
            for proc in c.Win32_Processor():
                physical_cores = proc.NumberOfCores
                logical_cores = proc.NumberOfLogicalProcessors
        except:
            pass # 如果 WMI 不可用，忽略错误

    elif platform.system() == "Darwin": # 如果是 macOS 系统
        # 在 macOS 上使用 sysctl 命令获取 CPU 信息和核心数量
        os.environ['PATH'] = os.environ['PATH'] + os.pathsep + '/usr/sbin' # 更新 PATH 环境变量
        try:
            process_brand = subprocess.Popen(['sysctl', "machdep.cpu.brand_string"], stdout=subprocess.PIPE, stderr=subprocess.PIPE)
            stdout_brand, stderr_brand = process_brand.communicate()
            cpu_info = stdout_brand.decode().split(': ')[1].strip() if stdout_brand else "Could not retrieve CPU info"

            process_physical = subprocess.Popen(['sysctl', "hw.physicalcpu"], stdout=subprocess.PIPE, stderr=subprocess.PIPE)
            stdout_physical, stderr_physical = process_physical.communicate()
            physical_cores = stdout_physical.decode().split(': ')[1].strip() if stdout_physical else "N/A"

            process_logical = subprocess.Popen(['sysctl', "hw.logicalcpu"], stdout=subprocess.PIPE, stderr=subprocess.PIPE)
            stdout_logical, stderr_logical = process_logical.communicate()
            logical_cores = stdout_logical.decode().split(': ')[1].strip() if stdout_logical else "N/A"

        except:
            cpu_info = "Could not retrieve CPU info"
            physical_cores = "N/A"
            logical_cores = "N/A"

    else:  # Linux 系统
        try:
            # 在 Linux 上读取 /proc/cpuinfo 文件获取 CPU 信息和核心数量
            with open('/proc/cpuinfo') as f:
                physical_cores_count = 0
                logical_cores_count = 0
                cpu_info_lines = []
                for line in f:
                    if line.startswith('model name'): # 查找以 'model name'开头的行
                        if not cpu_info: # 只获取第一个 model name
                            cpu_info = line.split(': ')[1].strip()
                    elif line.startswith('cpu cores'): # 查找以 'cpu cores' 开头的行
                        physical_cores_count = int(line.split(': ')[1].strip())
                    elif line.startswith('processor'): # 查找以 'processor' 开头的行
                        logical_cores_count += 1
                physical_cores = str(physical_cores_count) if physical_cores_count > 0 else "N/A"
                logical_cores = str(logical_cores_count) if logical_cores_count > 0 else "N/A"
                if not cpu_info:
                     cpu_info = "Could not retrieve CPU info"

        except:
            cpu_info = "Could not retrieve CPU info"
            physical_cores = "N/A"
            logical_cores = "N/A"

    return f"{cpu_info} ({physical_cores} physical cores, {logical_cores} logical cores)" # 返回 CPU 信息和核心数量


# 获取内存信息的函数
def get_memory_info():
    mem_info = "" # 初始化内存信息字符串
    if platform.system() == "Windows":
        # 在 Windows 上不容易通过标准库获取，需要外部库或 PowerShell
        mem_info = "Requires external tools on Windows" # 设置提示信息
    elif platform.system() == "Darwin": # 如果是 macOS 系统
        # 在 macOS 上使用 sysctl 命令获取内存大小
        process = subprocess.Popen(['sysctl', "hw.memsize"], stdout=subprocess.PIPE, stderr=subprocess.PIPE) # 运行 sysctl 命令
        stdout, stderr = process.communicate() # 获取标准输出和标准错误
        mem_bytes = int(stdout.decode().split(': ')[1].strip()) # 解析输出，获取内存大小（字节）
        mem_gb = mem_bytes / (1024**3) # 转换为 GB
        mem_info = f"{mem_gb:.2f} GB" # 格式化输出
    else:  # Linux 系统
        try:
            # 在 Linux 上读取 /proc/meminfo 文件获取内存信息
            with open('/proc/meminfo') as f:
                total_mem_kb = 0
                available_mem_kb = 0
                for line in f:
                    if line.startswith('MemTotal'): # 查找以 'MemTotal' 开头的行
                        total_mem_kb = int(line.split(':')[1].strip().split()[0]) # 解析行，获取总内存（KB）
                    elif line.startswith('MemAvailable'): # 查找以 'MemAvailable' 开头的行
                         available_mem_kb = int(line.split(':')[1].strip().split()[0]) # 解析行，获取可用内存（KB）

                if total_mem_kb > 0:
                    total_mem_gb = total_mem_kb / (1024**2) # 转换为 GB
                    mem_info = f"{total_mem_gb:.2f} GB" # 格式化输出总内存
                    if available_mem_kb > 0:
                        available_mem_gb = available_mem_kb / (1024**2)
                        mem_info += f" (Available: {available_mem_gb:.2f} GB)" # 添加可用内存信息
                else:
                     mem_info = "Could not retrieve memory info" # 如果读取文件出错，设置错误信息

        except:
            mem_info = "Could not retrieve memory info" # 如果读取文件出错，设置错误信息
    return mem_info # 返回内存信息

# 获取 GPU 信息的函数，包括显存
def get_gpu_info():
    try:
        # 尝试使用 nvidia-smi 获取 NVIDIA GPU 信息和显存
        result = subprocess.run(['nvidia-smi', '--query-gpu=name,memory.total', '--format=csv,noheader'], capture_output=True, text=True)
        if result.returncode == 0: # 如果命令成功执行
            gpu_lines = result.stdout.strip().split('\n') # 解析输出，获取 GPU 名称和显存
            gpu_info_list = []
            for line in gpu_lines:
                name, memory = line.split(', ')
                gpu_info_list.append(f"{name} ({memory})") # 格式化 GPU 信息
            return ", ".join(gpu_info_list) if gpu_info_list else "NVIDIA GPU found, but info not listed" # 返回 GPU 信息或提示信息
        else:
             # 尝试使用 lshw 获取其他 GPU 信息 (需要安装 lshw)
            try:
                result_lshw = subprocess.run(['lshw', '-C', 'display'], capture_output=True, text=True)
                if result_lshw.returncode == 0: # 如果命令成功执行
                     # 简单解析输出中的 product 名称和显存
                    gpu_info_lines = []
                    current_gpu = {}
                    for line in result_lshw.stdout.splitlines():
                        if 'product:' in line:
                             if current_gpu:
                                 gpu_info_lines.append(f"{current_gpu.get('product', 'GPU')} ({current_gpu.get('memory', 'N/A')})")
                             current_gpu = {'product': line.split('product:')[1].strip()}
                        elif 'size:' in line and 'memory' in line:
                             current_gpu['memory'] = line.split('size:')[1].strip()

                    if current_gpu: # 添加最后一个 GPU 的信息
                        gpu_info_lines.append(f"{current_gpu.get('product', 'GPU')} ({current_gpu.get('memory', 'N/A')})")

                    return ", ".join(gpu_info_lines) if gpu_info_lines else "GPU found (via lshw), but info not parsed" # 如果找到 GPU 但信息无法解析，设置提示信息
                else:
                    return "No GPU found (checked nvidia-smi and lshw)" # 如果两个命令都找不到 GPU，设置提示信息
            except FileNotFoundError:
                 return "No GPU found (checked nvidia-smi, lshw not found)" # 如果找不到 lshw 命令，设置提示信息
    except FileNotFoundError:
        return "No GPU found (nvidia-smi not found)" # 如果找不到 nvidia-smi 命令，设置提示信息


# 获取 CUDA 版本的函数
def get_cuda_version():
    try:
        # 尝试使用 nvcc --version 获取 CUDA 版本
        result = subprocess.run(['nvcc', '--version'], capture_output=True, text=True)
        if result.returncode == 0: # 如果命令成功执行
            for line in result.stdout.splitlines():
                if 'release' in line: # 查找包含 'release' 的行
                    return line.split('release ')[1].split(',')[0] # 解析行，提取版本号
        return "CUDA not found or version not parsed" # 如果找不到 CUDA 或版本无法解析，设置提示信息
    except FileNotFoundError:
        return "CUDA not found" # 如果找不到 nvcc 命令，设置提示信息

# 获取 Python 版本的函数
def get_python_version():
    return platform.python_version() # 获取 Python 版本

# 获取 Conda 版本的函数
def get_conda_version():
    try:
        # 尝试使用 conda --version 获取 Conda 版本
        result = subprocess.run(['conda', '--version'], capture_output=True, text=True)
        if result.returncode == 0: # 如果命令成功执行
            return result.stdout.strip() # 返回 Conda 版本
        return "Conda not found or version not parsed" # 如果找不到 Conda 或版本无法解析，设置提示信息
    except FileNotFoundError:
        return "Conda not found" # 如果找不到 conda 命令，设置提示信息

# 获取物理磁盘空间信息的函数
def get_disk_space():
    try:
        total, used, free = shutil.disk_usage("/") # 获取根目录的磁盘使用情况
        total_gb = total / (1024**3) # 转换为 GB
        used_gb = used / (1024**3) # 转换为 GB
        free_gb = free / (1024**3) # 转换为 GB
        return f"Total: {total_gb:.2f} GB, Used: {used_gb:.2f} GB, Free: {free_gb:.2f} GB" # 格式化输出
    except Exception as e:
        return f"Could not retrieve disk info: {e}" # 如果获取信息出错，设置错误信息

# 获取环境信息
os_name = platform.system() # 获取操作系统名称
os_version = platform.release() # 获取操作系统版本
if os_name == "Linux":
    try:
        # 在 Linux 上尝试获取发行版和版本
        lsb_info = subprocess.run(['lsb_release', '-a'], capture_output=True, text=True)
        if lsb_info.returncode == 0: # 如果命令成功执行
            for line in lsb_info.stdout.splitlines():
                if 'Description:' in line: # 查找包含 'Description:' 的行
                    os_version = line.split('Description:')[1].strip() # 提取描述信息作为版本
                    break # 找到后退出循环
                elif 'Release:' in line: # 查找包含 'Release:' 的行
                     os_version = line.split('Release:')[1].strip() # 提取版本号
                     # 尝试获取 codename
                     try:
                         codename_info = subprocess.run(['lsb_release', '-c'], capture_output=True, text=True)
                         if codename_info.returncode == 0:
                             os_version += f" ({codename_info.stdout.split(':')[1].strip()})" # 将 codename 添加到版本信息中
                     except:
                         pass # 如果获取 codename 失败则忽略

    except FileNotFoundError:
        pass # lsb_release 可能未安装，忽略错误

full_os_info = f"{os_name} {os_version}" # 组合完整的操作系统信息
cpu_info = get_cpu_info() # 调用函数获取 CPU 信息和核心数量
memory_info = get_memory_info() # 调用函数获取内存信息
gpu_info = get_gpu_info() # 调用函数获取 GPU 信息和显存
cuda_version = get_cuda_version() # 调用函数获取 CUDA 版本
python_version = get_python_version() # 调用函数获取 Python 版本
conda_version = get_conda_version() # 调用函数获取 Conda 版本
disk_info = get_disk_space() # 调用函数获取物理磁盘空间信息


# 创建用于存储数据的字典
env_data = {
    "项目": [ # 项目名称列表
        "操作系统",
        "CPU 信息",
        "内存信息",
        "GPU 信息",
        "CUDA 信息",
        "Python 版本",
        "Conda 版本",
        "物理磁盘空间" # 添加物理磁盘空间
    ],
    "信息": [ # 对应的信息列表
        full_os_info,
        cpu_info,
        memory_info,
        gpu_info,
        cuda_version,
        python_version,
        conda_version,
        disk_info # 添加物理磁盘空间信息
    ]
}

# 创建一个 pandas DataFrame
df = pd.DataFrame(env_data)

# 打印表格
print("### 环境信息") # 打印标题
print(df.to_markdown(index=False)) # 将 DataFrame 转换为 Markdown 格式并打印，不包含索引

Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
[0m### 环境信息
| 项目         | 信息                                                                               |
|:-------------|:-----------------------------------------------------------------------------------|
| 操作系统     | Linux Ubuntu 22.04.4 LTS                                                           |
| CPU 信息     | 11th Gen Intel(R) Core(TM) i5-1135G7 @ 2.40GHz (1 physical cores, 2 logical cores) |
| 内存信息     | 3.78 GB (Available: 2.56 GB)                                                       |
| GPU 信息     | No GPU found (nvidia-smi not found)                                                |
| CUDA 信息    | CUDA not found                                                                     |
| Python 版本  | 3.10.18                                                                            |
| Conda 版本   | conda 24.4.0                                                                       |
| 物理磁盘空间 | Total: 56.91 GB, Us

## Python 对象、基本类型和变量

> **核心概念**：Python 中的一切都是**对象**，每个对象都有一个**类型**。这种设计使得Python非常适合大模型开发，因为我们可以轻松处理各种数据类型。

### 基本数据类型

在大模型开发中，我们经常需要处理以下数据类型：

#### 数值类型
- **`int`**（整数类型）
  - `10` - 表示用户ID、token数量等
  - `-3` - 表示错误代码、偏移量等
- **`float`**（浮点数类型）
  - `7.41` - 表示模型置信度、相似度分数等
  - `-0.006` - 表示损失值、梯度等

#### 文本类型
- **`str`**（字符串类型）- 大模型开发中最常用的类型
  - `'这是一个使用单引号的字符串'` - 单行文本
  - `"这是一个使用双引号的字符串"` - 单行文本
  - `'''这是一个使用单引号的三引号字符串'''` - 多行文本，常用于提示词
  - `"""这是一个使用双引号的三引号字符串"""` - 多行文本，常用于文档字符串

#### 逻辑类型
- **`bool`**（布尔值类型）
  - `True` - 表示成功、启用等状态
  - `False` - 表示失败、禁用等状态
- **`NoneType`**（空值类型）
  - `None` - 表示缺失值、未初始化等

### 变量命名规则

在 Python 中，**变量**是你在代码中指定的名称，它映射到特定的**对象**、对象**实例**或值。

#### 命名规范
- 变量名只能包含字母、下划线（`_`）或数字
- 变量名必须以字母或下划线开头
- 不能有空格、破折号或其他特殊字符
- 建议使用有意义的名称，如 `user_prompt`、`api_response`、`model_config`

#### 大模型开发中的变量命名建议
```python
# 推荐的命名方式
user_input = "请介绍一下Python"
api_key = "sk-..."
model_name = "gpt-3.5-turbo"
max_tokens = 1000
temperature = 0.7
```

<hr>

## 基本操作符

> **重要概念**：操作符是Python中用于对数据进行运算的特殊符号。在大模型开发中，我们经常使用这些操作符来处理数据、控制流程和进行逻辑判断。

### 算术操作符
用于数值计算，在大模型开发中常用于：
- **`+`**（加法）- 合并文本、计算总数
- **`-`**（减法）- 计算差值、偏移量
- **`*`**（乘法）- 重复文本、计算倍数
- **`/`**（除法）- 计算平均值、比例
- **`**`**（幂运算）- 计算指数、复杂数学运算

### 赋值操作符
用于给变量赋值和更新值：
- **`=`**（赋值）- 将值赋给变量
- **`+=`**（相加并重新赋值）- 累加操作，常用于计数器
- **`-=`**（相减并重新赋值）- 递减操作
- **`*=`**（相乘并重新赋值）- 倍数操作

### 比较操作符
用于比较两个值，返回 `True` 或 `False`：
- **`==`**（等于）- 检查两个值是否相等
- **`!=`**（不等于）- 检查两个值是否不相等
- **`<`**（小于）- 数值比较
- **`<=`**（小于等于）- 数值比较
- **`>`**（大于）- 数值比较
- **`>=`**（大于等于）- 数值比较

### 操作符优先级

当在单个表达式中使用多个操作符时，**操作符优先级**决定表达式的哪些部分按什么顺序求值。优先级较高的操作符先求值（就像数学中的 PEMDAS）。相同优先级的操作符从左到右求值。

**优先级从高到低：**
1. `()` 括号，用于分组
2. `**` 幂运算
3. `*`, `/` 乘法和除法
4. `+`, `-` 加法和减法
5. `==`, `!=`, `<`, `<=`, `>`, `>=` 比较

### 大模型开发中的实际应用

```python
# 计算API调用的总token数
prompt_tokens = 100
completion_tokens = 50
total_tokens = prompt_tokens + completion_tokens  # 使用加法

# 检查模型响应是否成功
response_status = 200
is_success = response_status == 200  # 使用比较操作符

# 累积处理的消息数量
message_count = 0
message_count += 1  # 使用递增操作符
```

> 参考：[Python操作符优先级官方文档](https://docs.python.org/3/reference/expressions.html#operator-precedence)

In [2]:
# 大模型开发中的数值变量示例
# 这些变量在大模型应用中常用于配置参数和计算结果

num1 = 10      # 整数：10 - 可用于表示最大重试次数、批次大小等
num2 = -3      # 整数：-3 - 可用于表示错误代码、偏移量等
num3 = 7.41    # 浮点数：7.41 - 可用于表示模型温度参数、置信度等
num4 = -.6     # 浮点数：-0.6 - 可用于表示学习率、损失值等（可省略小数点前的0）
num5 = 7       # 整数：7 - 可用于表示上下文长度、最大轮数等
num6 = 3       # 整数：3 - 可用于表示最小长度、重试次数等
num7 = 11.11   # 浮点数：11.11 - 可用于表示相似度分数、准确率等

In [3]:
# 加法运算示例：10 + (-3) = 7
# 在大模型开发中，加法常用于计算总token数、合并数值等
num1 + num2

7

In [4]:
# 减法运算示例：-3 - 7.41 = -10.41
# 在大模型开发中，减法常用于计算差值、偏移量等
num2 - num3

-10.41

In [5]:
# 乘法运算示例：7.41 * (-0.6) = -4.446
# 在大模型开发中，乘法常用于计算加权分数、缩放参数等
num3 * num4

-4.446

In [6]:
# 除法运算示例：-0.6 / 7 = -0.08571428571428572
# 在大模型开发中，除法常用于计算平均值、比例、归一化等
num4 / num5

-0.08571428571428572

In [7]:
# 幂运算示例：7 的 3 次方 = 343
# 在大模型开发中，幂运算常用于计算复杂度、指数衰减等
num5 ** num6

343

In [8]:
# 递增操作示例：num7 = num7 + 4
# 在大模型开发中，递增操作常用于计数器、累积统计等
num7 += 4  # 等价于 num7 = num7 + 4，将num7的值增加4
num7       # 显示更新后的值：15.11

15.11

In [9]:
# 递减操作示例：num6 = num6 - 2
# 在大模型开发中，递减操作常用于倒计时、减少计数等
num6 -= 2  # 等价于 num6 = num6 - 2，将num6的值减少2
num6       # 显示更新后的值：1

1

In [10]:
# 相乘并重新赋值示例：num3 = num3 * 5
# 在大模型开发中，这种操作常用于缩放参数、调整权重等
num3 *= 5  # 等价于 num3 = num3 * 5，将num3的值乘以5
num3       # 显示更新后的值：37.05

37.05

In [11]:
# 复杂表达式赋值示例（注意操作符优先级）
# 在大模型开发中，复杂表达式常用于计算综合分数、损失函数等
num8 = num1 + num2 * num3  # 先算乘法(num2 * num3)，再算加法(num1 + 结果)
num8                       # 显示计算结果：-101.14999999999999

-101.14999999999999

In [12]:
# 比较操作示例：检查两个表达式是否相等
# 在大模型开发中，比较操作常用于条件判断、状态检查等
num1 + num2 == num5  # (10 + (-3)) == 7，结果为 True

True

In [13]:
# 不等比较示例：检查两个表达式是否不相等
# 在大模型开发中，不等比较常用于验证数据完整性、检查错误状态等
num3 != num4  # 37.05 != -0.6，结果为 True

True

In [14]:
# 小于比较示例：检查第一个表达式是否小于第二个表达式
# 在大模型开发中，小于比较常用于阈值判断、范围检查等
num5 < num6  # 7 < 1，结果为 False

False

In [15]:
# 链式比较示例：检查多个条件是否同时满足
# 在大模型开发中，链式比较常用于复杂条件判断、参数范围验证等
5 > 3 > 1  # 等价于 (5 > 3) and (3 > 1)，结果为 True

True

In [16]:
# 复杂链式比较示例：检查多个条件是否同时满足
# 在大模型开发中，复杂链式比较常用于多维度参数验证、复杂业务逻辑判断等
5 > 3 < 4 == 3 + 1  # 等价于 (5 > 3) and (3 < 4) and (4 == 4)，结果为 True

True

In [17]:
# 大模型开发中的字符串变量示例
# 字符串是大模型开发中最常用的数据类型，用于存储文本、提示词、响应等

simple_string1 = 'an example'  # 使用单引号的字符串 - 常用于简单文本
simple_string2 = "oranges "    # 使用双引号的字符串（注意末尾有空格）- 常用于包含单引号的文本

In [18]:
# 字符串连接示例（使用加法操作符）
# 在大模型开发中，字符串连接常用于构建提示词、合并文本片段等
simple_string1 + ' of using the + operator'  # 字符串连接：'an example' + ' of using the + operator'

'an example of using the + operator'

In [19]:
# 重要概念：原字符串没有被修改（字符串是不可变的）
# 在大模型开发中，理解字符串不可变性很重要，每次操作都会创建新字符串
simple_string1  # 仍然是 'an example'，原字符串保持不变

'an example'

In [20]:
# 字符串重复示例（使用乘法操作符）
# 在大模型开发中，字符串重复常用于生成测试数据、创建分隔符等
simple_string2 * 4  # 将字符串重复4次：'oranges oranges oranges oranges '

'oranges oranges oranges oranges '

In [21]:
# 重要概念：这个字符串也没有被修改（字符串不可变性）
# 在大模型开发中，理解这一点有助于避免内存浪费和性能问题
simple_string2  # 仍然是 "oranges "，原字符串保持不变

'oranges '

In [22]:
# 字符串相等性比较示例
# 在大模型开发中，字符串比较常用于验证输入、检查状态等
simple_string1 == simple_string2  # 'an example' == 'oranges '，结果为 False

False

In [23]:
# 字符串相等性比较示例（相同内容）
# 在大模型开发中，这种比较常用于验证API响应、检查配置等
simple_string1 == 'an example'  # 'an example' == 'an example'，结果为 True

True

In [24]:
# 字符串连接并重新赋值示例
# 在大模型开发中，这种操作常用于构建动态提示词、累积文本内容等
simple_string1 += ' that re-assigned the original string'  # 修改原变量，连接新字符串
simple_string1  # 显示更新后的值：'an example that re-assigned the original string'

'an example that re-assigned the original string'

In [25]:
# 字符串重复并重新赋值示例
# 在大模型开发中，这种操作常用于生成重复内容、创建格式化文本等
simple_string2 *= 3  # 将字符串重复3次并重新赋值
simple_string2       # 显示更新后的值：'oranges oranges oranges '

'oranges oranges oranges '

In [26]:
# 重要提醒：减法、除法和递减操作符不适用于字符串
# 在大模型开发中，如果需要字符串操作，请使用专门的字符串方法

## 基本容器类型

> **核心概念**：容器是用于将其他对象组合在一起的对象。在大模型开发中，容器类型是处理结构化数据的基础。

### 可变性与不可变性

- **可变对象**：在创建后可以被修改（如列表、字典、集合）
- **不可变对象**：在创建后不能被修改（如字符串、元组、数字）


### 基本容器类型详解

#### 序列类型（有序，支持索引）
- **`str`**（字符串）
  - 不可变；通过整数索引访问
  - 项目按添加顺序存储
  - 在大模型开发中用于存储文本、提示词、响应等

- **`list`**（列表）
  - 可变；通过整数索引访问
  - 项目按添加顺序存储
  - 在大模型开发中用于存储对话历史、配置参数、处理结果等
  - 示例：`[3, 5, 6, 3, 'dog', 'cat', False]`

- **`tuple`**（元组）
  - 不可变；通过整数索引访问
  - 项目按添加顺序存储
  - 在大模型开发中用于存储固定配置、坐标、状态等
  - 示例：`(3, 5, 6, 3, 'dog', 'cat', False)`

#### 非序列类型
- **`set`**（集合）
  - 可变；无索引访问
  - 项目不按添加顺序存储
  - 只能包含不可变对象
  - 不包含重复对象
  - 在大模型开发中用于去重、集合运算等
  - 示例：`{3, 5, 6, 'dog', 'cat', False}`

- **`dict`**（字典）
  - 可变；通过键访问
  - 项目不按添加顺序存储
  - 在大模型开发中用于存储配置、API响应、键值对数据等
  - 示例：`{'name': 'Jane', 'age': 23, 'fav_foods': ['pizza', 'fruit', 'fish']}`

### 语法规则

- **列表、元组、集合**：使用逗号（,）分隔各个项目
- **字典**：使用冒号（:）分隔键和值，使用逗号（,）分隔键值对

### 序列类型操作

字符串、列表和元组都是**序列类型**，可以使用 `+`、`*`、`+=` 和 `*=` 操作符进行连接和重复操作。

In [27]:
# 大模型开发中的容器类型示例
# 这些容器类型在大模型应用中用于存储和管理各种数据

list1 = [3, 5, 6, 3, 'dog', 'cat', False]  # 列表：可变，有序，可重复 - 用于存储对话历史、配置列表等
tuple1 = (3, 5, 6, 3, 'dog', 'cat', False)  # 元组：不可变，有序，可重复 - 用于存储固定配置、坐标等
set1 = {3, 5, 6, 3, 'dog', 'cat', False}  # 集合：可变，无序，不重复 - 用于去重、集合运算等
dict1 = {'name': 'Jane', 'age': 23, 'fav_foods': ['pizza', 'fruit', 'fish']}  # 字典：键值对 - 用于存储API响应、配置参数等

In [28]:
# 列表对象中的项目按添加顺序存储
# 在大模型开发中，列表的顺序很重要，常用于保持对话历史的时序性
list1  # 显示列表内容：[3, 5, 6, 3, 'dog', 'cat', False]

[3, 5, 6, 3, 'dog', 'cat', False]

In [29]:
# 元组对象中的项目按添加顺序存储
# 在大模型开发中，元组常用于存储不可变的配置信息
tuple1  # 显示元组内容：(3, 5, 6, 3, 'dog', 'cat', False)

(3, 5, 6, 3, 'dog', 'cat', False)

In [30]:
# 集合对象中的项目不按添加顺序存储
# 另外，注意值3在这个集合对象中只出现一次（集合不包含重复项）
# 在大模型开发中，集合常用于去重、快速查找等操作
set1  # 显示集合内容：{False, 3, 5, 6, 'dog', 'cat'}

{3, 5, 6, False, 'cat', 'dog'}

In [31]:
# 字典对象中的项目不按添加顺序存储
# 在大模型开发中，字典是最常用的数据结构，用于存储API响应、配置参数等
dict1  # 显示字典内容：{'name': 'Jane', 'age': 23, 'fav_foods': ['pizza', 'fruit', 'fish']}

{'name': 'Jane', 'age': 23, 'fav_foods': ['pizza', 'fruit', 'fish']}

In [32]:
# 列表连接并重新赋值示例
# 在大模型开发中，这种操作常用于添加新的对话消息、扩展配置列表等
list1 += [5, 'grapes']  # 在列表末尾添加新元素
list1  # 显示更新后的列表：[3, 5, 6, 3, 'dog', 'cat', False, 5, 'grapes']

[3, 5, 6, 3, 'dog', 'cat', False, 5, 'grapes']

In [33]:
# 元组连接并重新赋值示例
# 在大模型开发中，这种操作会创建新的元组（因为元组不可变）
tuple1 += (5, 'grapes')  # 创建新的元组（元组不可变）
tuple1  # 显示更新后的元组：(3, 5, 6, 3, 'dog', 'cat', False, 5, 'grapes')

(3, 5, 6, 3, 'dog', 'cat', False, 5, 'grapes')

In [34]:
# 元组 (不可变)
my_tuple = (10, 20, 30)
try:
    my_tuple[0] = 5  # 尝试修改第一个元素
except TypeError as e:
    print(f"元组操作错误: {e}")
# 输出: 元组操作错误: 'tuple' object does not support item assignment

# 列表 (可变)
my_list = [10, 20, 30]
my_list[0] = 5  # 成功修改
print(f"修改后的列表: {my_list}")
# 输出: 修改后的列表: [5, 20, 30]

元组操作错误: 'tuple' object does not support item assignment
修改后的列表: [5, 20, 30]


In [35]:
# 列表重复示例（使用乘法操作符）
# 在大模型开发中，这种操作常用于生成测试数据、创建重复模式等
[1, 2, 3, 4] * 2  # 将列表重复2次：[1, 2, 3, 4, 1, 2, 3, 4]

[1, 2, 3, 4, 1, 2, 3, 4]

In [36]:
# 元组重复示例（使用乘法操作符）
# 在大模型开发中，这种操作常用于生成固定模式的配置数据
(1, 2, 3, 4) * 3  # 将元组重复3次：(1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4)

(1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4)

在 Python 中，说 **不可变** 指的是，一旦你创建了一个元组，就**无法再对它进行任何修改**。

具体来说，这意味着你不能做以下操作：

  * **修改**元组中的任何元素。
  * **添加**新的元素到元组中。
  * **删除**元组中的任何元素。

如果你尝试进行这些操作，Python 解释器会抛出一个 `TypeError` 错误，告诉你元组对象不支持这些操作。

-----

### 与列表（list）的对比

理解元组的不可变性，最好的方式就是将它与 **可变** 的列表进行对比。列表允许你随意修改其内容。

**1. 尝试修改一个元素**

```python
# 元组 (不可变)
my_tuple = (10, 20, 30)
try:
    my_tuple[0] = 5  # 尝试修改第一个元素
except TypeError as e:
    print(f"元组操作错误: {e}")
# 输出: 元组操作错误: 'tuple' object does not support item assignment

# 列表 (可变)
my_list = [10, 20, 30]
my_list[0] = 5  # 成功修改
print(f"修改后的列表: {my_list}")
# 输出: 修改后的列表: [5, 20, 30]
```

**2. 尝试添加或删除元素**

```python
# 元组 (不可变)
another_tuple = (1, 2)
try:
    another_tuple.append(3) # 尝试添加元素
except AttributeError as e:
    print(f"元组操作错误: {e}")
# 输出: 元组操作错误: 'tuple' object has no attribute 'append'

# 列表 (可变)
another_list = [1, 2]
another_list.append(3)  # 成功添加元素
del another_list[0]     # 成功删除第一个元素
print(f"修改后的列表: {another_list}")
# 输出: 修改后的列表: [2, 3]
```

-----

### 特殊情况：元组中包含可变对象

这是一个常见的混淆点。虽然元组本身是不可变的，但如果元组中包含了一个**可变对象**（比如一个列表），你**可以修改这个可变对象的内容**。

例如：

```python
my_tuple = (1, 2, [3, 4]) # 元组中的第三个元素是一个列表

# 我们不能修改元组本身
try:
    my_tuple[0] = 5
except TypeError as e:
    print(f"尝试修改元组元素: {e}")

# 但我们可以修改元组中列表的内容
my_tuple[2].append(5)
print(f"修改后的元组: {my_tuple}")
# 输出: 修改后的元组: (1, 2, [3, 4, 5])
```

在这个例子中，`my_tuple` 这个元组本身没有变（它仍然包含三个元素），但它所引用的那个列表（`[3, 4]`）内部的内容发生了改变。

### 总结

简单来说，**“元组不可变”** 指的是元组的**结构和内容无法在原地改变**，任何尝试都会失败。这使得元组非常适合用作字典的键、或在需要确保数据不被意外修改的场景中使用。

In [37]:
## 特殊情况：元组中包含可变对象
my_tuple = (1, 2, [3, 4]) # 元组中的第三个元素是一个列表

# 我们不能修改元组本身
try:
    my_tuple[0] = 5
except TypeError as e:
    print(f"尝试修改元组元素: {e}")

# 但我们可以修改元组中列表的内容
my_tuple[2].append(5)
print(f"修改后的元组: {my_tuple}")
# 输出: 修改后的元组: (1, 2, [3, 4, 5])

尝试修改元组元素: 'tuple' object does not support item assignment
修改后的元组: (1, 2, [3, 4, 5])


## 访问容器中的数据

> **核心技能**：在大模型开发中，正确访问容器数据是处理API响应、解析配置、提取信息的基础技能。

### 下标表示法（方括号）

对于字符串、列表、元组和字典，我们可以使用**下标表示法**（方括号）来访问索引处的数据。

#### 序列类型索引（字符串、列表、元组）
- 通过整数索引访问，**从0开始**作为第一项
- 支持访问项目范围，称为**切片**
- 使用**负索引**从序列的后面开始

#### 字典索引
- 通过其键进行索引
- 键可以是字符串、数字、元组等不可变类型

#### 集合限制
> **重要提醒**：集合没有索引，因此我们不能使用下标表示法来访问数据元素。集合主要用于去重和集合运算。

### 大模型开发中的实际应用
- **API响应解析**：从JSON响应中提取特定字段
- **文本处理**：从字符串中提取子字符串
- **配置管理**：从配置字典中获取参数值
- **数据清洗**：从列表中筛选和处理数据

In [38]:
# 访问序列中的第一个项目
# 在大模型开发中，这种操作常用于获取列表的第一个元素、字符串的第一个字符等
list1[0]  # 获取索引0处的元素（第一个元素）：3

3

In [39]:
# 访问序列中的最后一个项目
# 在大模型开发中，这种操作常用于获取最新的消息、最后的结果等
tuple1[-1]  # 使用负索引获取最后一个元素：'grapes'

'grapes'

In [40]:
# 访问序列中一定范围的项目（切片）
# 在大模型开发中，切片常用于提取文本片段、获取子列表等
simple_string1[3:8]  # 获取从索引3到7的字符（不包含索引8）：'examp'

'examp'

In [41]:
# 访问序列中一定范围的项目（切片）
# 在大模型开发中，这种操作常用于排除最后几个元素、获取前面的数据等
tuple1[:-3]  # 获取除最后3个元素外的所有元素：(3, 5, 6, 3, 'dog', 'cat')

(3, 5, 6, 3, 'dog', 'cat')

In [42]:
# 访问序列中一定范围的项目（切片）
# 在大模型开发中，这种操作常用于获取从某个位置开始的所有数据
list1[4:]  # 获取从索引4开始到末尾的所有元素：['dog', 'cat', False, 5, 'grapes']

['dog', 'cat', False, 5, 'grapes']

In [43]:
# 访问字典中的项目
# 在大模型开发中，这种操作常用于从API响应中提取特定字段
dict1['name']  # 通过键'name'获取对应的值：'Jane'

'Jane'

In [44]:
# 访问字典中序列的元素（嵌套访问）
# 在大模型开发中，这种操作常用于处理复杂的嵌套数据结构
dict1['fav_foods'][2]  # 先获取'fav_foods'键的值（列表），再获取索引2处的元素：'fish'

'fish'

## Python 内置函数和可调用对象

> **核心概念**：函数是Python中可以"调用"来执行操作或计算并返回另一个对象的对象。在大模型开发中，函数是构建复杂应用的基础。

### 函数调用基础

**函数**是你可以"调用"来**执行操作**或计算并**返回另一个对象**的 Python 对象。你通过在函数名右侧放置括号来调用函数。某些函数允许你在括号内传递**参数**（用逗号分隔多个参数）。在函数内部，这些参数被视为变量。

### 常用内置函数

Python 有几个有用的内置函数来帮助你处理不同的对象和环境。以下是大模型开发中常用的函数：

#### 类型和检查函数
- **`type(obj)`** - 确定对象的类型，用于调试和类型检查
- **`len(container)`** - 确定容器中有多少项目，常用于检查数据长度
- **`callable(obj)`** - 确定对象是否可调用，用于检查函数和方法

#### 数据处理函数
- **`sorted(container)`** - 从容器返回一个新列表，项目已排序
- **`sum(container)`** - 计算数字容器的总和，常用于统计计算
- **`min(container)`** - 确定容器中的最小项目
- **`max(container)`** - 确定容器中的最大项目
- **`abs(number)`** - 确定数字的绝对值

#### 表示函数
- **`repr(obj)`** - 返回对象的字符串表示，用于调试和日志记录

### 大模型开发中的应用场景

- **数据验证**：使用 `type()` 和 `len()` 验证API响应格式
- **统计分析**：使用 `sum()`、`min()`、`max()` 分析模型性能指标
- **数据处理**：使用 `sorted()` 对结果进行排序
- **调试支持**：使用 `repr()` 输出调试信息

> 完整的内置函数列表：[Python官方文档](https://docs.python.org/3/library/functions.html)

还有定义你自己的函数和可调用对象的不同方法，我们稍后将探讨。

In [45]:
# 使用 type() 函数确定对象的类型
# 在大模型开发中，type()常用于验证API响应的数据类型
type(simple_string1)  # 返回字符串对象的类型：<class 'str'>

str

In [46]:
# 使用 len() 函数确定容器中有多少项目
# 在大模型开发中，len()常用于检查数据长度、验证输入等
len(dict1)  # 返回字典中键值对的数量：3

3

In [47]:
# 使用 len() 函数确定容器中有多少项目
# 在大模型开发中，len()常用于检查文本长度、计算token数量等
len(simple_string2)  # 返回字符串中字符的数量：24

24

In [48]:
# 使用 callable() 函数确定对象是否可调用
# 在大模型开发中，callable()常用于检查API方法、验证函数等
callable(len)  # 检查 len 函数是否可调用：True

True

In [49]:
# 使用 callable() 函数确定对象是否可调用
# 在大模型开发中，callable()常用于检查对象是否为函数或方法
callable(dict1)  # 检查字典对象是否可调用：False

False

In [50]:
# 使用 sorted() 函数从容器返回一个新列表，项目已排序
# 在大模型开发中，sorted()常用于对结果进行排序、分析数据分布等
sorted([10, 1, 3.6, 7, 5, 2, -3])  # 对数字列表进行排序：[-3, 1, 2, 3.6, 5, 7, 10]

[-3, 1, 2, 3.6, 5, 7, 10]

In [51]:
# 使用 sorted() 函数从容器返回一个新列表，项目已排序
# - 注意大写字符串排在前面（ASCII码顺序）
# 在大模型开发中，sorted()常用于对文本数据进行排序、组织结果等
sorted(['dogs', 'cats', 'zebras', 'Chicago', 'California', 'ants', 'mice'])  # 对字符串列表进行排序：['California', 'Chicago', 'ants', 'cats', 'dogs', 'mice', 'zebras']

['California', 'Chicago', 'ants', 'cats', 'dogs', 'mice', 'zebras']

In [52]:
# 使用 sum() 函数计算数字容器的总和
# 在大模型开发中，sum()常用于计算总token数、统计指标等
sum([10, 1, 3.6, 7, 5, 2, -3])  # 计算列表中所有数字的总和：25.6

25.6

In [53]:
# 使用 min() 函数确定容器中的最小项目
# 在大模型开发中，min()常用于找到最小值、分析数据范围等
min([10, 1, 3.6, 7, 5, 2, -3])  # 找到列表中的最小值：-3

-3

In [54]:
# 使用 min() 函数确定容器中的最小项目
# 在大模型开发中，min()常用于字符串比较、找到最小/最大文本等
min(['g', 'z', 'a', 'y'])  # 找到字符串列表中的最小字符（按字母顺序）：'a'

'a'

In [55]:
# 使用 max() 函数确定容器中的最大项目
# 在大模型开发中，max()常用于找到最大值、分析数据范围等
max([10, 1, 3.6, 7, 5, 2, -3])  # 找到列表中的最大值：10

10

In [56]:
# 使用 max() 函数确定容器中的最大项目
# 在大模型开发中，max()常用于字符串比较、找到最大字符等
max('gibberish')  # 找到字符串中的最大字符（按字母顺序）：'s'

's'

In [57]:
# 使用 abs() 函数确定数字的绝对值
# 在大模型开发中，abs()常用于计算距离、处理负数等
abs(10)  # 正数的绝对值是它本身：10

10

In [58]:
# 使用 abs() 函数确定数字的绝对值
# 在大模型开发中，abs()常用于计算误差、处理负数等
abs(-12)  # 负数的绝对值是它的相反数：12

12

In [59]:
# 使用 repr() 函数返回对象的字符串表示
# 在大模型开发中，repr()常用于调试、日志记录等
repr(set1)  # 返回集合的官方字符串表示："{False, 3, 5, 6, 'dog', 'cat'}"

"{'cat', False, 3, 5, 6, 'dog'}"

## str（字符串）对象的一些方法

> **重要技能**：字符串方法是大模型开发中最常用的工具，用于文本处理、数据清洗、格式转换等。

### 大小写转换方法
- **`.capitalize()`** - 返回字符串的大写版本（只有第一个字符大写）
- **`.upper()`** - 返回字符串的大写版本（所有字符大写）
- **`.lower()`** - 返回字符串的小写版本（所有字符小写）

### 文本分析方法
- **`.count(substring)`** - 返回子字符串在字符串中出现的次数
- **`.startswith(substring)`** - 确定字符串是否以子字符串开头
- **`.endswith(substring)`** - 确定字符串是否以子字符串结尾

### 文本替换方法
- **`.replace(old, new)`** - 返回字符串的副本，其中"old"的出现被"new"替换

### 大模型开发中的应用场景
- **文本预处理**：使用 `.lower()` 和 `.strip()` 标准化输入文本
- **数据验证**：使用 `.startswith()` 和 `.endswith()` 验证文本格式
- **内容替换**：使用 `.replace()` 清理和转换文本内容
- **统计分析**：使用 `.count()` 分析文本特征

In [60]:
# 将字符串赋值给变量
# 在大模型开发中，这种混合大小写的字符串常用于测试文本处理功能
a_string = 'tHis is a sTriNg'  # 包含大小写混合的字符串

In [61]:
# 返回字符串的大写版本（只有第一个字符大写）
# 在大模型开发中，capitalize()常用于格式化用户输入、标题等
a_string.capitalize()  # 将第一个字符大写，其余小写：'This is a string'

'This is a string'

In [62]:
# 返回字符串的大写版本（所有字符大写）
# 在大模型开发中，upper()常用于标准化文本、比较等
a_string.upper()  # 将所有字符转换为大写：'THIS IS A STRING'

'THIS IS A STRING'

In [63]:
# 返回字符串的小写版本（所有字符小写）
# 在大模型开发中，lower()常用于文本标准化、预处理等
a_string.lower()  # 将所有字符转换为小写：'this is a string'

'this is a string'

In [64]:
# 重要概念：调用的方法实际上没有修改原字符串（字符串是不可变的）
# 在大模型开发中，理解字符串不可变性很重要，每次操作都会创建新字符串
a_string  # 原字符串保持不变：'tHis is a sTriNg'

'tHis is a sTriNg'

In [65]:
# 计算子字符串在字符串中出现的次数
# 在大模型开发中，count()常用于文本分析、统计字符等
a_string.count('i')  # 计算字符'i'在字符串中出现的次数：3

3

In [66]:
# 计算子字符串在字符串中某个位置之后出现的次数
# 在大模型开发中，这种操作常用于分析文本的特定部分
a_string.count('i', 7)  # 从索引7开始计算字符'i'的出现次数：1

1

In [67]:
# 计算子字符串在字符串中出现的次数
# 在大模型开发中，这种操作常用于分析关键词、短语等
a_string.count('is')  # 计算子字符串'is'在字符串中出现的次数：2

2

In [68]:
# 字符串是否以'this'开头？
# 在大模型开发中，startswith()常用于验证输入格式、检查前缀等
a_string.startswith('this')  # 检查字符串是否以'this'开头（区分大小写）：False

False

In [69]:
# 小写字符串是否以'this'开头？
# 在大模型开发中，这种链式调用常用于文本预处理和验证
a_string.lower().startswith('this')  # 先转换为小写，再检查是否以'this'开头：True

True

In [70]:
# 字符串是否以'Ng'结尾？
# 在大模型开发中，endswith()常用于验证文件格式、检查后缀等
a_string.endswith('Ng')  # 检查字符串是否以'Ng'结尾（区分大小写）：True

True

In [71]:
# 返回字符串的版本，其中子字符串被其他内容替换
# 在大模型开发中，replace()常用于文本清理、内容替换等
a_string.replace('is', 'XYZ')  # 将所有'is'替换为'XYZ'：'tHXYZ XYZ a sTriNg'

'tHXYZ XYZ a sTriNg'

In [72]:
# 返回字符串的版本，其中子字符串被其他内容替换
# 在大模型开发中，replace()常用于字符替换、文本转换等
a_string.replace('i', '!')  # 将所有'i'替换为'!'：'tH!s !s a sTr!Ng'

'tH!s !s a sTr!Ng'

In [73]:
# 返回字符串的版本，其中前2个出现的子字符串被其他内容替换
# 在大模型开发中，这种限制替换次数常用于精确控制文本修改
a_string.replace('i', '!', 2)  # 只替换前2个'i'为'!'：'tH!s !s a sTriNg'

'tH!s !s a sTriNg'

## list（列表）对象的一些方法

> **重要技能**：列表方法是大模型开发中处理数据集合的核心工具，用于管理对话历史、配置参数、处理结果等。

### 添加元素方法
- **`.append(item)`** - 在列表末尾添加单个元素
- **`.extend([item1, item2, ...])`** - 在列表末尾添加多个元素

### 删除元素方法
- **`.remove(item)`** - 删除列表中第一个匹配的元素
- **`.pop()`** - 删除并返回列表末尾的元素
- **`.pop(index)`** - 删除并返回指定索引位置的元素

### 大模型开发中的应用场景
- **对话管理**：使用 `append()` 添加新的对话消息
- **数据处理**：使用 `extend()` 批量添加处理结果
- **历史清理**：使用 `pop()` 和 `remove()` 管理对话历史长度
- **配置管理**：动态添加和删除配置参数

In [74]:
# 大模型开发中的列表方法示例

# 创建一个对话历史列表
conversation_history = []

# 使用 append() 添加单个消息
conversation_history.append({"role": "user", "content": "你好"})
conversation_history.append({"role": "assistant", "content": "你好！有什么可以帮助你的吗？"})

print("添加消息后的对话历史:")
for i, msg in enumerate(conversation_history):
    print(f"{i+1}. {msg['role']}: {msg['content']}")

# 使用 extend() 批量添加消息
new_messages = [
    {"role": "user", "content": "请介绍一下Python"},
    {"role": "assistant", "content": "Python是一种高级编程语言..."},
    {"role": "user", "content": "谢谢"}
]
conversation_history.extend(new_messages)

print("\n批量添加后的对话历史:")
for i, msg in enumerate(conversation_history):
    print(f"{i+1}. {msg['role']}: {msg['content']}")

# 使用 pop() 删除最后一条消息
last_message = conversation_history.pop()
print(f"\n删除的最后一条消息: {last_message['content']}")

# 使用 remove() 删除特定消息
conversation_history.remove({"role": "user", "content": "请介绍一下Python"})
print("\n删除特定消息后的对话历史:")
for i, msg in enumerate(conversation_history):
    print(f"{i+1}. {msg['role']}: {msg['content']}")

# 使用 pop(index) 删除指定位置的消息
if len(conversation_history) > 0:
    first_message = conversation_history.pop(0)
    print(f"\n删除的第一条消息: {first_message['content']}")

print(f"\n最终对话历史长度: {len(conversation_history)}")


添加消息后的对话历史:
1. user: 你好
2. assistant: 你好！有什么可以帮助你的吗？

批量添加后的对话历史:
1. user: 你好
2. assistant: 你好！有什么可以帮助你的吗？
3. user: 请介绍一下Python
4. assistant: Python是一种高级编程语言...
5. user: 谢谢

删除的最后一条消息: 谢谢

删除特定消息后的对话历史:
1. user: 你好
2. assistant: 你好！有什么可以帮助你的吗？
3. assistant: Python是一种高级编程语言...

删除的第一条消息: 你好

最终对话历史长度: 2


## set（集合）对象的一些方法

> **重要技能**：集合方法在大模型开发中用于去重、集合运算、数据比较等操作，特别适合处理唯一值集合。

### 添加元素方法
- **`.add(item)`** - 向集合添加单个元素
- **`.update([item1, item2, ...])`** - 向集合添加多个元素
- **`.update(set2, set3, ...)`** - 将多个集合的元素添加到当前集合

### 删除元素方法
- **`.remove(item)`** - 从集合中删除指定元素
- **`.pop()`** - 删除并返回集合中的随机元素

### 集合运算方法
- **`.difference(set2)`** - 返回在当前集合中但不在另一个集合中的元素
- **`.intersection(set2)`** - 返回两个集合的交集
- **`.union(set2)`** - 返回两个集合的并集
- **`.symmetric_difference(set2)`** - 返回只在其中一个集合中的元素

### 集合关系方法
- **`.issuperset(set2)`** - 检查当前集合是否包含另一个集合的所有元素
- **`.issubset(set2)`** - 检查当前集合是否被另一个集合包含

### 大模型开发中的应用场景
- **去重处理**：使用 `add()` 和 `update()` 去重文本、标签等
- **数据比较**：使用集合运算比较不同数据集
- **权限管理**：使用集合关系方法检查用户权限
- **特征提取**：使用交集和差集分析文本特征


In [75]:
# 大模型开发中的集合方法示例

# 创建用于去重和分析的集合
user_keywords = {'python', 'ai', 'machine learning'}
model_keywords = {'ai', 'deep learning', 'neural network', 'python'}

print("用户关键词:", user_keywords)
print("模型关键词:", model_keywords)

# 使用 add() 添加新关键词
user_keywords.add('natural language processing')
print("\n添加新关键词后:", user_keywords)

# 使用 update() 批量添加关键词
new_keywords = ['transformer', 'attention', 'gpt']
user_keywords.update(new_keywords)
print("批量添加后:", user_keywords)

# 集合运算 - 找到共同兴趣
common_interests = user_keywords.intersection(model_keywords)
print("\n共同关键词:", common_interests)

# 集合运算 - 找到用户独有的关键词
user_only = user_keywords.difference(model_keywords)
print("用户独有关键词:", user_only)

# 集合运算 - 合并所有关键词
all_keywords = user_keywords.union(model_keywords)
print("所有关键词:", all_keywords)

# 集合运算 - 找到不重复的关键词
unique_keywords = user_keywords.symmetric_difference(model_keywords)
print("非共同关键词:", unique_keywords)

# 使用 remove() 删除特定关键词
if 'gpt' in user_keywords:
    user_keywords.remove('gpt')
    print("\n删除'gpt'后:", user_keywords)

# 使用 pop() 随机删除一个关键词
if user_keywords:
    removed_keyword = user_keywords.pop()
    print(f"随机删除的关键词: {removed_keyword}")
    print("剩余关键词:", user_keywords)

# 检查集合关系
print(f"\n模型关键词是否包含用户关键词的子集: {model_keywords.issuperset(user_keywords)}")
print(f"用户关键词是否是模型关键词的子集: {user_keywords.issubset(model_keywords)}")

print(f"\n最终用户关键词数量: {len(user_keywords)}")
print(f"最终模型关键词数量: {len(model_keywords)}")


用户关键词: {'machine learning', 'ai', 'python'}
模型关键词: {'neural network', 'deep learning', 'ai', 'python'}

添加新关键词后: {'machine learning', 'ai', 'python', 'natural language processing'}
批量添加后: {'machine learning', 'attention', 'gpt', 'natural language processing', 'transformer', 'ai', 'python'}

共同关键词: {'ai', 'python'}
用户独有关键词: {'machine learning', 'attention', 'gpt', 'natural language processing', 'transformer'}
所有关键词: {'machine learning', 'attention', 'neural network', 'gpt', 'natural language processing', 'transformer', 'ai', 'deep learning', 'python'}
非共同关键词: {'machine learning', 'neural network', 'attention', 'gpt', 'natural language processing', 'transformer', 'deep learning'}

删除'gpt'后: {'machine learning', 'attention', 'natural language processing', 'transformer', 'ai', 'python'}
随机删除的关键词: machine learning
剩余关键词: {'attention', 'natural language processing', 'transformer', 'ai', 'python'}

模型关键词是否包含用户关键词的子集: False
用户关键词是否是模型关键词的子集: False

最终用户关键词数量: 5
最终模型关键词数量: 4


## dict（字典）对象的一些方法

> **核心技能**：字典方法是大模型开发中最重要的技能之一，用于处理API响应、配置管理、数据结构等。

### 更新和添加方法
- **`.update([(key1, val1), (key2, val2), ...])`** - 通过键值对列表更新字典
- **`.update(dict2)`** - 将另一个字典的所有键值对添加到当前字典

### 获取和删除方法
- **`.pop(key)`** - 删除指定键并返回其值（如果键不存在则报错）
- **`.pop(key, default_val)`** - 删除指定键并返回其值（如果键不存在则返回默认值）
- **`.get(key)`** - 返回指定键的值（如果键不存在则返回None）
- **`.get(key, default_val)`** - 返回指定键的值（如果键不存在则返回默认值）

### 访问方法
- **`.keys()`** - 返回字典中所有键的视图
- **`.values()`** - 返回字典中所有值的视图
- **`.items()`** - 返回字典中所有键值对（元组）的视图

### 大模型开发中的应用场景
- **API响应处理**：使用 `get()` 安全获取API返回的字段
- **配置管理**：使用 `update()` 合并不同的配置文件
- **数据转换**：使用 `items()` 遍历和转换数据
- **错误处理**：使用 `pop()` 和默认值避免KeyError


In [76]:
# 大模型开发中的字典方法示例

# 模拟API配置
api_config = {
    'model': 'gpt-3.5-turbo',
    'temperature': 0.7,
    'max_tokens': 1000
}

print("初始API配置:", api_config)

# 使用 update() 合并新配置
additional_config = {
    'top_p': 0.9,
    'presence_penalty': 0.1,
    'frequency_penalty': 0.1
}
api_config.update(additional_config)
print("\n合并配置后:", api_config)

# 使用 update() 通过键值对列表更新
streaming_config = [('stream', True), ('stop', ['\\n', '###'])]
api_config.update(streaming_config)
print("\n添加流式配置后:", api_config)

# 使用 get() 安全获取配置值
model_name = api_config.get('model', 'default-model')
timeout = api_config.get('timeout', 30)  # 使用默认值

print(f"\n模型名称: {model_name}")
print(f"超时时间: {timeout} 秒")

# 模拟API响应处理
api_response = {
    'choices': [{'message': {'content': '你好，我是AI助手'}}],
    'usage': {'total_tokens': 25},
    'model': 'gpt-3.5-turbo-0613'
}

# 安全地提取响应内容
content = api_response.get('choices', [{}])[0].get('message', {}).get('content', '无响应')
tokens_used = api_response.get('usage', {}).get('total_tokens', 0)
model_used = api_response.get('model', '未知模型')

print(f"\nAPI响应内容: {content}")
print(f"使用的token数: {tokens_used}")
print(f"使用的模型: {model_used}")

# 使用 pop() 删除并获取配置项
removed_penalty = api_config.pop('presence_penalty', 0)
print(f"\n删除的presence_penalty值: {removed_penalty}")

# 尝试删除不存在的键（使用默认值）
debug_mode = api_config.pop('debug', False)
print(f"调试模式（默认值）: {debug_mode}")

# 使用 keys(), values(), items() 遍历配置
print("\n所有配置键:", list(api_config.keys()))
print("所有配置值:", list(api_config.values()))

print("\n完整配置项:")
for key, value in api_config.items():
    print(f"  {key}: {value}")

# 统计配置信息
numeric_configs = {k: v for k, v in api_config.items() if isinstance(v, (int, float))}
string_configs = {k: v for k, v in api_config.items() if isinstance(v, str)}

print(f"\n数值型配置数量: {len(numeric_configs)}")
print(f"字符串型配置数量: {len(string_configs)}")
print(f"总配置项数量: {len(api_config)}")


初始API配置: {'model': 'gpt-3.5-turbo', 'temperature': 0.7, 'max_tokens': 1000}

合并配置后: {'model': 'gpt-3.5-turbo', 'temperature': 0.7, 'max_tokens': 1000, 'top_p': 0.9, 'presence_penalty': 0.1, 'frequency_penalty': 0.1}

添加流式配置后: {'model': 'gpt-3.5-turbo', 'temperature': 0.7, 'max_tokens': 1000, 'top_p': 0.9, 'presence_penalty': 0.1, 'frequency_penalty': 0.1, 'stream': True, 'stop': ['\\n', '###']}

模型名称: gpt-3.5-turbo
超时时间: 30 秒

API响应内容: 你好，我是AI助手
使用的token数: 25
使用的模型: gpt-3.5-turbo-0613

删除的presence_penalty值: 0.1
调试模式（默认值）: False

所有配置键: ['model', 'temperature', 'max_tokens', 'top_p', 'frequency_penalty', 'stream', 'stop']
所有配置值: ['gpt-3.5-turbo', 0.7, 1000, 0.9, 0.1, True, ['\\n', '###']]

完整配置项:
  model: gpt-3.5-turbo
  temperature: 0.7
  max_tokens: 1000
  top_p: 0.9
  frequency_penalty: 0.1
  stream: True
  stop: ['\\n', '###']

数值型配置数量: 5
字符串型配置数量: 1
总配置项数量: 7


## 位置参数和关键字参数

> **重要概念**：理解参数传递方式对于调用大模型API、使用Python库函数至关重要。

你可以用多种不同的方式调用函数/方法：

### 基本调用方式
- `func()` - 不带参数调用函数
- `func(arg)` - 传递一个位置参数
- `func(arg1, arg2)` - 传递两个位置参数
- `func(arg1, arg2, ..., argn)` - 传递多个位置参数

### 关键字参数调用
- `func(kwarg=value)` - 传递一个关键字参数
- `func(kwarg1=value1, kwarg2=value2)` - 传递两个关键字参数
- `func(kwarg1=value1, kwarg2=value2, ..., kwargn=valuen)` - 传递多个关键字参数

### 混合调用
- `func(arg1, arg2, kwarg1=value1, kwarg2=value2)` - 混合位置参数和关键字参数
- `obj.method()` - 对象方法调用（与函数调用规则相同）

### 重要规则

**位置参数使用时**：必须按照函数定义的顺序提供参数（函数的**签名**）

**关键字参数使用时**：可以提供任意顺序的参数，但必须指定每个参数的名称

**混合使用时**：位置参数必须在关键字参数之前

### 大模型开发中的应用
- **API调用**：`openai.chat.completions.create(model="gpt-3.5-turbo", messages=messages, temperature=0.7)`
- **函数调用**：使用关键字参数提高代码可读性
- **配置传递**：通过关键字参数传递复杂配置


In [77]:
# 位置参数和关键字参数示例

# 定义一个模拟大模型API调用的函数
def call_llm_api(model, prompt, temperature=0.7, max_tokens=1000, top_p=1.0):
    """
    模拟大模型API调用函数
    参数：
    - model: 模型名称（必需位置参数）
    - prompt: 提示词（必需位置参数）
    - temperature: 温度参数（可选关键字参数，默认0.7）
    - max_tokens: 最大token数（可选关键字参数，默认1000）
    - top_p: Top-p参数（可选关键字参数，默认1.0）
    """
    response = {
        'model': model,
        'prompt': prompt,
        'parameters': {
            'temperature': temperature,
            'max_tokens': max_tokens,
            'top_p': top_p
        },
        'response': f"使用{model}模型生成的回复..."
    }
    return response

# 1. 只使用位置参数
print("1. 只使用位置参数:")
result1 = call_llm_api("gpt-3.5-turbo", "你好，请介绍一下Python")
print(f"   模型: {result1['model']}")
print(f"   温度: {result1['parameters']['temperature']}")
print()

# 2. 混合使用位置参数和关键字参数
print("2. 混合使用位置参数和关键字参数:")
result2 = call_llm_api("gpt-4", "请写一首关于AI的诗", temperature=0.9, max_tokens=500)
print(f"   模型: {result2['model']}")
print(f"   温度: {result2['parameters']['temperature']}")
print(f"   最大tokens: {result2['parameters']['max_tokens']}")
print()

# 3. 使用关键字参数（可以任意顺序）
print("3. 使用关键字参数（任意顺序）:")
result3 = call_llm_api(
    max_tokens=800,
    model="claude-3",
    top_p=0.9,
    prompt="解释量子计算的原理",
    temperature=0.5
)
print(f"   模型: {result3['model']}")
print(f"   所有参数: {result3['parameters']}")
print()

# 4. 实际的大模型开发场景 - 配置管理
def create_chat_completion(messages, **kwargs):
    """
    创建聊天完成请求（模拟OpenAI API）
    使用**kwargs接收任意关键字参数
    """
    default_config = {
        'model': 'gpt-3.5-turbo',
        'temperature': 0.7,
        'max_tokens': 1000,
        'top_p': 1.0,
        'frequency_penalty': 0,
        'presence_penalty': 0
    }

    # 使用传入的参数更新默认配置
    config = {**default_config, **kwargs}

    return {
        'messages': messages,
        'config': config,
        'status': 'success'
    }

# 使用示例
messages = [
    {'role': 'user', 'content': '请解释机器学习的基本概念'}
]

print("4. 灵活的API配置:")
# 使用默认配置
basic_request = create_chat_completion(messages)
print(f"   默认配置: {basic_request['config']['model']}, 温度: {basic_request['config']['temperature']}")

# 自定义配置
custom_request = create_chat_completion(
    messages,
    model="gpt-4",
    temperature=0.3,
    max_tokens=2000,
    stream=True
)
print(f"   自定义配置: {custom_request['config']['model']}, 温度: {custom_request['config']['temperature']}")
print(f"   流式输出: {custom_request['config'].get('stream', False)}")

# 5. 字符串格式化中的位置参数和关键字参数
print("\n5. 字符串格式化示例:")
user_name = "Alice"
model_name = "GPT-4"
token_count = 150

# 位置参数格式化
message1 = "用户 {} 使用模型 {} 消耗了 {} 个token".format(user_name, model_name, token_count)
print(f"   位置参数: {message1}")

# 关键字参数格式化
message2 = "用户 {name} 使用模型 {model} 消耗了 {tokens} 个token".format(
    name=user_name,
    model=model_name,
    tokens=token_count
)
print(f"   关键字参数: {message2}")

# f-string格式化（推荐方式）
message3 = f"用户 {user_name} 使用模型 {model_name} 消耗了 {token_count} 个token"
print(f"   f-string: {message3}")


1. 只使用位置参数:
   模型: gpt-3.5-turbo
   温度: 0.7

2. 混合使用位置参数和关键字参数:
   模型: gpt-4
   温度: 0.9
   最大tokens: 500

3. 使用关键字参数（任意顺序）:
   模型: claude-3
   所有参数: {'temperature': 0.5, 'max_tokens': 800, 'top_p': 0.9}

4. 灵活的API配置:
   默认配置: gpt-3.5-turbo, 温度: 0.7
   自定义配置: gpt-4, 温度: 0.3
   流式输出: True

5. 字符串格式化示例:
   位置参数: 用户 Alice 使用模型 GPT-4 消耗了 150 个token
   关键字参数: 用户 Alice 使用模型 GPT-4 消耗了 150 个token
   f-string: 用户 Alice 使用模型 GPT-4 消耗了 150 个token


## 字符串格式化和占位符

> **核心技能**：字符串格式化在大模型开发中用于构建动态提示词、处理API响应、生成报告等，是最常用的技能之一。

Python提供多种字符串格式化方法，每种都有其特定的用途：

### 1. f-string格式化（推荐方式，Python 3.6+）
- **语法**：`f"文本 {variable} 更多文本"`
- **优势**：简洁、高效、可读性强
- **应用**：构建提示词模板、日志输出

### 2. .format()方法
- **位置参数**：`"文本 {} {}".format(value1, value2)`
- **关键字参数**：`"文本 {name} {age}".format(name="张三", age=25)`
- **索引参数**：`"文本 {0} {1}".format(value1, value2)`

### 3. %格式化（传统方式）
- **语法**：`"文本 %s %d" % (string_value, int_value)`
- **应用**：兼容旧代码、特定格式需求

### 大模型开发中的应用场景
- **提示词模板**：动态构建个性化提示词
- **API响应处理**：格式化输出结果
- **日志记录**：记录调用信息和错误
- **报告生成**：生成结构化的分析报告
- **多语言支持**：构建本地化文本模板


In [78]:
# 字符串格式化在大模型开发中的应用示例

# 基础数据
user_name = "张三"
model_name = "GPT-4"
input_tokens = 120
output_tokens = 380
total_tokens = input_tokens + output_tokens
cost_per_token = 0.00003
temperature = 0.7

print("=== 1. f-string格式化（推荐方式） ===")

# 基本f-string用法
basic_message = f"用户{user_name}使用{model_name}模型"
print(f"基本用法: {basic_message}")

# 表达式计算
cost_calculation = f"总成本: ${total_tokens * cost_per_token:.4f}"
print(f"表达式计算: {cost_calculation}")

# 格式化数字
formatted_numbers = f"输入tokens: {input_tokens:,}, 输出tokens: {output_tokens:,}"
print(f"数字格式化: {formatted_numbers}")

print("\n=== 2. 构建动态提示词模板 ===")

# 个性化提示词模板
def create_personalized_prompt(user_name, user_role, topic, style="professional"):
    """创建个性化提示词"""
    prompt_template = f"""
你是一位专业的AI助手，正在为{user_role} {user_name}提供帮助。

用户背景: {user_role}
讨论主题: {topic}
回答风格: {style}

请以{style}的风格，为{user_name}详细解释{topic}的相关内容。
请确保内容准确、易懂，并适合{user_role}的专业水平。
"""
    return prompt_template.strip()

# 使用示例
prompt1 = create_personalized_prompt("李博士", "数据科学家", "深度学习优化技术", "技术性")
print("个性化提示词:")
print(prompt1[:150] + "...")

print("\n=== 3. .format()方法应用 ===")

# 位置参数
status_report = "模型{}在{}数据集上的准确率为{:.2%}".format(model_name, "测试", 0.9234)
print(f"位置参数: {status_report}")

# 关键字参数
detailed_report = """
API调用报告:
- 用户: {user}
- 模型: {model}
- 输入tokens: {input_tokens:,}
- 输出tokens: {output_tokens:,}
- 总tokens: {total_tokens:,}
- 温度参数: {temp}
- 总成本: ${cost:.4f}
""".format(
    user=user_name,
    model=model_name,
    input_tokens=input_tokens,
    output_tokens=output_tokens,
    total_tokens=total_tokens,
    temp=temperature,
    cost=total_tokens * cost_per_token
)
print("关键字参数:", detailed_report)

print("\n=== 4. 实际应用场景 ===")

# 场景1: API日志记录
import datetime

def log_api_call(user, model, tokens, status, error=None):
    """记录API调用日志"""
    timestamp = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")

    if error:
        log_message = f"[{timestamp}] ERROR - 用户:{user}, 模型:{model}, 错误:{error}"
    else:
        log_message = f"[{timestamp}] SUCCESS - 用户:{user}, 模型:{model}, tokens:{tokens}, 状态:{status}"

    return log_message

# 成功调用日志
success_log = log_api_call(user_name, model_name, total_tokens, "completed")
print("成功日志:", success_log)

# 错误调用日志
error_log = log_api_call(user_name, model_name, 0, "failed", "API rate limit exceeded")
print("错误日志:", error_log)

# 场景2: 多语言提示词模板
def create_multilingual_prompt(language, task, context):
    """创建多语言提示词模板"""
    templates = {
        'chinese': f"请用中文{task}以下内容：{context}",
        'english': f"Please {task} the following content in English: {context}",
        'japanese': f"以下の内容を日本語で{task}してください：{context}"
    }
    return templates.get(language, templates['chinese'])

# 多语言示例
chinese_prompt = create_multilingual_prompt('chinese', '总结', '人工智能的发展历程')
english_prompt = create_multilingual_prompt('english', 'summarize', 'the development of artificial intelligence')

print(f"\n中文提示词: {chinese_prompt}")
print(f"英文提示词: {english_prompt}")

# 场景3: 性能监控报告
def generate_performance_report(model_stats):
    """生成性能监控报告"""
    report = f"""
🤖 模型性能报告

📊 基础指标:
   • 模型名称: {model_stats['name']}
   • 处理请求: {model_stats['requests']:,} 次
   • 平均响应时间: {model_stats['avg_response_time']:.2f}ms
   • 成功率: {model_stats['success_rate']:.1%}

💰 成本分析:
   • 总tokens: {model_stats['total_tokens']:,}
   • 平均每请求tokens: {model_stats['avg_tokens_per_request']:.0f}
   • 总成本: ${model_stats['total_cost']:.2f}
   • 平均每请求成本: ${model_stats['avg_cost_per_request']:.4f}

🔥 热门功能:
   • 最常用功能: {model_stats['top_feature']}
   • 使用次数: {model_stats['top_feature_count']:,}
"""
    return report

# 模拟性能数据
performance_data = {
    'name': 'GPT-4 Turbo',
    'requests': 15847,
    'avg_response_time': 1234.5,
    'success_rate': 0.9876,
    'total_tokens': 2450000,
    'avg_tokens_per_request': 154.6,
    'total_cost': 73.5,
    'avg_cost_per_request': 0.00464,
    'top_feature': '代码生成',
    'top_feature_count': 3421
}

performance_report = generate_performance_report(performance_data)
print("\n=== 性能监控报告 ===")
print(performance_report)


=== 1. f-string格式化（推荐方式） ===
基本用法: 用户张三使用GPT-4模型
表达式计算: 总成本: $0.0150
数字格式化: 输入tokens: 120, 输出tokens: 380

=== 2. 构建动态提示词模板 ===
个性化提示词:
你是一位专业的AI助手，正在为数据科学家 李博士提供帮助。

用户背景: 数据科学家
讨论主题: 深度学习优化技术
回答风格: 技术性

请以技术性的风格，为李博士详细解释深度学习优化技术的相关内容。
请确保内容准确、易懂，并适合数据科学家的专业水平。...

=== 3. .format()方法应用 ===
位置参数: 模型GPT-4在测试数据集上的准确率为92.34%
关键字参数: 
API调用报告:
- 用户: 张三
- 模型: GPT-4
- 输入tokens: 120
- 输出tokens: 380
- 总tokens: 500
- 温度参数: 0.7
- 总成本: $0.0150


=== 4. 实际应用场景 ===
成功日志: [2025-10-09 10:14:10] SUCCESS - 用户:张三, 模型:GPT-4, tokens:500, 状态:completed
错误日志: [2025-10-09 10:14:10] ERROR - 用户:张三, 模型:GPT-4, 错误:API rate limit exceeded

中文提示词: 请用中文总结以下内容：人工智能的发展历程
英文提示词: Please summarize the following content in English: the development of artificial intelligence

=== 性能监控报告 ===

🤖 模型性能报告

📊 基础指标:
   • 模型名称: GPT-4 Turbo
   • 处理请求: 15,847 次
   • 平均响应时间: 1234.50ms
   • 成功率: 98.8%

💰 成本分析:
   • 总tokens: 2,450,000
   • 平均每请求tokens: 155
   • 总成本: $73.50
   • 平均每请求成本: $0.0046

🔥 热门功能:
   • 最常用功能: 代码生成
   • 使用次数: 3,421



## Python "for循环"

> **核心概念**：for循环是Python中用于遍历数据集合的强大工具，在大模型开发中用于处理对话历史、批量处理数据、分析结果等。

使用**for循环**可以轻松地**迭代**一个项目集合。我们定义的字符串、列表、元组、集合和字典都是**可迭代**的容器。

### 基本语法
```python
for item in container:
    # 处理每个项目
    pass
```

### 工作原理
for循环会遍历指定的容器，一次一个项目，并为当前项目提供一个临时变量。你可以像使用普通变量一样使用这个临时变量。

### 大模型开发中的应用场景
- **处理对话历史**：遍历消息列表，分析对话模式
- **批量处理**：对多个文档或文本进行相同的处理
- **数据分析**：统计和分析模型输出结果
- **配置管理**：遍历配置项进行验证和设置
- **API响应处理**：处理批量API调用的结果


In [79]:
# for循环在大模型开发中的应用示例

print("=== 1. 基本for循环用法 ===")

# 遍历字符串
model_name = "GPT-4"
print(f"模型名称 '{model_name}' 的每个字符:")
for char in model_name:
    print(f"  字符: {char}")

# 遍历列表
supported_models = ["gpt-3.5-turbo", "gpt-4", "claude-3", "gemini-pro"]
print(f"\n支持的模型列表:")
for model in supported_models:
    print(f"  ✓ {model}")

print("\n=== 2. 处理对话历史 ===")

# 模拟对话历史
conversation = [
    {"role": "user", "content": "你好", "timestamp": "2024-01-01 10:00:00"},
    {"role": "assistant", "content": "你好！有什么可以帮助你的吗？", "timestamp": "2024-01-01 10:00:01"},
    {"role": "user", "content": "请介绍一下Python", "timestamp": "2024-01-01 10:00:30"},
    {"role": "assistant", "content": "Python是一种高级编程语言...", "timestamp": "2024-01-01 10:00:32"}
]

print("对话历史分析:")
user_messages = 0
assistant_messages = 0
total_characters = 0

for message in conversation:
    print(f"[{message['timestamp']}] {message['role']}: {message['content'][:30]}...")

    # 统计信息
    if message['role'] == 'user':
        user_messages += 1
    elif message['role'] == 'assistant':
        assistant_messages += 1

    total_characters += len(message['content'])

print(f"\n对话统计:")
print(f"  用户消息: {user_messages} 条")
print(f"  助手消息: {assistant_messages} 条")
print(f"  总字符数: {total_characters} 个")

print("\n=== 3. 批量处理文本数据 ===")

# 模拟要处理的文本列表
texts_to_process = [
    "人工智能是未来科技的核心",
    "机器学习正在改变各个行业",
    "深度学习在图像识别中表现优异",
    "自然语言处理让机器理解人类语言"
]

print("文本处理结果:")
processed_results = []

for i, text in enumerate(texts_to_process, 1):
    # 模拟文本处理（计算长度、单词数等）
    char_count = len(text)
    word_count = len(text.split())

    # 简单的情感分析（模拟）
    positive_keywords = ['优异', '改变', '核心', '未来']
    sentiment_score = sum(1 for keyword in positive_keywords if keyword in text)

    result = {
        'id': i,
        'text': text,
        'char_count': char_count,
        'word_count': word_count,
        'sentiment_score': sentiment_score
    }

    processed_results.append(result)
    print(f"  文本{i}: {char_count}字符, {word_count}词, 情感分数:{sentiment_score}")

print("\n=== 4. 遍历字典配置 ===")

# API配置字典
api_configs = {
    'gpt-3.5-turbo': {
        'max_tokens': 4096,
        'temperature': 0.7,
        'cost_per_token': 0.0000015,
        'speed': 'fast'
    },
    'gpt-4': {
        'max_tokens': 8192,
        'temperature': 0.7,
        'cost_per_token': 0.00003,
        'speed': 'medium'
    },
    'claude-3': {
        'max_tokens': 100000,
        'temperature': 0.7,
        'cost_per_token': 0.000008,
        'speed': 'fast'
    }
}

print("模型配置比较:")
for model_name, config in api_configs.items():
    print(f"\n📋 {model_name}:")
    for key, value in config.items():
        if key == 'cost_per_token':
            print(f"    {key}: ${value:.6f}")
        else:
            print(f"    {key}: {value}")

print("\n=== 5. 使用enumerate()获取索引 ===")

# 处理API响应列表
api_responses = [
    {"status": "success", "tokens": 150, "response_time": 1.2},
    {"status": "success", "tokens": 220, "response_time": 1.8},
    {"status": "error", "tokens": 0, "response_time": 0.5},
    {"status": "success", "tokens": 180, "response_time": 1.5}
]

print("API调用结果分析:")
successful_calls = 0
total_tokens = 0
total_time = 0

for index, response in enumerate(api_responses, 1):
    status_emoji = "✅" if response["status"] == "success" else "❌"
    print(f"  调用{index}: {status_emoji} {response['status']} - "
          f"tokens:{response['tokens']}, 时间:{response['response_time']}s")

    if response["status"] == "success":
        successful_calls += 1
        total_tokens += response["tokens"]

    total_time += response["response_time"]

print(f"\n总结:")
print(f"  成功率: {successful_calls}/{len(api_responses)} ({successful_calls/len(api_responses)*100:.1f}%)")
print(f"  平均tokens: {total_tokens/successful_calls:.0f}")
print(f"  总耗时: {total_time:.1f}s")

print("\n=== 6. 使用range()生成数字序列 ===")

# 模拟批量生成提示词
print("批量生成个性化提示词:")
user_types = ["学生", "教师", "研究员", "工程师", "产品经理"]

for i in range(5):
    user_type = user_types[i]
    prompt = f"你是一位专业的AI助手，正在为{user_type}提供帮助。请以适合{user_type}的方式回答问题。"
    print(f"  提示词{i+1} ({user_type}): {prompt[:40]}...")

print("\n=== 7. 嵌套循环处理复杂数据 ===")

# 模拟多模型、多任务的测试结果
test_results = {
    "gpt-3.5-turbo": {
        "文本生成": {"accuracy": 0.85, "speed": 2.1},
        "代码生成": {"accuracy": 0.78, "speed": 2.3},
        "翻译": {"accuracy": 0.92, "speed": 1.8}
    },
    "gpt-4": {
        "文本生成": {"accuracy": 0.92, "speed": 3.2},
        "代码生成": {"accuracy": 0.89, "speed": 3.5},
        "翻译": {"accuracy": 0.95, "speed": 2.9}
    }
}

print("模型性能对比:")
for model, tasks in test_results.items():
    print(f"\n🤖 {model}:")
    for task, metrics in tasks.items():
        print(f"    📝 {task}:")
        print(f"        准确率: {metrics['accuracy']:.1%}")
        print(f"        速度: {metrics['speed']:.1f}s")


=== 1. 基本for循环用法 ===
模型名称 'GPT-4' 的每个字符:
  字符: G
  字符: P
  字符: T
  字符: -
  字符: 4

支持的模型列表:
  ✓ gpt-3.5-turbo
  ✓ gpt-4
  ✓ claude-3
  ✓ gemini-pro

=== 2. 处理对话历史 ===
对话历史分析:
[2024-01-01 10:00:00] user: 你好...
[2024-01-01 10:00:01] assistant: 你好！有什么可以帮助你的吗？...
[2024-01-01 10:00:30] user: 请介绍一下Python...
[2024-01-01 10:00:32] assistant: Python是一种高级编程语言......

对话统计:
  用户消息: 2 条
  助手消息: 2 条
  总字符数: 45 个

=== 3. 批量处理文本数据 ===
文本处理结果:
  文本1: 12字符, 1词, 情感分数:2
  文本2: 12字符, 1词, 情感分数:1
  文本3: 14字符, 1词, 情感分数:1
  文本4: 15字符, 1词, 情感分数:0

=== 4. 遍历字典配置 ===
模型配置比较:

📋 gpt-3.5-turbo:
    max_tokens: 4096
    temperature: 0.7
    cost_per_token: $0.000002
    speed: fast

📋 gpt-4:
    max_tokens: 8192
    temperature: 0.7
    cost_per_token: $0.000030
    speed: medium

📋 claude-3:
    max_tokens: 100000
    temperature: 0.7
    cost_per_token: $0.000008
    speed: fast

=== 5. 使用enumerate()获取索引 ===
API调用结果分析:
  调用1: ✅ success - tokens:150, 时间:1.2s
  调用2: ✅ success - tokens:220, 时间:1.8s
  调用3: ❌ error - to

## Python "if语句"和"while循环"

> **核心概念**：条件语句和循环是大模型开发中控制程序流程的基础工具，用于条件判断、错误处理、重试机制等。

条件表达式可以与这两种**条件语句**一起使用。

### if语句
**if语句**允许你测试条件，如果条件评估为`True`则执行某些操作。你还可以为if语句提供`elif`和/或`else`子句，以便在条件评估为`False`时采取替代操作。

### while循环
**while循环**将一直循环，直到其条件表达式评估为`False`。

> **注意**：当使用while循环且条件表达式永远不会评估为`False`时，可能会"永远循环"。
>
> **注意**：由于**for循环**会遍历容器中的项目直到没有更多项目，因此无需指定"停止循环"条件。

### 大模型开发中的应用场景
- **条件判断**：根据API响应状态执行不同操作
- **错误处理**：使用if语句处理各种异常情况
- **重试机制**：使用while循环实现API调用重试
- **数据验证**：使用条件语句验证输入数据
- **流程控制**：根据用户输入或系统状态控制程序流程

In [80]:
# 大模型开发中的if语句和while循环示例

print("=== 1. if语句在API调用中的应用 ===")

def process_api_response(response):
    """处理API响应，根据状态码执行不同操作"""
    status_code = response.get('status_code', 0)

    if status_code == 200:
        print("✅ API调用成功")
        return response.get('data', {})
    elif status_code == 401:
        print("❌ 认证失败，请检查API密钥")
        return None
    elif status_code == 429:
        print("⚠️ 请求频率过高，需要等待")
        return None
    elif status_code >= 500:
        print("🔥 服务器错误，请稍后重试")
        return None
    else:
        print(f"❓ 未知错误，状态码: {status_code}")
        return None

# 模拟不同的API响应
test_responses = [
    {'status_code': 200, 'data': {'message': '成功获取数据'}},
    {'status_code': 401, 'error': 'Invalid API key'},
    {'status_code': 429, 'error': 'Rate limit exceeded'},
    {'status_code': 500, 'error': 'Internal server error'},
    {'status_code': 404, 'error': 'Not found'}
]

for response in test_responses:
    result = process_api_response(response)
    print(f"处理结果: {result}")
    print("-" * 40)

print("\n=== 2. while循环实现API重试机制 ===")

import time
import random

def call_llm_api_with_retry(prompt, max_retries=3, delay=1):
    """带重试机制的LLM API调用"""
    retry_count = 0

    while retry_count < max_retries:
        try:
            # 模拟API调用（随机成功/失败）
            success = random.choice([True, False, False])  # 33%成功率

            if success:
                print(f"✅ API调用成功 (尝试 {retry_count + 1})")
                return f"AI回复: {prompt[:20]}..."
            else:
                print(f"❌ API调用失败 (尝试 {retry_count + 1})")
                retry_count += 1

                if retry_count < max_retries:
                    print(f"⏳ 等待 {delay} 秒后重试...")
                    time.sleep(delay)
                    delay *= 2  # 指数退避

        except Exception as e:
            print(f"🔥 异常: {e}")
            retry_count += 1

    print(f"💥 达到最大重试次数 ({max_retries})，调用失败")
    return None

# 测试重试机制
test_prompts = ["请介绍一下Python", "解释机器学习", "写一首诗"]

for prompt in test_prompts:
    print(f"\n处理提示词: '{prompt}'")
    result = call_llm_api_with_retry(prompt)
    if result:
        print(f"最终结果: {result}")
    print("=" * 50)

print("\n=== 3. 复杂条件判断 - 模型选择逻辑 ===")

def select_optimal_model(task_type, text_length, budget_level):
    """根据任务类型、文本长度和预算选择最优模型"""

    # 基础条件判断
    if task_type == "代码生成":
        if text_length > 1000:
            return "gpt-4" if budget_level == "high" else "gpt-3.5-turbo"
        else:
            return "gpt-3.5-turbo"

    elif task_type == "文本摘要":
        if text_length > 5000:
            return "claude-3" if budget_level == "high" else "gpt-3.5-turbo"
        else:
            return "gpt-3.5-turbo"

    elif task_type == "翻译":
        return "gpt-3.5-turbo"  # 翻译任务通常用较便宜的模型

    elif task_type == "创意写作":
        return "gpt-4" if budget_level == "high" else "gpt-3.5-turbo"

    else:
        return "gpt-3.5-turbo"  # 默认选择

# 测试模型选择
test_cases = [
    ("代码生成", 500, "high"),
    ("代码生成", 2000, "low"),
    ("文本摘要", 3000, "medium"),
    ("文本摘要", 8000, "high"),
    ("翻译", 1000, "low"),
    ("创意写作", 500, "high"),
    ("未知任务", 1000, "medium")
]

print("模型选择测试:")
for task, length, budget in test_cases:
    model = select_optimal_model(task, length, budget)
    print(f"任务: {task:8} | 长度: {length:4} | 预算: {budget:6} | 推荐模型: {model}")

print("\n=== 4. 数据验证和错误处理 ===")

def validate_user_input(user_input, input_type="text"):
    """验证用户输入"""
    errors = []

    # 检查输入是否为空
    if not user_input or not user_input.strip():
        errors.append("输入不能为空")

    # 检查输入长度
    if len(user_input) > 10000:
        errors.append("输入过长，请控制在10000字符以内")

    # 根据类型进行特定验证
    if input_type == "email":
        if "@" not in user_input:
            errors.append("请输入有效的邮箱地址")

    elif input_type == "number":
        try:
            float(user_input)
        except ValueError:
            errors.append("请输入有效的数字")

    elif input_type == "code":
        if not any(keyword in user_input.lower() for keyword in ["def ", "class ", "import ", "if ", "for "]):
            errors.append("请输入有效的代码")

    return len(errors) == 0, errors

# 测试输入验证
test_inputs = [
    ("", "text"),
    ("hello@example.com", "email"),
    ("invalid-email", "email"),
    ("123.45", "number"),
    ("not-a-number", "number"),
    ("def hello(): print('world')", "code"),
    ("just text", "code"),
    ("a" * 15000, "text")
]

print("输入验证测试:")
for user_input, input_type in test_inputs:
    is_valid, errors = validate_user_input(user_input, input_type)
    status = "✅ 有效" if is_valid else "❌ 无效"
    print(f"{status} | 类型: {input_type:6} | 输入: '{user_input[:30]}{'...' if len(user_input) > 30 else ''}'")
    if errors:
        for error in errors:
            print(f"    错误: {error}")
    print("-" * 60)


=== 1. if语句在API调用中的应用 ===
✅ API调用成功
处理结果: {'message': '成功获取数据'}
----------------------------------------
❌ 认证失败，请检查API密钥
处理结果: None
----------------------------------------
⚠️ 请求频率过高，需要等待
处理结果: None
----------------------------------------
🔥 服务器错误，请稍后重试
处理结果: None
----------------------------------------
❓ 未知错误，状态码: 404
处理结果: None
----------------------------------------

=== 2. while循环实现API重试机制 ===

处理提示词: '请介绍一下Python'
❌ API调用失败 (尝试 1)
⏳ 等待 1 秒后重试...
❌ API调用失败 (尝试 2)
⏳ 等待 2 秒后重试...
❌ API调用失败 (尝试 3)
💥 达到最大重试次数 (3)，调用失败

处理提示词: '解释机器学习'
✅ API调用成功 (尝试 1)
最终结果: AI回复: 解释机器学习...

处理提示词: '写一首诗'
❌ API调用失败 (尝试 1)
⏳ 等待 1 秒后重试...
❌ API调用失败 (尝试 2)
⏳ 等待 2 秒后重试...
❌ API调用失败 (尝试 3)
💥 达到最大重试次数 (3)，调用失败

=== 3. 复杂条件判断 - 模型选择逻辑 ===
模型选择测试:
任务: 代码生成     | 长度:  500 | 预算: high   | 推荐模型: gpt-3.5-turbo
任务: 代码生成     | 长度: 2000 | 预算: low    | 推荐模型: gpt-3.5-turbo
任务: 文本摘要     | 长度: 3000 | 预算: medium | 推荐模型: gpt-3.5-turbo
任务: 文本摘要     | 长度: 8000 | 预算: high   | 推荐模型: claude-3
任务: 翻译       | 长度: 1000 | 预算: low  

## 列表、集合和字典推导式

> **核心技能**：推导式是Python中创建容器的简洁高效方式，在大模型开发中用于数据处理、转换、过滤等操作。

推导式（Comprehensions）是Python中创建列表、集合和字典的简洁方式，它们基于现有的可迭代对象生成新的容器。

### 列表推导式
- **语法**：`[expression for item in iterable if condition]`
- **用途**：从现有数据创建新列表，进行数据转换和过滤

### 集合推导式
- **语法**：`{expression for item in iterable if condition}`
- **用途**：创建唯一值集合，去重处理

### 字典推导式
- **语法**：`{key_expression: value_expression for item in iterable if condition}`
- **用途**：创建键值对映射，数据转换

如何阅读？例如`[resp for resp in api_responses if resp["success"]]`,从中间开始阅读，然后向两边看：

对于 (for resp in api_responses)：api_responses 中的每一个 resp。

如果 (if resp["success"])：该 resp 是成功的。

那么 ([resp ... ])：把这个 resp 收集 起来，放到新列表 successful_responses 中。

列表推导式是 Python 的核心特性之一，熟练掌握它能让您的代码更简洁、更高效！

### 大模型开发中的应用场景
- **数据处理**：快速转换和过滤API响应数据
- **文本处理**：批量处理文本，提取特征
- **配置管理**：从原始数据生成配置字典
- **数据分析**：统计和聚合数据
- **性能优化**：比传统循环更高效

In [81]:
# 大模型开发中的推导式应用示例

print("=== 1. 列表推导式 - 数据处理和转换 ===")

# 模拟API响应数据
api_responses = [
    {"model": "gpt-3.5-turbo", "tokens": 150, "cost": 0.0003, "success": True},
    {"model": "gpt-4", "tokens": 200, "cost": 0.006, "success": True},
    {"model": "claude-3", "tokens": 180, "cost": 0.00144, "success": False},
    {"model": "gpt-3.5-turbo", "tokens": 120, "cost": 0.00024, "success": True},
    {"model": "gpt-4", "tokens": 300, "cost": 0.009, "success": True}
]

# 提取所有成功的响应
successful_responses = [resp for resp in api_responses if resp["success"]]
print("成功的API调用:")
for resp in successful_responses:
    print(f"  模型: {resp['model']}, tokens: {resp['tokens']}, 成本: ${resp['cost']:.4f}")

# 计算每个模型的总成本
model_costs = {}
for resp in api_responses:
    model = resp["model"]
    if model not in model_costs:
        model_costs[model] = 0
    model_costs[model] += resp["cost"]

print(f"\n各模型总成本: {model_costs}")

# 提取高成本调用（> $0.005）
high_cost_calls = [resp for resp in api_responses if resp["cost"] > 0.005]
print(f"\n高成本调用数量: {len(high_cost_calls)}")

# 按模型分组统计
print("\n=== 2. 字典推导式 - 数据聚合和统计 ===")

# 按模型分组统计
model_stats = {}
for resp in api_responses:
    model = resp["model"]
    if model not in model_stats:
        model_stats[model] = {"total_calls": 0, "successful_calls": 0, "total_tokens": 0, "total_cost": 0}

    model_stats[model]["total_calls"] += 1
    if resp["success"]:
        model_stats[model]["successful_calls"] += 1
    model_stats[model]["total_tokens"] += resp["tokens"]
    model_stats[model]["total_cost"] += resp["cost"]

print("模型统计信息:")
for model, stats in model_stats.items():
    success_rate = stats["successful_calls"] / stats["total_calls"] * 100
    avg_tokens = stats["total_tokens"] / stats["total_calls"]
    print(f"  {model}:")
    print(f"    总调用: {stats['total_calls']}, 成功率: {success_rate:.1f}%")
    print(f"    总tokens: {stats['total_tokens']}, 平均tokens: {avg_tokens:.0f}")
    print(f"    总成本: ${stats['total_cost']:.4f}")

# 使用字典推导式创建模型性能报告
performance_report = {
    model: {
        "success_rate": stats["successful_calls"] / stats["total_calls"],
        "avg_tokens": stats["total_tokens"] / stats["total_calls"],
        "cost_per_token": stats["total_cost"] / stats["total_tokens"] if stats["total_tokens"] > 0 else 0
    }
    for model, stats in model_stats.items()
}

print(f"\n性能报告: {performance_report}")

print("\n=== 3. 集合推导式 - 去重和特征提取 ===")

# 从文本中提取关键词
texts = [
    "Python is a great programming language for AI development",
    "Machine learning with Python is very popular",
    "AI and machine learning are transforming industries",
    "Python programming is essential for data science",
    "Artificial intelligence requires strong programming skills"
]

# 提取所有单词并转换为小写
all_words = {word.lower().strip('.,!?') for text in texts for word in text.split()}
print(f"所有唯一单词 ({len(all_words)} 个): {sorted(all_words)}")

# 提取AI相关关键词
ai_keywords = {word.lower() for text in texts for word in text.split()
               if any(keyword in word.lower() for keyword in ['ai', 'python', 'machine', 'learning', 'programming'])}
print(f"\nAI相关关键词: {sorted(ai_keywords)}")

# 提取长度大于5的单词
long_words = {word for word in all_words if len(word) > 5}
print(f"\n长度大于5的单词: {sorted(long_words)}")

print("\n=== 4. 嵌套推导式 - 复杂数据处理 ===")

# 模拟多轮对话数据
conversations = [
    {
        "id": 1,
        "messages": [
            {"role": "user", "content": "你好", "tokens": 5},
            {"role": "assistant", "content": "你好！有什么可以帮助你的吗？", "tokens": 15},
            {"role": "user", "content": "请介绍一下Python", "tokens": 8},
            {"role": "assistant", "content": "Python是一种高级编程语言...", "tokens": 50}
        ]
    },
    {
        "id": 2,
        "messages": [
            {"role": "user", "content": "写一个Python函数", "tokens": 10},
            {"role": "assistant", "content": "好的，我来为你写一个Python函数...", "tokens": 30}
        ]
    }
]

# 提取所有用户消息的tokens
user_tokens = [msg["tokens"] for conv in conversations for msg in conv["messages"] if msg["role"] == "user"]
print(f"所有用户消息的tokens: {user_tokens}")

# 计算每个对话的总tokens
conversation_totals = {
    conv["id"]: sum(msg["tokens"] for msg in conv["messages"])
    for conv in conversations
}
print(f"每个对话的总tokens: {conversation_totals}")

# 提取包含特定关键词的消息
keyword_messages = [
    msg["content"] for conv in conversations
    for msg in conv["messages"]
    if "python" in msg["content"].lower()
]
print(f"包含'python'的消息: {keyword_messages}")

print("\n=== 5. 条件推导式 - 数据过滤和转换 ===")

# 模拟模型性能数据
model_performance = [
    {"name": "gpt-3.5-turbo", "accuracy": 0.85, "speed": 2.1, "cost": 0.0015},
    {"name": "gpt-4", "accuracy": 0.92, "speed": 3.2, "cost": 0.03},
    {"name": "claude-3", "accuracy": 0.89, "speed": 2.8, "cost": 0.008},
    {"name": "gemini-pro", "accuracy": 0.87, "speed": 2.5, "cost": 0.002}
]

# 找出高准确率且低成本模型
efficient_models = [
    model for model in model_performance
    if model["accuracy"] > 0.87 and model["cost"] < 0.01
]
print("高效模型（准确率>87%且成本<0.01）:")
for model in efficient_models:
    print(f"  {model['name']}: 准确率={model['accuracy']:.1%}, 成本=${model['cost']:.4f}")

# 创建模型推荐列表（基于不同标准）
fast_models = [model["name"] for model in model_performance if model["speed"] < 3.0]
accurate_models = [model["name"] for model in model_performance if model["accuracy"] > 0.9]
cheap_models = [model["name"] for model in model_performance if model["cost"] < 0.005]

print(f"\n快速模型 (<3.0s): {fast_models}")
print(f"高准确率模型 (>90%): {accurate_models}")
print(f"低成本模型 (<$0.005): {cheap_models}")

# 计算综合评分
scored_models = [
    {
        "name": model["name"],
        "score": (model["accuracy"] * 0.5 + (1/model["speed"]) * 0.3 + (1/model["cost"]) * 0.2)
    }
    for model in model_performance
]

# 按评分排序
scored_models.sort(key=lambda x: x["score"], reverse=True)
print(f"\n模型综合评分排序:")
for model in scored_models:
    print(f"  {model['name']}: {model['score']:.3f}")

print("\n=== 6. 推导式性能对比 ===")

import time

# 大量数据测试
large_data = list(range(10000))

# 传统循环方式
start_time = time.time()
result1 = []
for x in large_data:
    if x % 2 == 0:
        result1.append(x * 2)
loop_time = time.time() - start_time

# 列表推导式方式
start_time = time.time()
result2 = [x * 2 for x in large_data if x % 2 == 0]
comprehension_time = time.time() - start_time

print(f"传统循环耗时: {loop_time:.6f}秒")
print(f"列表推导式耗时: {comprehension_time:.6f}秒")
print(f"性能提升: {loop_time/comprehension_time:.2f}倍")
print(f"结果一致性: {result1 == result2}")

print(f"\n推导式在大模型开发中的优势:")
print("1. 代码更简洁易读")
print("2. 性能通常更好")
print("3. 减少中间变量")
print("4. 易于并行化处理")
print("5. 符合Python的优雅风格")


=== 1. 列表推导式 - 数据处理和转换 ===
成功的API调用:
  模型: gpt-3.5-turbo, tokens: 150, 成本: $0.0003
  模型: gpt-4, tokens: 200, 成本: $0.0060
  模型: gpt-3.5-turbo, tokens: 120, 成本: $0.0002
  模型: gpt-4, tokens: 300, 成本: $0.0090

各模型总成本: {'gpt-3.5-turbo': 0.00054, 'gpt-4': 0.015, 'claude-3': 0.00144}

高成本调用数量: 2

=== 2. 字典推导式 - 数据聚合和统计 ===
模型统计信息:
  gpt-3.5-turbo:
    总调用: 2, 成功率: 100.0%
    总tokens: 270, 平均tokens: 135
    总成本: $0.0005
  gpt-4:
    总调用: 2, 成功率: 100.0%
    总tokens: 500, 平均tokens: 250
    总成本: $0.0150
  claude-3:
    总调用: 1, 成功率: 0.0%
    总tokens: 180, 平均tokens: 180
    总成本: $0.0014

性能报告: {'gpt-3.5-turbo': {'success_rate': 1.0, 'avg_tokens': 135.0, 'cost_per_token': 2e-06}, 'gpt-4': {'success_rate': 1.0, 'avg_tokens': 250.0, 'cost_per_token': 2.9999999999999997e-05}, 'claude-3': {'success_rate': 0.0, 'avg_tokens': 180.0, 'cost_per_token': 8.000000000000001e-06}}

=== 3. 集合推导式 - 去重和特征提取 ===
所有唯一单词 (26 个): ['a', 'ai', 'and', 'are', 'artificial', 'data', 'development', 'essential', 'for', 'great'

## 从参数或其他对象创建对象

> **重要概念**：类型构造函数是大模型开发中数据类型转换的基础工具，用于处理API响应、数据清洗、格式转换等。

到目前为止我们使用的基本类型和容器都提供**类型构造函数**：

- `int()` - 整数构造函数
- `float()` - 浮点数构造函数
- `str()` - 字符串构造函数
- `list()` - 列表构造函数
- `tuple()` - 元组构造函数
- `set()` - 集合构造函数
- `dict()` - 字典构造函数

到目前为止，我们一直在使用一些语法快捷方式来定义这些内置类型的对象，因为它们非常常见。

有时，你会有一个类型的对象需要转换为另一种类型。使用你想要的对象类型的**类型构造函数**，并传入你当前拥有的对象。

### 大模型开发中的应用场景
- **API响应处理**：将JSON字符串转换为Python对象
- **数据清洗**：转换数据类型，确保数据格式正确
- **类型转换**：在不同数据类型之间进行安全转换
- **错误处理**：使用构造函数进行类型验证
- **数据标准化**：将不同格式的数据转换为统一格式

In [82]:
# 大模型开发中的类型构造函数应用示例

print("=== 1. 基本类型转换 ===")

# 字符串转数字
user_input = "123"
user_id = int(user_input)
print(f"用户ID: {user_id} (类型: {type(user_id)})")

# 数字转字符串
token_count = 1500
token_str = str(token_count)
print(f"Token字符串: '{token_str}' (类型: {type(token_str)})")

# 字符串转浮点数
confidence_score = "0.85"
confidence = float(confidence_score)
print(f"置信度: {confidence} (类型: {type(confidence)})")

print("\n=== 2. 容器类型转换 ===")

# 字符串转列表
text = "Python,AI,Machine Learning,Deep Learning"
topics = text.split(",")
print(f"主题列表: {topics}")

# 列表转集合（去重）
duplicate_tags = ["python", "ai", "python", "machine learning", "ai", "python"]
unique_tags = set(duplicate_tags)
print(f"去重后的标签: {unique_tags}")

# 列表转元组（不可变）
config_list = ["gpt-3.5-turbo", 0.7, 1000, True]
config_tuple = tuple(config_list)
print(f"配置元组: {config_tuple}")

# 字典转列表（键）
api_config = {"model": "gpt-4", "temperature": 0.7, "max_tokens": 2000}
config_keys = list(api_config.keys())
print(f"配置键: {config_keys}")

print("\n=== 3. API响应数据处理 ===")

# 模拟API响应（JSON字符串）
json_response = '{"choices": [{"message": {"content": "Hello! How can I help you?"}}], "usage": {"total_tokens": 25}}'

# 字符串转字典（实际开发中会使用json.loads()）
# 这里我们手动解析来演示类型转换
import json
response_data = json.loads(json_response)
print(f"解析后的响应: {response_data}")

# 提取特定数据并转换类型
content = str(response_data["choices"][0]["message"]["content"])
token_usage = int(response_data["usage"]["total_tokens"])
print(f"内容: {content}")
print(f"Token使用量: {token_usage}")

print("\n=== 4. 数据验证和类型转换 ===")

def safe_convert(value, target_type, default=None):
    """安全地转换数据类型"""
    try:
        return target_type(value)
    except (ValueError, TypeError) as e:
        print(f"转换失败: {value} -> {target_type.__name__}, 错误: {e}")
        return default

# 测试各种转换
test_values = ["123", "45.67", "hello", "True", "false", ""]
target_types = [int, float, str, bool, bool, int]

print("安全类型转换测试:")
for value, target_type in zip(test_values, target_types):
    result = safe_convert(value, target_type, "转换失败")
    print(f"  {value} -> {target_type.__name__}: {result}")

print("\n=== 5. 批量数据处理 ===")

# 模拟从API获取的原始数据
raw_data = [
    "user_001,150,0.85",
    "user_002,200,0.92",
    "user_003,175,0.78",
    "user_004,300,0.95",
    "user_005,125,0.88"
]

# 解析CSV格式数据
parsed_data = []
for line in raw_data:
    parts = line.split(",")
    user_data = {
        "user_id": str(parts[0]),
        "tokens": int(parts[1]),
        "confidence": float(parts[2])
    }
    parsed_data.append(user_data)

print("解析后的用户数据:")
for data in parsed_data:
    print(f"  用户: {data['user_id']}, tokens: {data['tokens']}, 置信度: {data['confidence']:.2f}")

# 提取特定字段
token_list = [data["tokens"] for data in parsed_data]
confidence_list = [data["confidence"] for data in parsed_data]

print(f"\nToken列表: {token_list}")
print(f"置信度列表: {confidence_list}")

print("\n=== 6. 配置管理中的类型转换 ===")

# 从环境变量或配置文件读取的字符串配置
env_config = {
    "MODEL_NAME": "gpt-3.5-turbo",
    "MAX_TOKENS": "1000",
    "TEMPERATURE": "0.7",
    "ENABLE_STREAMING": "true",
    "TIMEOUT": "30",
    "RETRY_COUNT": "3"
}

# 转换为适当的数据类型
config = {
    "model_name": str(env_config["MODEL_NAME"]),
    "max_tokens": int(env_config["MAX_TOKENS"]),
    "temperature": float(env_config["TEMPERATURE"]),
    "enable_streaming": env_config["ENABLE_STREAMING"].lower() == "true",
    "timeout": int(env_config["TIMEOUT"]),
    "retry_count": int(env_config["RETRY_COUNT"])
}

print("转换后的配置:")
for key, value in config.items():
    print(f"  {key}: {value} (类型: {type(value).__name__})")

print("\n=== 7. 错误处理和类型验证 ===")

def validate_and_convert_api_params(params):
    """验证并转换API参数"""
    converted_params = {}
    errors = []

    # 定义期望的类型
    expected_types = {
        "model": str,
        "max_tokens": int,
        "temperature": float,
        "top_p": float,
        "stream": bool
    }

    for key, expected_type in expected_types.items():
        if key in params:
            try:
                if expected_type == bool:
                    # 布尔值的特殊处理
                    value = str(params[key]).lower()
                    converted_params[key] = value in ["true", "1", "yes", "on"]
                else:
                    converted_params[key] = expected_type(params[key])
            except (ValueError, TypeError) as e:
                errors.append(f"参数 '{key}' 转换失败: {e}")
        else:
            errors.append(f"缺少必需参数: {key}")

    return converted_params, errors

# 测试参数转换
test_params = {
    "model": "gpt-3.5-turbo",
    "max_tokens": "1000",  # 字符串，需要转换为int
    "temperature": "0.7",  # 字符串，需要转换为float
    "top_p": 0.9,          # 已经是float
    "stream": "true"       # 字符串，需要转换为bool
}

converted_params, errors = validate_and_convert_api_params(test_params)

print("参数转换结果:")
if errors:
    print("错误:")
    for error in errors:
        print(f"  ❌ {error}")
else:
    print("✅ 所有参数转换成功")
    for key, value in converted_params.items():
        print(f"  {key}: {value} (类型: {type(value).__name__})")

print("\n=== 8. 性能优化 - 批量转换 ===")

import time

# 大量数据转换性能测试
large_string_list = [str(i) for i in range(10000)]

# 方法1: 逐个转换
start_time = time.time()
int_list1 = []
for s in large_string_list:
    int_list1.append(int(s))
method1_time = time.time() - start_time

# 方法2: 列表推导式
start_time = time.time()
int_list2 = [int(s) for s in large_string_list]
method2_time = time.time() - start_time

print(f"逐个转换耗时: {method1_time:.6f}秒")
print(f"列表推导式耗时: {method2_time:.6f}秒")
print(f"性能提升: {method1_time/method2_time:.2f}倍")
print(f"结果一致性: {int_list1 == int_list2}")

print(f"\n类型构造函数在大模型开发中的重要性:")
print("1. 数据清洗和标准化")
print("2. API参数验证和转换")
print("3. 配置文件解析")
print("4. 错误处理和容错")
print("5. 性能优化和批量处理")


=== 1. 基本类型转换 ===
用户ID: 123 (类型: <class 'int'>)
Token字符串: '1500' (类型: <class 'str'>)
置信度: 0.85 (类型: <class 'float'>)

=== 2. 容器类型转换 ===
主题列表: ['Python', 'AI', 'Machine Learning', 'Deep Learning']
去重后的标签: {'ai', 'machine learning', 'python'}
配置元组: ('gpt-3.5-turbo', 0.7, 1000, True)
配置键: ['model', 'temperature', 'max_tokens']

=== 3. API响应数据处理 ===
解析后的响应: {'choices': [{'message': {'content': 'Hello! How can I help you?'}}], 'usage': {'total_tokens': 25}}
内容: Hello! How can I help you?
Token使用量: 25

=== 4. 数据验证和类型转换 ===
安全类型转换测试:
  123 -> int: 123
  45.67 -> float: 45.67
  hello -> str: hello
  True -> bool: True
  false -> bool: True
转换失败:  -> int, 错误: invalid literal for int() with base 10: ''
   -> int: 转换失败

=== 5. 批量数据处理 ===
解析后的用户数据:
  用户: user_001, tokens: 150, 置信度: 0.85
  用户: user_002, tokens: 200, 置信度: 0.92
  用户: user_003, tokens: 175, 置信度: 0.78
  用户: user_004, tokens: 300, 置信度: 0.95
  用户: user_005, tokens: 125, 置信度: 0.88

Token列表: [150, 200, 175, 300, 125]
置信度列表: [0.85, 0.92, 0.

## 导入模块

> **核心技能**：模块导入是大模型开发的基础，用于使用各种库和框架，如OpenAI、LangChain、Pandas等。

Python的模块系统允许你组织和重用代码。在大模型开发中，你需要导入各种库来处理不同的任务。

### 基本导入方式
- `import module_name` - 导入整个模块
- `from module_name import function_name` - 导入特定函数
- `from module_name import *` - 导入模块中的所有内容（不推荐）
- `import module_name as alias` - 使用别名导入模块

### 大模型开发中常用的模块
- **`openai`** - OpenAI API客户端
- **`requests`** - HTTP请求库
- **`json`** - JSON数据处理
- **`pandas`** - 数据分析
- **`numpy`** - 数值计算
- **`langchain`** - 大模型应用框架
- **`transformers`** - Hugging Face模型库

### 最佳实践
- 按标准库、第三方库、本地模块的顺序导入
- 使用具体的导入而不是通配符导入
- 为长模块名使用有意义的别名
- 在文件顶部集中导入所有模块

In [83]:
# 导入常用模块的示例

# 导入整个模块并使用别名 (推荐方式)
import json as js  # 用于处理JSON数据，API响应常用
import requests as req # 用于发送HTTP请求，调用API
import pandas as pd # 用于数据分析和处理

# 从模块中导入特定函数或类
from datetime import datetime, timedelta # 用于处理日期和时间

# 导入特定的大模型相关库（可能需要安装）
# 请注意：这些库可能需要通过 !pip install 命令进行安装
try:
    import openai # OpenAI API客户端
    print("openai 模块已成功导入")
except ImportError:
    print("openai 模块未找到，请尝试 !pip install openai")

try:
    from langchain.prompts import PromptTemplate # LangChain提示词模板
    print("LangChain.prompts 模块已成功导入")
except ImportError:
    print("LangChain 模块未找到，请尝试 !pip install langchain")

try:
    from transformers import pipeline # Hugging Face Transformers模型 pipeline
    print("transformers 模块已成功导入")
except ImportError:
    print("transformers 模块未找到，请尝试 !pip install transformers")

# 导入NumPy用于数值计算
import numpy as np # 用于数值计算，处理张量等

# 使用导入的模块和对象
print("\n使用导入的模块:")

# 使用json模块
json_string = '{"model": "gpt-3.5-turbo", "temperature": 0.7}'
config = js.loads(json_string)
print("解析的配置:", config)

# 使用requests模块 (这里只打印类型，不实际发送请求)
# response = req.get("https://api.example.com")
print("requests模块类型:", type(req))

# 使用pandas模块
data = {'col1': [1, 2], 'col2': [3, 4]}
df = pd.DataFrame(data)
print("\nPandas DataFrame:")
display(df)

# 使用datetime对象
now = datetime.now()
print("\当前时间:", now)

# 使用PromptTemplate (如果langchain导入成功)
if 'PromptTemplate' in locals():
    template = "请以{style}的风格介绍{topic}"
    prompt_template = PromptTemplate(template=template, input_variables=["style", "topic"])
    formatted_prompt = prompt_template.format(style="幽默", topic="人工智能")
    print("\n格式化提示词:", formatted_prompt)

# 使用pipeline (如果transformers导入成功)
if 'pipeline' in locals():
    # 注意：实际使用时需要下载模型，可能会消耗时间和资源
    # text_generator = pipeline("text-generation")
    # generated_text = text_generator("Hello, I am", max_length=10)
    print("\ntransformers.pipeline 已导入，可以使用了。")


# 导入本地自定义模块的示例（假设有一个名为 my_utils.py 的文件）
# try:
#     from my_utils import process_text
#     print("\n本地模块 my_utils 已成功导入")
# except ImportError:
#     print("\n本地模块 my_utils 未找到")

print("\n模块导入示例结束")

openai 模块已成功导入
LangChain 模块未找到，请尝试 !pip install langchain
transformers 模块未找到，请尝试 !pip install transformers

使用导入的模块:
解析的配置: {'model': 'gpt-3.5-turbo', 'temperature': 0.7}
requests模块类型: <class 'module'>

Pandas DataFrame:


Unnamed: 0,col1,col2
0,1,3
1,2,4


\当前时间: 2025-10-09 10:14:17.599016

模块导入示例结束


## 异常处理

> **核心技能**：异常处理是大模型开发中必不可少的技能，用于处理API调用失败、网络错误、数据验证等各种异常情况。

异常是Python中处理错误和异常情况的机制。在大模型开发中，正确处理异常对于构建稳定的应用至关重要。

### 基本异常处理语法
```python
try:
    # 可能出错的代码
    pass
except ExceptionType as e:
    # 处理特定异常
    pass
except Exception as e:
    # 处理所有其他异常
    pass
else:
    # 没有异常时执行
    pass
finally:
    # 无论是否有异常都执行
    pass
```

### 大模型开发中常见的异常类型
- **`ConnectionError`** - 网络连接错误
- **`TimeoutError`** - 请求超时
- **`ValueError`** - 值错误（如无效参数）
- **`KeyError`** - 字典键不存在
- **`JSONDecodeError`** - JSON解析错误
- **`APIError`** - API调用错误

### 最佳实践
- 捕获具体的异常类型而不是通用的Exception
- 提供有意义的错误信息
- 实现重试机制
- 记录错误日志
- 优雅地处理失败情况

In [84]:
# 大模型开发中的异常处理示例

print("=== 1. 基本异常处理 - API调用 ===")

def call_llm_api(prompt, model="gpt-3.5-turbo"):
    """模拟LLM API调用，可能抛出各种异常"""
    import random

    # 模拟不同的异常情况
    error_type = random.choice([
        "success", "connection_error", "timeout", "rate_limit",
        "invalid_key", "server_error", "value_error"
    ])

    if error_type == "success":
        return {"content": f"AI回复: {prompt[:20]}...", "tokens": 50}
    elif error_type == "connection_error":
        raise ConnectionError("网络连接失败")
    elif error_type == "timeout":
        raise TimeoutError("请求超时")
    elif error_type == "rate_limit":
        raise Exception("API调用频率过高")
    elif error_type == "invalid_key":
        raise ValueError("无效的API密钥")
    elif error_type == "server_error":
        raise Exception("服务器内部错误")
    elif error_type == "value_error":
        raise ValueError("无效的输入参数")

# 基本异常处理
def safe_api_call(prompt):
    """安全的API调用，包含基本异常处理"""
    try:
        result = call_llm_api(prompt)
        print(f"✅ API调用成功: {result['content']}")
        return result
    except ConnectionError as e:
        print(f"❌ 连接错误: {e}")
        return None
    except TimeoutError as e:
        print(f"⏰ 超时错误: {e}")
        return None
    except ValueError as e:
        print(f"🔑 参数错误: {e}")
        return None
    except Exception as e:
        print(f"🔥 其他错误: {e}")
        return None

# 测试基本异常处理
test_prompts = ["你好", "请介绍一下Python", "写一首诗"]
for prompt in test_prompts:
    print(f"\n测试提示词: '{prompt}'")
    result = safe_api_call(prompt)
    if result:
        print(f"Token使用量: {result['tokens']}")

print("\n=== 2. 高级异常处理 - 重试机制 ===")

import time
import random

def call_llm_api_with_retry(prompt, max_retries=3, base_delay=1):
    """带重试机制的API调用"""
    retry_count = 0
    delay = base_delay

    while retry_count < max_retries:
        try:
            result = call_llm_api(prompt)
            print(f"✅ API调用成功 (尝试 {retry_count + 1})")
            return result

        except (ConnectionError, TimeoutError) as e:
            retry_count += 1
            if retry_count < max_retries:
                print(f"🔄 网络错误，{delay}秒后重试 (尝试 {retry_count + 1}/{max_retries})")
                time.sleep(delay)
                delay *= 2  # 指数退避
            else:
                print(f"💥 网络错误，达到最大重试次数: {e}")
                return None

        except ValueError as e:
            print(f"🔑 参数错误，无法重试: {e}")
            return None

        except Exception as e:
            retry_count += 1
            if retry_count < max_retries:
                print(f"🔄 服务器错误，{delay}秒后重试 (尝试 {retry_count + 1}/{max_retries})")
                time.sleep(delay)
                delay *= 2
            else:
                print(f"💥 服务器错误，达到最大重试次数: {e}")
                return None

    return None

# 测试重试机制
print("测试重试机制:")
for i in range(3):
    print(f"\n--- 测试 {i+1} ---")
    result = call_llm_api_with_retry("请介绍一下机器学习")

print("\n=== 3. 异常处理 - 数据验证 ===")

def validate_api_request(request_data):
    """验证API请求数据"""
    errors = []

    try:
        # 检查必需字段
        if "prompt" not in request_data:
            errors.append("缺少必需字段: prompt")
        elif not isinstance(request_data["prompt"], str):
            errors.append("prompt必须是字符串")
        elif len(request_data["prompt"]) == 0:
            errors.append("prompt不能为空")
        elif len(request_data["prompt"]) > 10000:
            errors.append("prompt长度不能超过10000字符")

        # 检查可选字段
        if "max_tokens" in request_data:
            try:
                max_tokens = int(request_data["max_tokens"])
                if max_tokens <= 0:
                    errors.append("max_tokens必须大于0")
                elif max_tokens > 4000:
                    errors.append("max_tokens不能超过4000")
            except (ValueError, TypeError):
                errors.append("max_tokens必须是整数")

        if "temperature" in request_data:
            try:
                temperature = float(request_data["temperature"])
                if temperature < 0 or temperature > 2:
                    errors.append("temperature必须在0-2之间")
            except (ValueError, TypeError):
                errors.append("temperature必须是数字")

        if "model" in request_data:
            valid_models = ["gpt-3.5-turbo", "gpt-4", "claude-3", "gemini-pro"]
            if request_data["model"] not in valid_models:
                errors.append(f"model必须是以下之一: {', '.join(valid_models)}")

    except Exception as e:
        errors.append(f"验证过程中发生错误: {e}")

    return len(errors) == 0, errors

# 测试数据验证
test_requests = [
    {"prompt": "你好", "max_tokens": 100, "temperature": 0.7},
    {"prompt": "", "max_tokens": 100},  # 空提示词
    {"prompt": "你好", "max_tokens": "invalid"},  # 无效的max_tokens
    {"prompt": "你好", "temperature": 3.0},  # 无效的temperature
    {"prompt": "你好", "model": "invalid-model"},  # 无效的模型
    {"max_tokens": 100},  # 缺少prompt
    {"prompt": "a" * 15000}  # 过长的prompt
]

print("API请求验证测试:")
for i, request in enumerate(test_requests, 1):
    print(f"\n测试 {i}: {request}")
    is_valid, errors = validate_api_request(request)
    if is_valid:
        print("✅ 验证通过")
    else:
        print("❌ 验证失败:")
        for error in errors:
            print(f"   - {error}")

print("\n=== 4. 异常处理 - 资源管理 ===")

class APIClient:
    """API客户端，演示资源管理"""

    def __init__(self, api_key):
        self.api_key = api_key
        self.connection_open = False
        self.request_count = 0

    def connect(self):
        """建立连接"""
        if not self.api_key:
            raise ValueError("API密钥不能为空")
        self.connection_open = True
        print("🔗 API连接已建立")

    def disconnect(self):
        """断开连接"""
        self.connection_open = False
        print("🔌 API连接已断开")

    def make_request(self, prompt):
        """发送请求"""
        if not self.connection_open:
            raise ConnectionError("API未连接")

        self.request_count += 1
        if self.request_count > 5:  # 模拟连接限制
            raise Exception("请求次数超限")

        return call_llm_api(prompt)

    def __enter__(self):
        """上下文管理器入口"""
        self.connect()
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        """上下文管理器出口"""
        self.disconnect()
        if exc_type:
            print(f"⚠️ 发生异常: {exc_type.__name__}: {exc_val}")
        return False  # 不抑制异常

# 使用上下文管理器
print("使用上下文管理器进行API调用:")
try:
    with APIClient("your-api-key") as client:
        for i in range(3):
            try:
                result = client.make_request(f"测试请求 {i+1}")
                print(f"✅ 请求 {i+1} 成功: {result['content']}")
            except Exception as e:
                print(f"❌ 请求 {i+1} 失败: {e}")
except Exception as e:
    print(f"🔥 客户端错误: {e}")

print("\n=== 5. 异常处理 - 日志记录 ===")

import logging
from datetime import datetime

# 配置日志
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(levelname)s - %(message)s',
    handlers=[
        logging.FileHandler('api_errors.log'),
        logging.StreamHandler()
    ]
)

def log_api_call(prompt, success, error=None, tokens=0):
    """记录API调用日志"""
    if success:
        logging.info(f"API调用成功 - 提示词: '{prompt[:50]}...', tokens: {tokens}")
    else:
        logging.error(f"API调用失败 - 提示词: '{prompt[:50]}...', 错误: {error}")

def monitored_api_call(prompt):
    """带监控的API调用"""
    try:
        result = call_llm_api(prompt)
        log_api_call(prompt, True, tokens=result.get('tokens', 0))
        return result
    except Exception as e:
        log_api_call(prompt, False, error=str(e))
        return None

# 测试日志记录
print("测试日志记录:")
test_prompts = ["你好", "请介绍一下Python", "写一首诗"]
for prompt in test_prompts:
    result = monitored_api_call(prompt)

print("\n=== 6. 自定义异常类 ===")

class LLMAPIError(Exception):
    """LLM API基础异常"""
    def __init__(self, message, error_code=None):
        super().__init__(message)
        self.error_code = error_code
        self.timestamp = datetime.now()

class RateLimitError(LLMAPIError):
    """频率限制异常"""
    def __init__(self, message="API调用频率过高", retry_after=None):
        super().__init__(message, "RATE_LIMIT")
        self.retry_after = retry_after

class AuthenticationError(LLMAPIError):
    """认证异常"""
    def __init__(self, message="API密钥无效"):
        super().__init__(message, "AUTH_ERROR")

class ModelNotFoundError(LLMAPIError):
    """模型不存在异常"""
    def __init__(self, model_name, message=None):
        if message is None:
            message = f"模型 '{model_name}' 不存在"
        super().__init__(message, "MODEL_NOT_FOUND")
        self.model_name = model_name

def call_llm_with_custom_exceptions(prompt, model="gpt-3.5-turbo"):
    """使用自定义异常的API调用"""
    import random

    error_type = random.choice([
        "success", "rate_limit", "auth_error", "model_not_found", "server_error"
    ])

    if error_type == "success":
        return {"content": f"AI回复: {prompt[:20]}...", "tokens": 50}
    elif error_type == "rate_limit":
        raise RateLimitError(retry_after=60)
    elif error_type == "auth_error":
        raise AuthenticationError()
    elif error_type == "model_not_found":
        raise ModelNotFoundError(model)
    else:
        raise LLMAPIError("服务器内部错误", "SERVER_ERROR")

# 测试自定义异常
print("测试自定义异常:")
for i in range(5):
    try:
        result = call_llm_with_custom_exceptions("测试")
        print(f"✅ 调用成功: {result['content']}")
    except RateLimitError as e:
        print(f"⏰ 频率限制: {e} (重试时间: {e.retry_after}秒)")
    except AuthenticationError as e:
        print(f"🔑 认证错误: {e}")
    except ModelNotFoundError as e:
        print(f"🤖 模型错误: {e} (模型: {e.model_name})")
    except LLMAPIError as e:
        print(f"🔥 API错误: {e} (错误码: {e.error_code})")
    except Exception as e:
        print(f"❓ 未知错误: {e}")

print(f"\n异常处理在大模型开发中的重要性:")
print("1. 提高系统稳定性和可靠性")
print("2. 提供更好的用户体验")
print("3. 便于问题诊断和调试")
print("4. 实现优雅的错误恢复")
print("5. 保护系统资源")


=== 1. 基本异常处理 - API调用 ===

测试提示词: '你好'
🔑 参数错误: 无效的API密钥

测试提示词: '请介绍一下Python'
⏰ 超时错误: 请求超时

测试提示词: '写一首诗'
🔥 其他错误: 服务器内部错误

=== 2. 高级异常处理 - 重试机制 ===
测试重试机制:

--- 测试 1 ---
🔑 参数错误，无法重试: 无效的输入参数

--- 测试 2 ---
🔄 网络错误，1秒后重试 (尝试 2/3)
🔄 服务器错误，2秒后重试 (尝试 3/3)
💥 服务器错误，达到最大重试次数: 服务器内部错误

--- 测试 3 ---
🔄 网络错误，1秒后重试 (尝试 2/3)
🔄 服务器错误，2秒后重试 (尝试 3/3)


2025-10-09 10:14:23,647 - ERROR - API调用失败 - 提示词: '你好...', 错误: 无效的API密钥
2025-10-09 10:14:23,649 - ERROR - API调用失败 - 提示词: '请介绍一下Python...', 错误: API调用频率过高
2025-10-09 10:14:23,649 - ERROR - API调用失败 - 提示词: '写一首诗...', 错误: 网络连接失败


💥 网络错误，达到最大重试次数: 网络连接失败

=== 3. 异常处理 - 数据验证 ===
API请求验证测试:

测试 1: {'prompt': '你好', 'max_tokens': 100, 'temperature': 0.7}
✅ 验证通过

测试 2: {'prompt': '', 'max_tokens': 100}
❌ 验证失败:
   - prompt不能为空

测试 3: {'prompt': '你好', 'max_tokens': 'invalid'}
❌ 验证失败:
   - max_tokens必须是整数

测试 4: {'prompt': '你好', 'temperature': 3.0}
❌ 验证失败:
   - temperature必须在0-2之间

测试 5: {'prompt': '你好', 'model': 'invalid-model'}
❌ 验证失败:
   - model必须是以下之一: gpt-3.5-turbo, gpt-4, claude-3, gemini-pro

测试 6: {'max_tokens': 100}
❌ 验证失败:
   - 缺少必需字段: prompt

测试 7: {'prompt': 'aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

## 类：创建你自己的对象

> **核心概念**：面向对象编程是大模型应用架构设计的基础，用于创建可重用的组件、封装复杂逻辑、构建模块化系统。

类是Python中面向对象编程的基础。在大模型开发中，使用类可以创建可重用的组件，如API客户端、数据处理器、模型包装器等。

### 基本类定义
```python
class ClassName:
    def __init__(self, parameter1, parameter2):
        self.attribute1 = parameter1
        self.attribute2 = parameter2
    
    def method1(self):
        # 方法实现
        pass
```

### 面向对象编程的核心概念
- **封装**：将数据和方法组织在一起
- **继承**：创建基于现有类的新类
- **多态**：同一接口的不同实现
- **抽象**：隐藏实现细节，只暴露必要接口

### 大模型开发中的应用场景
- **API客户端类**：封装大模型API调用逻辑
- **数据处理类**：处理文本、JSON等数据
- **模型包装类**：统一不同模型的接口
- **配置管理类**：管理应用配置和参数
- **工具类**：提供通用的辅助功能

In [85]:
# Define a new class called `Thing` that is derived from the base Python object
class Thing(object):
    my_property = 'I am a "Thing"'


# Define a new class called `DictThing` that is derived from the `dict` type
class DictThing(dict):
    my_property = 'I am a "DictThing"'

In [86]:
print(Thing)
print(type(Thing))
print(DictThing)
print(type(DictThing))
print(issubclass(DictThing, dict))
print(issubclass(DictThing, object))

<class '__main__.Thing'>
<class 'type'>
<class '__main__.DictThing'>
<class 'type'>
True
True


In [87]:
# Create "instances" of our new classes
t = Thing()
d = DictThing()
print(t)
print(type(t))
print(d)
print(type(d))

<__main__.Thing object at 0x7fe15c00ffd0>
<class '__main__.Thing'>
{}
<class '__main__.DictThing'>


In [88]:
# Interact with a DictThing instance just as you would a normal dictionary
d['name'] = 'Sally'
print(d)

{'name': 'Sally'}


In [89]:
d.update({
        'age': 13,
        'fav_foods': ['pizza', 'sushi', 'pad thai', 'waffles'],
        'fav_color': 'green',
    })
print(d)

{'name': 'Sally', 'age': 13, 'fav_foods': ['pizza', 'sushi', 'pad thai', 'waffles'], 'fav_color': 'green'}


In [90]:
print(d.my_property)

I am a "DictThing"


## 大模型技术中的Python基础知识

> **学习目标**：掌握大模型开发中必需的Python技能，包括数据处理、API调用、文本处理等核心概念。

在大模型（LLM）开发中，Python是最主要的编程语言。以下是一些与大模型技术密切相关的Python概念：

### 1. 数据处理和科学计算
- **NumPy**: 数值计算库，用于处理多维数组和张量运算
- **Pandas**: 数据分析库，用于处理结构化数据和CSV文件
- **JSON**: 处理API响应和配置文件，大模型API的主要数据格式

### 2. 机器学习和深度学习
- **PyTorch/TensorFlow**: 深度学习框架，用于模型训练和推理
- **Transformers**: Hugging Face的预训练模型库，提供各种预训练模型
- **NumPy**: 张量操作的基础，所有深度学习框架的底层

### 3. 文本处理
- **字符串操作**: 处理提示词、响应文本、数据清洗
- **正则表达式**: 文本模式匹配、数据提取
- **编码/解码**: UTF-8、Base64等，处理多语言文本

### 4. API和网络请求
- **requests**: HTTP请求库，调用大模型API
- **aiohttp**: 异步HTTP请求，提高并发性能
- **WebSocket**: 实时通信，流式响应

### 5. 异步编程
- **async/await**: 处理并发请求，提高效率
- **asyncio**: 异步IO操作，管理异步任务

### 6. 大模型开发框架
- **LangChain**: 构建大模型应用的综合框架
- **FastAPI**: 构建API服务的现代框架
- **Streamlit**: 快速构建大模型应用界面

<hr>


In [91]:
# 大模型技术中的Python基础示例

# 1. 处理API响应数据（JSON格式）
import json

# 模拟LLM API响应
api_response = {
    "choices": [
        {
            "message": {
                "content": "你好！我是AI助手，很高兴为你服务。",
                "role": "assistant"
            }
        }
    ],
    "usage": {
        "prompt_tokens": 10,
        "completion_tokens": 15,
        "total_tokens": 25
    }
}

# 解析JSON数据
response_data = json.loads(json.dumps(api_response))  # 模拟从API获取的数据
print("AI回复:", response_data["choices"][0]["message"]["content"])
print("使用的token数:", response_data["usage"]["total_tokens"])

# 在实际开发中，你会这样调用API：
# import requests
# response = requests.post("https://api.openai.com/v1/chat/completions",
#                        headers={"Authorization": "Bearer YOUR_API_KEY"},
#                        json={"model": "gpt-3.5-turbo", "messages": [{"role": "user", "content": "你好"}]})
# data = response.json()


AI回复: 你好！我是AI助手，很高兴为你服务。
使用的token数: 25


In [92]:
# 2. 文本处理和提示词工程
def create_prompt(user_input, system_message="你是一个有用的AI助手。"):
    """
    创建结构化的提示词
    这是大模型应用中的核心技能
    """
    prompt = f"""
系统消息: {system_message}

用户输入: {user_input}

请根据以上信息提供帮助。
"""
    return prompt.strip()

# 使用示例
user_question = "请解释什么是机器学习？"
prompt = create_prompt(user_question)
print("生成的提示词:")
print(prompt)

# 提示词工程的最佳实践：
# 1. 明确角色和任务
# 2. 提供具体的指令
# 3. 包含示例（few-shot learning）
# 4. 设置输出格式要求


生成的提示词:
系统消息: 你是一个有用的AI助手。

用户输入: 请解释什么是机器学习？

请根据以上信息提供帮助。


In [93]:
# 3. 列表推导式和数据处理（大模型数据处理常用）
# 处理多个对话历史
conversation_history = [
    {"role": "user", "content": "你好"},
    {"role": "assistant", "content": "你好！有什么可以帮助你的吗？"},
    {"role": "user", "content": "请介绍一下Python"},
    {"role": "assistant", "content": "Python是一种高级编程语言..."}
]

# 使用列表推导式提取所有用户消息
user_messages = [msg["content"] for msg in conversation_history if msg["role"] == "user"]
print("用户消息:", user_messages)

# 使用列表推导式计算每条消息的长度
message_lengths = [len(msg["content"]) for msg in conversation_history]
print("消息长度:", message_lengths)

# 使用字典推导式创建角色到消息的映射
role_messages = {msg["role"]: [m["content"] for m in conversation_history if m["role"] == msg["role"]]
                 for msg in conversation_history}
print("按角色分组的消息:", role_messages)

# 列表推导式在大模型开发中的优势：
# 1. 代码简洁易读
# 2. 性能优于传统循环
# 3. 适合处理大量数据
# 4. 易于并行化处理


用户消息: ['你好', '请介绍一下Python']
消息长度: [2, 14, 11, 18]
按角色分组的消息: {'user': ['你好', '请介绍一下Python'], 'assistant': ['你好！有什么可以帮助你的吗？', 'Python是一种高级编程语言...']}


In [94]:
# 4. 错误处理和异常处理（大模型API调用必备）
def safe_api_call(api_function, *args, **kwargs):
    """
    安全地调用API函数，包含错误处理
    这是大模型应用中的最佳实践
    """
    try:
        result = api_function(*args, **kwargs)
        return {"success": True, "data": result, "error": None}
    except ConnectionError as e:
        return {"success": False, "data": None, "error": f"连接错误: {e}"}
    except ValueError as e:
        return {"success": False, "data": None, "error": f"值错误: {e}"}
    except Exception as e:
        return {"success": False, "data": None, "error": f"未知错误: {e}"}

# 模拟API调用函数
def mock_llm_api_call(prompt):
    """模拟LLM API调用"""
    if not prompt:
        raise ValueError("提示词不能为空")
    if len(prompt) > 1000:
        raise ConnectionError("提示词过长，连接超时")
    return f"AI回复: {prompt[:50]}..."

# 测试安全API调用
test_prompts = ["你好", "", "很长的提示词" * 100]

for prompt in test_prompts:
    result = safe_api_call(mock_llm_api_call, prompt)
    print(f"提示词: '{prompt[:20]}...'")
    print(f"结果: {result}")
    print("-" * 40)

# 错误处理在大模型开发中的重要性：
# 1. API调用可能失败（网络问题、配额限制等）
# 2. 输入数据可能无效
# 3. 模型可能返回意外结果
# 4. 需要优雅地处理各种异常情况


提示词: '你好...'
结果: {'success': True, 'data': 'AI回复: 你好...', 'error': None}
----------------------------------------
提示词: '...'
结果: {'success': False, 'data': None, 'error': '值错误: 提示词不能为空'}
----------------------------------------
提示词: '很长的提示词很长的提示词很长的提示词很长...'
结果: {'success': True, 'data': 'AI回复: 很长的提示词很长的提示词很长的提示词很长的提示词很长的提示词很长的提示词很长的提示词很长的提示词很长...', 'error': None}
----------------------------------------


In [95]:
# 5. 类和对象（大模型应用架构设计）
class LLMClient:
    """
    大语言模型客户端类
    展示面向对象编程在大模型应用中的应用
    """
    def __init__(self, model_name="gpt-3.5-turbo", api_key=None):
        self.model_name = model_name
        self.api_key = api_key
        self.conversation_history = []

    def add_message(self, role, content):
        """添加消息到对话历史"""
        self.conversation_history.append({
            "role": role,
            "content": content
        })

    def get_conversation_context(self, max_messages=10):
        """获取对话上下文（最近的消息）"""
        return self.conversation_history[-max_messages:]

    def clear_history(self):
        """清空对话历史"""
        self.conversation_history = []

    def __str__(self):
        return f"LLMClient(model={self.model_name}, messages={len(self.conversation_history)})"

# 使用示例
client = LLMClient("gpt-4", "your-api-key")
client.add_message("user", "你好")
client.add_message("assistant", "你好！有什么可以帮助你的吗？")
client.add_message("user", "请介绍一下Python")

print("客户端信息:", client)
print("对话上下文:", client.get_conversation_context())

# 面向对象编程在大模型开发中的优势：
# 1. 封装：将相关功能组织在一起
# 2. 继承：创建不同类型的模型客户端
# 3. 多态：支持不同的模型接口
# 4. 维护性：代码结构清晰，易于维护和扩展


客户端信息: LLMClient(model=gpt-4, messages=3)
对话上下文: [{'role': 'user', 'content': '你好'}, {'role': 'assistant', 'content': '你好！有什么可以帮助你的吗？'}, {'role': 'user', 'content': '请介绍一下Python'}]


## 实践作业 - 大模型应用开发

> **目标**：通过实际项目练习，巩固Python基础知识，并掌握大模型开发的核心技能。

### 作业1：构建简单的聊天机器人

**任务描述**：创建一个简单的聊天机器人，能够处理用户输入并生成回复。

**要求**：
1. 使用字典存储对话历史
2. 实现基本的输入验证
3. 添加错误处理机制
4. 支持多种回复模式

**提示**：
```python
# 基础框架
class SimpleChatBot:
    def __init__(self):
        self.conversation_history = []
        self.responses = {
            "你好": "你好！有什么可以帮助你的吗？",
            "再见": "再见！祝你有美好的一天！",
            "帮助": "我可以回答你的问题，请告诉我你想了解什么。"
        }
    
    def chat(self, user_input):
        # 实现聊天逻辑
        pass
```

### 作业2：API响应数据处理器

**任务描述**：创建一个数据处理系统，用于处理大模型API的响应数据。

**要求**：
1. 解析JSON格式的API响应
2. 提取关键信息（内容、tokens、成本等）
3. 计算统计信息（总tokens、平均成本等）
4. 生成数据报告

**提示**：
```python
# 示例API响应
api_response = {
    "choices": [{"message": {"content": "AI回复内容"}}],
    "usage": {"total_tokens": 150, "prompt_tokens": 50, "completion_tokens": 100},
    "model": "gpt-3.5-turbo"
}
```


## 作业评分标准

### 基础要求（一般）
- 代码能够正常运行
- 实现基本功能
- 代码结构清晰

### 进阶要求（良好）
- 添加适当的错误处理
- 代码注释完整
- 性能优化合理

### 高级要求（优秀）
- 代码设计优雅
- 功能完整且实用
- 包含测试用例
- 文档说明详细

## 提交要求

1. **代码文件**：将练习代码保存为.py文件
2. **运行截图**：展示程序运行结果
3. **说明文档**：简要说明实现思路和功能特点
4. **问题记录**：记录遇到的问题和解决方案

## 学习资源

- [Python官方文档](https://docs.python.org/3/)
- [Jupyter Notebook教程](https://jupyter-notebook.readthedocs.io/)
- [大模型开发最佳实践](https://platform.openai.com/docs)
- [Python代码规范](https://pep8.org/)

---

**开始你的实践之旅吧！** 记住，编程是一门实践性很强的技能，多动手练习才能真正掌握。🚀


## 实践作业参考实现
以下是两个实践作业的参考实现代码。你可以运行这些代码，观察输出结果，并尝试理解代码逻辑。这些实现包含了基础功能、输入验证和错误处理等，可以作为你完成作业的起点。

In [96]:
# 作业 1：构建简单的聊天机器人实现

class SimpleChatBot:
    def __init__(self):
        # 使用字典存储对话历史，键为角色，值为消息列表
        self.conversation_history = {
            "user": [],
            "assistant": []
        }
        # 预设回复字典
        self.responses = {
            "你好": "你好！有什么可以帮助你的吗？",
            "再见": "再见！祝你有美好的一天！",
            "帮助": "我可以回答你的问题，请告诉我你想了解什么。",
            "请介绍一下python": "Python是一种高级编程语言，以其简洁易读的语法而闻名，广泛应用于Web开发、数据分析、人工智能等领域。",
            "默认": "抱歉，我没有理解你的意思。你可以问我‘你好’、‘再见’或‘帮助’。"
        }

    def chat(self, user_input):
        """
        处理用户输入并生成回复
        """
        # 1. 实现基本的输入验证
        if not isinstance(user_input, str) or not user_input.strip():
            print("错误：用户输入必须是非空字符串。")
            self.conversation_history["user"].append({"content": user_input, "status": "invalid"})
            return "请输入有效的文本。"

        cleaned_input = user_input.strip().lower()
        self.conversation_history["user"].append({"content": user_input, "status": "valid"})

        # 2. 添加错误处理机制（这里模拟简单的查找错误）
        try:
            # 3. 支持多种回复模式
            # 尝试在预设回复中查找匹配
            response_content = self.responses.get(cleaned_input, self.responses["默认"])
            response_status = "success"

        except Exception as e:
            response_content = f"处理回复时发生错误: {e}"
            response_status = "error"
            print(f"内部错误: {e}") # 记录内部错误日志

        self.conversation_history["assistant"].append({"content": response_content, "status": response_status})
        return response_content

    def get_history(self):
        """
        获取完整的对话历史
        """
        # 将用户和助手消息按时间顺序合并（简单合并，实际应用需要时间戳）
        history = []
        user_msgs = self.conversation_history["user"]
        assistant_msgs = self.conversation_history["assistant"]
        min_len = min(len(user_msgs), len(assistant_msgs))

        for i in range(min_len):
            history.append({"role": "user", "content": user_msgs[i]["content"]})
            history.append({"role": "assistant", "content": assistant_msgs[i]["content"]})

        # 添加剩余的消息
        if len(user_msgs) > len(assistant_msgs):
            for i in range(min_len, len(user_msgs)):
                 history.append({"role": "user", "content": user_msgs[i]["content"]})
        elif len(assistant_msgs) > len(user_msgs):
             for i in range(min_len, len(assistant_msgs)):
                 history.append({"role": "assistant", "content": assistant_msgs[i]["content"]})

        return history


# --- 运行示例 ---
print("--- 简单的聊天机器人示例 ---")
bot = SimpleChatBot()

# 进行一些对话
print("用户: 你好")
print("机器人:", bot.chat("你好"))

print("\n用户: 请介绍一下Python")
print("机器人:", bot.chat("请介绍一下Python"))

print("\n用户: 今天天气如何？")
print("机器人:", bot.chat("今天天气如何？"))

print("\n用户: ") # 测试空输入
print("机器人:", bot.chat(""))

print("\n用户: 再见")
print("机器人:", bot.chat("再见"))

# 查看对话历史
print("\n--- 对话历史 ---")
full_history = bot.get_history()
for msg in full_history:
    print(f"{msg['role']}: {msg['content']}")

--- 简单的聊天机器人示例 ---
用户: 你好
机器人: 你好！有什么可以帮助你的吗？

用户: 请介绍一下Python
机器人: Python是一种高级编程语言，以其简洁易读的语法而闻名，广泛应用于Web开发、数据分析、人工智能等领域。

用户: 今天天气如何？
机器人: 抱歉，我没有理解你的意思。你可以问我‘你好’、‘再见’或‘帮助’。

用户: 
错误：用户输入必须是非空字符串。
机器人: 请输入有效的文本。

用户: 再见
机器人: 再见！祝你有美好的一天！

--- 对话历史 ---
user: 你好
assistant: 你好！有什么可以帮助你的吗？
user: 请介绍一下Python
assistant: Python是一种高级编程语言，以其简洁易读的语法而闻名，广泛应用于Web开发、数据分析、人工智能等领域。
user: 今天天气如何？
assistant: 抱歉，我没有理解你的意思。你可以问我‘你好’、‘再见’或‘帮助’。
user: 
assistant: 再见！祝你有美好的一天！
user: 再见


In [97]:
# 作业 2：API 响应数据处理器实现

import json
import pandas as pd

class APIResponseProcessor:
    def __init__(self, api_responses):
        # 存储原始API响应列表
        self.api_responses = api_responses
        # 存储处理后的数据列表
        self.processed_data = []
        # 存储错误信息
        self.errors = []

    def process_responses(self):
        """
        解析JSON格式的API响应，提取关键信息，并处理错误
        """
        print("--- 开始处理API响应 ---")
        for i, raw_response in enumerate(self.api_responses):
            try:
                # 1. 解析JSON格式的API响应
                # 假设原始响应已经是Python字典，如果不是JSON字符串，需要json.loads()
                # response_data = json.loads(raw_response)
                response_data = raw_response # 假设raw_response已经是字典

                # 2. 提取关键信息（内容、tokens、成本等）
                # 使用.get()方法安全访问嵌套字典，避免KeyError
                content = response_data.get('choices', [{}])[0].get('message', {}).get('content', 'N/A')
                usage = response_data.get('usage', {})
                total_tokens = usage.get('total_tokens', 0)
                prompt_tokens = usage.get('prompt_tokens', 0)
                completion_tokens = usage.get('completion_tokens', 0)
                model_name = response_data.get('model', 'Unknown')
                # 假设成本信息可以直接从响应中获取或根据tokens计算
                # 这里模拟一个成本计算：假设每完成token成本为0.00003美元
                cost = completion_tokens * 0.00003 + prompt_tokens * 0.000015 # 示例成本计算

                processed_item = {
                    "response_id": i + 1,
                    "model": model_name,
                    "content": content,
                    "total_tokens": total_tokens,
                    "prompt_tokens": prompt_tokens,
                    "completion_tokens": completion_tokens,
                    "estimated_cost": cost,
                    "status": "Success",
                    "error_message": None
                }
                self.processed_data.append(processed_item)
                print(f"✅ 成功处理响应 {i+1}")

            except (json.JSONDecodeError, KeyError, IndexError, Exception) as e:
                error_info = {
                    "response_id": i + 1,
                    "status": "Failed",
                    "error_message": str(e),
                    "raw_response": raw_response
                }
                self.errors.append(error_info)
                print(f"❌ 处理响应 {i+1} 失败: {e}")

        print("--- API响应处理完成 ---")
        return self.processed_data, self.errors

    def calculate_statistics(self):
        """
        计算统计信息（总 tokens、平均成本等）
        """
        if not self.processed_data:
            return {
                "total_responses": 0,
                "successful_responses": 0,
                "failed_responses": len(self.errors),
                "total_tokens_used": 0,
                "average_tokens_per_success": 0,
                "total_estimated_cost": 0,
                "average_cost_per_success": 0,
                "models_used": []
            }

        successful_count = len(self.processed_data)
        total_tokens_used = sum(item['total_tokens'] for item in self.processed_data)
        total_estimated_cost = sum(item['estimated_cost'] for item in self.processed_data)
        models_used = list(set(item['model'] for item in self.processed_data))

        average_tokens_per_success = total_tokens_used / successful_count if successful_count > 0 else 0
        average_cost_per_success = total_estimated_cost / successful_count if successful_count > 0 else 0


        stats = {
            "total_responses": len(self.api_responses),
            "successful_responses": successful_count,
            "failed_responses": len(self.errors),
            "total_tokens_used": total_tokens_used,
            "average_tokens_per_success": average_tokens_per_success,
            "total_estimated_cost": total_estimated_cost,
            "average_cost_per_success": average_cost_per_success,
            "models_used": models_used
        }
        return stats

    def generate_report(self):
        """
        生成数据报告
        """
        stats = self.calculate_statistics()
        report = f"""
--- API 响应处理报告 ---

总响应数: {stats['total_responses']}
成功处理数: {stats['successful_responses']}
失败处理数: {stats['failed_responses']}

总 Token 使用量: {stats['total_tokens_used']:,}
平均每次成功调用 Token 数: {stats['average_tokens_per_success']:.0f}

总预估成本: ${stats['total_estimated_cost']:.4f}
平均每次成功调用成本: ${stats['average_cost_per_success']:.4f}

使用的模型: {', '.join(stats['models_used'])}

--- 详细处理结果 ---
"""
        # 将处理结果转换为DataFrame以便展示
        if self.processed_data:
            df = pd.DataFrame(self.processed_data)
            report += "\n成功响应详情:\n"
            report += df.to_markdown(index=False)
        else:
            report += "\n无成功响应详情。"

        if self.errors:
            error_df = pd.DataFrame(self.errors)
            report += "\n\n失败响应详情:\n"
            report += error_df.to_markdown(index=False)
        else:
             report += "\n无失败响应详情。"


        return report

# --- 运行示例 ---
print("--- API 响应数据处理器示例 ---")

# 模拟一批API响应数据
mock_api_responses = [
    {
        "choices": [{"message": {"content": "AI 回复 1"}}],
        "usage": {"total_tokens": 100, "prompt_tokens": 30, "completion_tokens": 70},
        "model": "gpt-3.5-turbo"
    },
    {
        "choices": [{"message": {"content": "AI 回复 2"}}],
        "usage": {"total_tokens": 250, "prompt_tokens": 50, "completion_tokens": 200},
        "model": "gpt-4"
    },
    # 模拟一个格式错误的响应
    {"invalid_field": "this is wrong"},
    {
        "choices": [{"message": {"content": "AI 回复 3"}}],
        "usage": {"total_tokens": 120, "prompt_tokens": 40, "completion_tokens": 80},
        "model": "gpt-3.5-turbo"
    },
     # 模拟一个缺少usage字段的响应
    {
        "choices": [{"message": {"content": "AI 回复 4"}}],
        "model": "claude-3"
    },
]

# 创建处理器实例并处理响应
processor = APIResponseProcessor(mock_api_responses)
processed_data, errors = processor.process_responses()

# 生成并打印报告
report = processor.generate_report()
print(report)

# 进一步分析处理后的数据
if processed_data:
    print("\n--- 进一步分析 ---")
    df_results = pd.DataFrame(processed_data)
    print("按模型分组的总tokens:")
    print(df_results.groupby('model')['total_tokens'].sum())

    print("\n按模型分组的总成本:")
    print(df_results.groupby('model')['estimated_cost'].sum().apply(lambda x: f"${x:.4f}"))

--- API 响应数据处理器示例 ---
--- 开始处理API响应 ---
✅ 成功处理响应 1
✅ 成功处理响应 2
✅ 成功处理响应 3
✅ 成功处理响应 4
✅ 成功处理响应 5
--- API响应处理完成 ---

--- API 响应处理报告 ---

总响应数: 5
成功处理数: 5
失败处理数: 0

总 Token 使用量: 470
平均每次成功调用 Token 数: 94

总预估成本: $0.0123
平均每次成功调用成本: $0.0025

使用的模型: gpt-4, Unknown, gpt-3.5-turbo, claude-3

--- 详细处理结果 ---

成功响应详情:
|   response_id | model         | content   |   total_tokens |   prompt_tokens |   completion_tokens |   estimated_cost | status   | error_message   |
|--------------:|:--------------|:----------|---------------:|----------------:|--------------------:|-----------------:|:---------|:----------------|
|             1 | gpt-3.5-turbo | AI 回复 1 |            100 |              30 |                  70 |          0.00255 | Success  |                 |
|             2 | gpt-4         | AI 回复 2 |            250 |              50 |                 200 |          0.00675 | Success  |                 |
|             3 | Unknown       | N/A       |              0 |               0 |            