# DSPy 初始化

本 notebook 用于初始化 DSPy 环境和配置。

## 1. 环境检查和问题修复

首先检查和修复可能的依赖问题：

In [None]:
# 检查当前环境
import sys
print(f"Python 版本: {sys.version}")

# 检查 Pydantic 版本
try:
    import pydantic
    print(f"Pydantic 版本: {pydantic.__version__}")
    
    # 如果是 Pydantic v2，可能需要忽略序列化警告
    if pydantic.__version__.startswith('2.'):
        print("检测到 Pydantic v2，已配置警告过滤")
        import warnings
        warnings.filterwarnings('ignore', category=UserWarning, module='pydantic')
except ImportError:
    print("Pydantic 未安装")

## 2. 安装 DSPy 和依赖

### 常见问题修复

如果遇到 `PydanticSerializationUnexpectedValue` 警告，可以尝试以下方案：

**方案 1: 更新到最新版本（推荐）**
```bash
pip install --upgrade dspy-ai
```

**方案 2: 如果问题持续，固定 Pydantic 版本**
```bash
pip install "pydantic<2.0"
pip install dspy-ai
```

**方案 3: 使用最新的兼容版本**
```bash
pip install dspy-ai pydantic>=2.0
```

In [None]:
# 安装 DSPy（取消注释以执行）
# !pip install --upgrade dspy-ai

## 3. 导入 DSPy 并验证

In [None]:
import dspy
print(f"DSPy 版本: {dspy.__version__}")

## 4. 配置语言模型

配置 DSPy 使用的语言模型。这里提供几种常见的配置方式：

### 选项 1: 使用 OpenAI

In [None]:
# OpenAI 配置
# import os
# os.environ["OPENAI_API_KEY"] = "your-api-key-here"
# 
# lm = dspy.OpenAI(model='gpt-4')
# dspy.settings.configure(lm=lm)

### 选项 2: 使用 Anthropic Claude

In [None]:
# Anthropic Claude 配置
# import os
# os.environ["ANTHROPIC_API_KEY"] = "your-api-key-here"
# 
# lm = dspy.Claude(model='claude-3-sonnet-20240229')
# dspy.settings.configure(lm=lm)

### 选项 3: 使用本地模型（Ollama）

In [None]:
# Ollama 本地模型配置
# lm = dspy.OllamaLocal(model='llama2')
# dspy.settings.configure(lm=lm)

### 选项 4: 使用其他 LLM 提供商

In [None]:
# 根据你的 LLM 提供商配置
# lm = dspy.LM(model='your-model-name')
# dspy.settings.configure(lm=lm)

## 5. 验证配置

验证 DSPy 是否正确配置：

In [None]:
# 检查当前配置
print("DSPy 配置完成！")
print(f"当前语言模型: {dspy.settings.lm if hasattr(dspy.settings, 'lm') else '未配置'}")

## 6. 测试基本功能

In [None]:
# 简单测试 DSPy 是否工作
# class BasicQA(dspy.Signature):
#     """回答一个简单问题"""
#     question = dspy.InputField()
#     answer = dspy.OutputField()
# 
# qa = dspy.Predict(BasicQA)
# response = qa(question="Hello, DSPy!")
# print(f"响应: {response.answer}")

## 下一步

DSPy 初始化完成！现在你可以：
1. 开始实现代码检视功能的各个模块
2. 定义 DSPy Signatures
3. 构建 DSPy Programs
4. 使用 GEPA 进行优化

## 常见问题解答

### 关于 Pydantic 序列化警告

**问题现象**:
```
UserWarning: Pydantic serializer warnings:
  PydanticSerializationUnexpectedValue(Expected 10 fields but got 7...
```

**原因分析**:

1. **版本不兼容**: DSPy 内部使用 Pydantic 定义数据模型，但不同版本的 Pydantic（v1 vs v2）序列化行为不同
2. **API 响应不匹配**: LLM API 返回的字段数量与 DSPy 期望的不一致（期望 10 个字段但只收到 7 个）
3. **DSPy 版本过旧**: 可能需要更新到最新版本以支持新的 API 格式

**解决方案**:

上面第 1 步的环境检查代码会自动检测并过滤这个警告。如果问题仍然存在：

1. 确保使用最新版本的 DSPy: `pip install --upgrade dspy-ai`
2. 检查 LLM 配置是否正确（API key、model name 等）
3. 如果功能正常工作，这只是一个警告，可以安全忽略

**验证方法**:

运行测试代码（第 6 步），如果能正常返回结果，说明功能没有问题，警告可以忽略。