# 基础应用开发

In [1]:
import os
import warnings
from IPython.display import Markdown
from setenv import APIKeyManager

# 忽略警告
warnings.filterwarnings('ignore')
# 设置API密钥
key_manager = APIKeyManager().setup_api_key()

# 查看Python版本
!python -V
# 查看安装的库
!pip list | grep -E 'langchain|openai|llm|tiktoken|chromadb|cryptography|duck'

Python 3.9.21
chromadb                                 0.6.3
cryptography                             44.0.2
duckduckgo_search                        7.5.3
langchain                                0.3.21
langchain-community                      0.3.20
langchain-core                           0.3.47
langchain-deepseek                       0.1.3
langchain-openai                         0.3.9
langchain-text-splitters                 0.3.7
openai                                   1.68.2
tiktoken                                 0.9.0


## 1. 文本生成应用

### 1.1 文章生成器

In [2]:
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# 创建文章生成链
article_prompt = PromptTemplate(
    input_variables=["topic", "style"],
    template="""
    请以{style}的风格写一篇关于{topic}的文章。
    要求：
    1. 结构清晰
    2. 内容充实
    3. 语言流畅
    """
)

article_chain = LLMChain(
    llm=ChatOpenAI(temperature=0.7, model='deepseek-chat'),
    prompt=article_prompt
)

# 生成文章
article = article_chain.run(
    topic="人工智能发展",
    style="科技"
)

In [4]:
Markdown(article)

**人工智能：从算法革命到文明重塑**  
**——解码AI发展的技术脉络与未来图景**  

---

### **一、技术演进：三大浪潮重构AI范式**  
1. **符号主义的奠基时代（1950s-1980s）**  
   - 早期AI以逻辑推理为核心，如Newell与Simon的「通用问题求解器」尝试用规则模拟人类思维，但受限于算力与数据匮乏。  
   - 专家系统在医疗诊断等领域初显价值，却因无法处理模糊性问题遭遇瓶颈。  

2. **统计学习的爆发期（1990s-2010s）**  
   - 机器学习取代硬编码规则，支持向量机（SVM）、随机森林等算法通过大数据训练实现模式识别。  
   - 2012年AlexNet在ImageNet竞赛中夺冠，标志着深度学习依赖GPU算力与海量数据实现质的突破。  

3. **多模态融合的智能生态（2020s-至今）**  
   - Transformer架构催生GPT、DALL·E等跨模态模型，实现文本、图像、语音的联合理解与生成。  
   - 具身智能（Embodied AI）推动机器人技术与环境交互能力升级，如波士顿动力Atlas的动态运动控制。  

---

### **二、核心驱动力：技术三角的协同进化**  
1. **算力革命**  
   - 从CPU到TPU/GPU集群，算力成本十年下降100倍（OpenAI数据），使千亿参数模型训练成为可能。  

2. **数据爆炸**  
   - 全球数据总量预计2025年达175ZB（IDC），合成数据技术进一步解决长尾场景需求。  

3. **算法创新**  
   - 注意力机制、扩散模型等突破推动AI从「感知」迈向「认知」，Meta的LLaMA-3已实现上下文窗口扩展至百万tokens。  

---

### **三、应用落地：垂直领域的渗透与颠覆**  
| **领域**       | **典型应用**                  | **技术指标**                          |  
|----------------|-----------------------------|-------------------------------------|  
| **医疗**       | AI辅助新药研发               | AlphaFold2预测蛋白质结构精度达原子级      |  
| **制造**       | 工业质检AI系统               | 缺陷识别准确率>99.5%（特斯拉生产数据）      |  
| **金融**       | 高频交易算法                 | 毫秒级决策速度，年化收益提升20%-30%         |  
| **教育**       | 个性化学习引擎               | 哈佛研究显示学生效率提升34%（2023）         |  

---

### **四、伦理与挑战：智能时代的双刃剑**  
- **黑箱困境**：深度学习的不可解释性引发医疗、司法等关键领域信任危机。  
- **数据偏见**：GPT-3被证明存在性别/种族倾向（斯坦福2022研究），需联邦学习等技术修正。  
- **就业重构**：世界经济论坛预测2025年AI将替代8500万岗位，同时创造9700万新职位。  

---

### **五、未来展望：通用人工智能（AGI）的临界点**  
- **技术路径**：混合架构（神经符号系统+强化学习）或突破逻辑与直觉的边界。  
- **量子赋能**：谷歌「悬铃木」量子处理器已展示在优化问题上的指数级加速潜力。  
- **人机协同**：脑机接口（Neuralink）与AI的直连可能重新定义智能进化轨迹。  

---

**结语**  
人工智能的发展已从实验室走向文明演进的核心舞台。在算力、算法、数据的飞轮效应下，我们既需拥抱其带来的生产力跃迁，也必须建立全球治理框架以确保技术向善。当AI开始理解人类的情感与价值观时，这场科技革命终将超越工具属性，成为文明自我迭代的镜像与催化剂。

### 1.2 代码生成器

In [6]:
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# 创建代码生成链
code_prompt = PromptTemplate(
    input_variables=["language", "function"],
    template="""
    请使用{language}编写一个实现{function}的函数。
    要求：
    1. 代码规范
    2. 注释完整
    3. 异常处理
    """
)

code_chain = LLMChain(
    llm=ChatOpenAI(temperature=0.3, model='deepseek-reasoner'),
    prompt=code_prompt
)

# 生成代码
code = code_chain.run(
    language="Python",
    function="快速排序算法"
)

In [7]:
Markdown(code)

```python
def quick_sort(arr):
    """
    使用快速排序算法对列表进行升序排序，返回新列表。

    该函数通过递归地将列表划分为小于基准、等于基准和大于基准的三部分，
    然后合并排序后的子列表来实现排序。包含输入类型验证和异常处理。

    参数:
        arr (list): 待排序的列表。

    返回:
        list: 排序后的新列表。

    异常:
        TypeError: 如果输入参数不是列表类型。
        ValueError: 如果列表元素类型不一致无法比较。
    """
    # 检查输入是否为列表类型
    if not isinstance(arr, list):
        raise TypeError("输入参数必须是一个列表。")

    # 递归终止条件：空列表或单元素列表直接返回副本
    if len(arr) <= 1:
        return arr.copy()

    try:
        # 选择中间元素作为基准值
        mid_index = len(arr) // 2
        pivot = arr[mid_index]

        # 划分三个子列表
        less = [x for x in arr if x < pivot]
        equal = [x for x in arr if x == pivot]
        greater = [x for x in arr if x > pivot]

        # 递归排序并合并结果
        return quick_sort(less) + equal + quick_sort(greater)
    except TypeError as e:
        # 捕获类型错误并转换异常类型
        raise ValueError("列表中存在无法比较的元素类型。") from e


if __name__ == "__main__":
    # 测试正常情况
    test_list = [3, 1, 4, 1, 5, 9, 2, 6, 5]
    print("原始列表:", test_list)
    sorted_list = quick_sort(test_list)
    print("排序结果:", sorted_list)

    # 测试类型错误（取消注释以下代码进行测试）
    # quick_sort("invalid input")  # 触发TypeError

    # 测试元素类型不一致（取消注释以下代码进行测试）
    # mixed_types = [3, "apple", 2.5]
    # quick_sort(mixed_types)  # 触发ValueError
```

### 代码说明：
1. **输入验证**：使用`isinstance()`检查输入是否为列表类型，不符合时抛出`TypeError`。
2. **基准选择**：采用中间元素作为基准值，平衡极端情况下的性能表现。
3. **列表划分**：通过列表推导式将元素划分为小于、等于和大于基准的三部分。
4. **递归排序**：对划分后的子列表递归调用快速排序，最后合并结果。
5. **异常处理**：
   - 捕获元素比较时的`TypeError`，转换为更明确的`ValueError`。
   - 在文档字符串中明确标注可能抛出的异常类型及触发条件。
6. **代码规范**：
   - 符合PEP8规范，使用清晰的变量命名
   - 函数和异常说明采用标准docstring格式
   - 包含完整的类型提示和返回说明

该实现保持了算法O(n log n)的平均时间复杂度，同时通过返回新列表避免修改原始数据。测试案例包含正常排序、类型校验和异常处理验证。

## 2. 对话系统开发
### 2.1 聊天机器人

In [8]:
from langchain.chat_models import ChatOpenAI
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationChain

# 创建聊天模型
chat = ChatOpenAI(temperature=0.7, model='deepseek-chat')

# 创建记忆
memory = ConversationBufferMemory()

# 创建对话链
conversation = ConversationChain(
    llm=chat,
    memory=memory,
    verbose=True
)

# 进行对话
response1 = conversation.predict(input="你好！")
response2 = conversation.predict(input="请介绍一下你自己")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: 你好！
AI:[0m

[1m> Finished chain.[0m


[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: 你好！
AI: 你好！很高兴见到你！😊 今天有什么我可以帮你的吗？无论是问题、闲聊，还是需要建议，我都在这儿呢～
Human: 请介绍一下你自己
AI:[0m

[1m> Finished chain.[0m


### 2.2 客服系统

In [14]:
from langchain.agents import initialize_agent, Tool
from langchain.tools import DuckDuckGoSearchRun

# 创建FAQ查询函数
def faq_lookup(query):
    faq_database = {
        "价格": "我们的基础产品价格为99元，高级版本为299元。",
        "配送": "我们提供全国范围内的免费配送，一般3-5个工作日送达。",
        "退款": "购买后30天内，如有质量问题可申请全额退款。",
        "保修": "所有产品均提供一年免费保修服务。"
    }
    
    for key, value in faq_database.items():
        if key in query:
            return value
    return "抱歉，没有找到相关问题的答案，请联系客服人员获取更多帮助。"

# 创建工具
search = DuckDuckGoSearchRun()
tools = [
    # Tool(
    #     name="Search",
    #     func=search.run,
    #     description="搜索产品信息"
    # ),
    Tool(
        name="FAQ",
        func=faq_lookup,
        description="查询常见问题"
    )
]

# 初始化客服代理
agent = initialize_agent(
    tools,
    chat,
    agent="zero-shot-react-description",
    verbose=True
)

# 处理用户问题
try:
    agent.run("产品价格是多少？")
except Exception as e:
    print(f"搜索过程中发生错误: {e}")
    print("请尝试使用其他搜索工具或稍后再试")



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: 用户询问产品价格，我需要查询FAQ获取相关信息。
Action: FAQ
Action Input: 产品价格是多少？[0m
Observation: [36;1m[1;3m我们的基础产品价格为99元，高级版本为299元。[0m
Thought:[32;1m[1;3mI now know the final answer
Final Answer: 我们的基础产品价格为99元，高级版本为299元。[0m

[1m> Finished chain.[0m
