# 从初学者开始——Lanchain笔记

## 简介
Lanchain是一个开源的LLM开发框架，它提供了一个简单易用的接口，用于构建和训练LLM模型。本文将介绍Lanchain的基本原理和使用方法。

## 核心功能

### 1. LLM 调用能力
- 支持多种模型接口：OpenAI、Hugging Face、AzureOpenAI 等
- Fake LLM 支持，用于测试
- 支持流模式输出（逐字返回，类似打字效果）

### 2. 缓存与记录
- 多种缓存支持：
  - 内存缓存 (in-mem)
  - SQLite
  - Redis
  - SQL
- 用量记录功能

### 3. Prompt 相关
- 灵活的 Prompt 管理
- 支持各种自定义模板

### 4. 文档处理
- 多样化文档加载器：
  - Email
  - Markdown
  - PDF
  - Youtube
  等
- 文档分割器
- 索引支持

### 5. 向量处理
- 文本向量化
- 向量存储与搜索支持：
  - Chroma
  - Pinecone
  - Qdrand

### 6. Chains
- LLMChain
- 各种工具 Chain
- LangChainHub 支持

### 简单接入
1.火山引擎——Deepseek R1模型接入

In [None]:
import os
from openai import OpenAI
os.environ["DSR1_API_KEY"] = 'e61f4de8-e1f5-4996-ad2a-0592736be467'

# 
client = OpenAI(
    api_key = os.environ.get("ADSR1_API_KEY"),
    base_url = "https://ark.cn-beijing.volces.com/api/v3",
)


print("----- standard request -----")
completion = client.chat.completions.create(
    model = "deepseek-r1-250120",  # your model endpoint ID
    messages = [
        {"role": "system", "content": "你是人工智能助手"},
        {"role": "user", "content": "常见的十字花科植物有哪些？"},
    ],
)
print(completion.choices[0].message.content)

# Streaming:
print("----- streaming request -----")
stream = client.chat.completions.create(
    model = "deepseek-r1-250120",  # your model endpoint ID
    messages = [
        {"role": "system", "content": "你是人工智能助手"},
        {"role": "user", "content": "常见的十字花科植物有哪些？"},
    ],
    stream=True
)

for chunk in stream:
    if not chunk.choices:
        continue
    print(chunk.choices[0].delta.content, end="")
print()


----- standard request -----


KeyboardInterrupt: 

### 用Openai SDK的方式调用doubao的api

相关示例来自火山引擎的官方文档

In [5]:
import os
from openai import OpenAI

os.environ["Doubao_API_KEY"] = 'e61f4de8-e1f5-4996-ad2a-0592736be467'
# 请确保您已将 API Key 存储在环境变量 ARK_API_KEY 中
# 初始化Openai客户端，从环境变量中读取您的API Key
client = OpenAI(
    # 此为默认路径，您可根据业务所在地域进行配置
    base_url="https://ark.cn-beijing.volces.com/api/v3",
    # 从环境变量中获取您的 API Key
    api_key=os.environ.get("Doubao_API_KEY"),
)

# Non-streaming:
print("----- standard request -----")
completion = client.chat.completions.create(
    # 指定您创建的方舟推理接入点 ID，此处已帮您修改为您的推理接入点 ID
    model="doubao-1-5-lite-32k-250115",
    messages=[
        {"role": "system", "content": "你是人工智能助手"},
        {"role": "user", "content": "常见的十字花科植物有哪些？"},
    ],
)
print(completion.choices[0].message.content)

# Streaming:
print("----- streaming request -----")
stream = client.chat.completions.create(
    # 指定您创建的方舟推理接入点 ID，此处已帮您修改为您的推理接入点 ID
    model="doubao-1-5-lite-32k-250115",
    messages=[
        {"role": "system", "content": "你是人工智能助手"},
        {"role": "user", "content": "常见的十字花科植物有哪些？"},
    ],
    # 响应内容是否流式返回
    stream=True,
)
for chunk in stream:
    if not chunk.choices:
        continue
    print(chunk.choices[0].delta.content, end="")
print()

----- standard request -----
十字花科植物种类繁多，在日常生活中较为常见的有以下这些：
1. **蔬菜类**
    - **白菜**：包括大白菜、小白菜等品种。大白菜叶片宽大，营养丰富，是北方冬季常见的蔬菜；小白菜则较为鲜嫩，可炒食、煮汤等。
    - **萝卜**：品种多样，有白萝卜、青萝卜、红萝卜等。白萝卜肉质脆嫩，水分足，可生食、凉拌、炖煮；青萝卜口感清甜，常腌制后食用；红萝卜富含胡萝卜素，颜色鲜艳。
    - **甘蓝**：如结球甘蓝（圆白菜）、羽衣甘蓝等。结球甘蓝的叶球紧实，可炒、煮、做泡菜；羽衣甘蓝叶片色彩丰富，常作为观赏植物，也可食用，口感较硬。
    - **花椰菜**：又称菜花，花球洁白紧实，营养丰富，适合多种烹饪方式，如清炒、蒜蓉炒等。
    - **西兰花**：与花椰菜类似，但西兰花的花球呈绿色或黄绿色，富含维生素和抗氧化物质，常被用于西餐配菜或中式烹饪。
2. **油料作物类**
    - **油菜**：分为白菜型油菜、芥菜型油菜和甘蓝型油菜。它是重要的油料作物，种子可榨油，其嫩茎及叶也可作蔬菜食用。
3. **观赏植物类**
    - **紫罗兰**：花朵色彩鲜艳，有紫色、淡紫色、白色等多种颜色，香气浓郁，常作为盆栽观赏花卉。
    - **诸葛菜**：也叫二月兰，适应性强，春季开花，花朵为淡紫色或白色，成片种植时非常美观，常出现在公园、绿地等地。 
----- streaming request -----
十字花科植物种类繁多，以下是一些常见的十字花科植物：
1. **白菜类**：如大白菜、小白菜、菜薹等。
2. **甘蓝类**：包括结球甘蓝（圆白菜）、花椰菜（菜花）、青花菜、球茎甘蓝等。
3. **芥菜类**：例如叶用芥菜（雪里蕻）、茎用芥菜（榨菜）、根用芥菜等。
4. **萝卜**：品种多样，是常见的蔬菜。
5. **油菜**：包括白菜型油菜、甘蓝型油菜、芥菜型油菜等，其种子可榨油。
6. **荠菜**：常见的野菜。
7. **紫罗兰**：常作为观赏花卉。
8. **二月兰**：具有观赏价值，也是常见的地被植物。 


### 用langchain的方法简单调用doubao的api

In [None]:
import os
from typing import Any, List, Optional, Dict
from langchain.llms.base import LLM
from langchain.callbacks.manager import CallbackManagerForLLMRun
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from openai import OpenAI
# 设置API密钥
os.environ["Doubao_API_KEY"] = 'e61f4de8-e1f5-4996-ad2a-0592736be467'

# 自定义豆包 LLM 类
class DoubaoLLM(LLM):
    model_name: str = "doubao-1-5-lite-32k-250115"
    
    def __init__(self):
        super().__init__()
        self._client = OpenAI(
            base_url="https://ark.cn-beijing.volces.com/api/v3",
            api_key=os.environ.get("Doubao_API_KEY")
        )
    
    @property
    def client(self) -> Any:
        return self._client

    @client.setter
    def client(self, value: Any):
        self._client = value

    def _call(self, prompt: str, **kwargs) -> str:
        completion = self.client.chat.completions.create(
            model=self.model_name,
            messages=[
                {"role": "user", "content": prompt}
            ]
        )
        return completion.choices[0].message.content

    @property
    def _llm_type(self) -> str:
        return "doubao"

# 创建LLM实例
llm = DoubaoLLM()

# 创建提示模板
prompt = PromptTemplate(
    input_variables=["question"],
    template="请回答下面的问题：{question}"
)

# 创建链
chain = LLMChain(llm=llm, prompt=prompt)

# 使用示例
response = chain.run("常见的十字花科植物有哪些？")
print("通过Chain调用的结果：")
print(response)
print("\n")

# 直接使用LLM
direct_response = llm("请介绍一下人工智能")
print("直接调用LLM的结果：")
print(direct_response)

  chain = LLMChain(llm=llm, prompt=prompt)
  response = chain.run("常见的十字花科植物有哪些？")


通过Chain调用的结果：
十字花科植物种类繁多，常见的有以下这些：
1. **蔬菜类**
    - **白菜**：包括大白菜、小白菜等品种，叶片宽大，营养丰富，是人们餐桌上常见的蔬菜。
    - **萝卜**：品种多样，有白萝卜、胡萝卜、青萝卜等。不同品种的萝卜形态和口感有所差异，但都具有十字花科植物的特征。
    - **甘蓝**：如结球甘蓝（圆白菜）、羽衣甘蓝、球茎甘蓝等。结球甘蓝的叶球可供食用，羽衣甘蓝常作为观赏植物，也可食用，球茎甘蓝的茎部膨大，可做菜用。
    - **花椰菜**：也就是菜花，花球洁白，质地细嫩，营养丰富，是很受欢迎的蔬菜。
    - **西兰花**：与花椰菜类似，但西兰花的花球呈绿色或绿紫色，富含维生素和抗氧化物质。
2. **油料作物类**
    - **油菜**：分为白菜型油菜、芥菜型油菜和甘蓝型油菜等。油菜花在盛开时非常美丽，同时油菜籽可以榨油，是重要的食用油原料。
3. **观赏植物类**
    - **紫罗兰**：花朵色彩丰富，有紫色、白色等，花香浓郁，常被用于花坛、花境的布置，也可盆栽观赏。
    - **桂竹香**：花色橙黄或黄褐色，具有较高的观赏价值，适合在园林中种植。
4. **药用植物类**
    - **菘蓝**：其根入药称为板蓝根，叶入药称为大青叶，具有清热解毒、凉血利咽的功效，是常用的中药材。 




  direct_response = llm("请介绍一下人工智能")


直接调用LLM的结果：
人工智能（Artificial Intelligence，简称AI）是一门研究如何使计算机系统能够模拟人类智能的学科。它旨在让计算机具备感知、理解、学习、推理和决策等能力，以实现智能化的任务执行。

人工智能涵盖了多个领域和技术，包括机器学习、深度学习、自然语言处理、计算机视觉、知识表示与推理等。机器学习是人工智能的核心领域之一，它让计算机通过数据学习模式和规律，从而能够进行预测和分类。深度学习是机器学习的一个分支，通过构建多层神经网络，能够自动从大量数据中学习复杂的特征表示。

人工智能在众多领域有着广泛的应用。在医疗领域，它可以辅助疾病诊断、药物研发等；在交通领域，用于智能交通管理、自动驾驶等；在金融领域，可进行风险评估、投资决策等；在教育领域，实现个性化学习、智能辅导等。此外，人工智能还在智能家居、智能客服、游戏、艺术创作等方面发挥着重要作用。

随着技术的不断发展，人工智能正在深刻地改变着人们的生活和工作方式，为各个行业带来创新和变革，同时也引发了一系列关于伦理、法律、社会等方面的讨论和思考。 
