# Model I/O介绍
Model I/O 模块是与语言模型（LLMs）进行交互的核心组件，在整个框架中有着很重要的地位。
所谓的Model I/O，包括输入提示(Format)、调用模型(Predict)、输出解析(Parse)。分别对应着
Prompt Template ， Model 和Output Parser
> 简单来说，就是输⼊、模型处理、输出这三个步骤。

![image.png](attachment:83bd30d8-dfc4-4b0c-a712-1b7eb66511b8.png)

# Model I/O之调用模型1
LangChain作为一个“工具”，不提供任何 LLMs，而是依赖于第三方集成各种大模型。比如，将
OpenAI、Anthropic、Hugging Face 、LlaMA、阿里Qwen、ChatGLM等平台的模型无缝接入到你的
应用。

## 模型的不同分类方式
> 简单来说，就是⽤谁家的API以什么⽅式调⽤哪种类型的⼤模型

**角度1：按照模型功能的不同：**
* 非对话模型（LLMs、Text Model）
* 对话模型（Chat Models）（ 推荐）
* 嵌入模型（Embedding Models）( 暂不考虑)

角度2：模型调用时，几个重要参数的书写位置的不同：
* 硬编码：写在代码文件中
* 使用环境变量
* 使用配置文件（ 推荐）

**角度3：具体调用的API**
* OpenAI提供的API
* 其它大模型自家提供的API
* LangChain的统一方式调用API（ 推荐）

## 角度1出发：按照功能不同举例
**类型1：LLMs(非对话模型)**

LLMs，也叫Text Model、非对话模型，是许多语言模型应用程序的支柱。主要特点如下：
* 输入：接受文本字符串或PromptValue 对象
* 输出：总是返回文本字符串

![image.png](attachment:df9784d9-2cff-4066-b4ba-57892ea59873.png)

* 适用场景：仅需单次文本生成任务（如摘要生成、翻译、代码生成、单次问答）或对接不支持消息
结构的旧模型（如部分本地部署模型）（ 言外之意，优先推荐ChatModel ）
* 不支持多轮对话上下文。每次调用独立处理输入，无法自动关联历史对话（需手动拼接历史文
本）。
* 局限性：无法处理角色分工或复杂对话逻辑

代码举例：

# 1、 模型调用的分类

角度1：按照模型功能的不同

非对话模型：（LLMs、Text Model）

对话模型：（Chat Models）  (推荐)

嵌入模型：（Embedding Models） (放到最后RAG章节讲解)


角度2：按照模型调用时，参数书写的位置的不同（api-key、base_url、model-name）

硬编码的方式：将参数书写在代码中

使用环境变量的方式

使用配置文件的方式 (推荐)

角度3：具体API的调用

使用LangChain提供的API (推荐)

使用OpenAI 官方的API

使用其它平台提供的API


# 2、角度1：非对话模型的调用


In [1]:
import os
import dotenv
from langchain_openai import OpenAI
dotenv.load_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")
os.environ["OPENAI_BASE_URL"] = os.getenv("OPENAI_BASE_URL")


###########核心代码############
llm = OpenAI()
str = llm.invoke("写一首关于春天的诗")  # 直接输入字符串
print(str)
print(type(str))



春风拂过田野
万物苏醒欢歌
草木抽出新芽
花儿绽放笑颜

蜂儿忙碌采蜜
鸟儿欢唱高枝
阳光温暖如丝
春雨滋润大地

田野变成彩色画卷
青翠的稻穗摇曳
金黄的麦田飘香
春天的色彩绚烂

春风吹散冬日的寒冷
带来生机和希望
让我们跟随春天的脚步
迎接新的一天的曙光

春天，是生命的奇迹
是希望的象征
让我们用心感受
这美妙的春天气息


<class 'str'>


# 2、角度1：对话模型的调用

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import SystemMessage, HumanMessage
import os
import dotenv
dotenv.load_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY1")
os.environ["OPENAI_BASE_URL"] = os.getenv("OPENAI_BASE_URL")


########核心代码############
chat_model = ChatOpenAI(model="gpt-4o-mini")

messages = [
    SystemMessage(content="我是人工智能助手，我叫小智"),
    HumanMessage(content="你好，我是小明，很高兴认识你")
]

#输入：list[basemessage]
#输出：AIMessage
response = chat_model.invoke(messages)  # 输入消息列表

print(type(response))  # <class 'langchain_core.messages.ai.AIMessage'>
print(response.content)

# 2、角度1：嵌入模型的调用

In [None]:
import os
import dotenv
from langchain_openai import OpenAIEmbeddings
dotenv.load_dotenv()
os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY1")
os.environ['OPENAI_BASE_URL'] = os.getenv("OPENAI_BASE_URL")


#############
embeddings_model = OpenAIEmbeddings(
    model="text-embedding-ada-002"
)

res1 = embeddings_model.embed_query('我是文档中的数据')
print(res1)
# 打印结果：[-0.004306625574827194, 0.003083756659179926, -0.013916781172156334, ...., ]

# 3、角度2：参数位置不同举例


## 3.1 硬编码的方式

以对话模型为例：

In [None]:
from langchain_openai import ChatOpenAI
# 调用非对话模型：
# llms = OpenAI(...)


# 调用对话模型：
chat_model = ChatOpenAI(
    #必须要设置的3个参数
    model_name="gpt-4o-mini",   #默认使用的是gpt-3.5-turbo模型
    base_url="https://api.openai-proxy.org/v1",
    api_key="sk-zD4CB2Qe7G2Dp6veCfPRSxeDx9fQPxCUIfOFAk20ETV5B2VA",

)

# 调用模型
response = chat_model.invoke("什么是langchain?")

# 查看响应的文本
# print(response.content)
print(response)

演示非对话模型

In [None]:
from langchain_openai import OpenAI

# 调用非对话模型：
llm = OpenAI(
    #必须要设置的3个参数
    #model_name="gpt-4o-mini",   #默认使用的是gpt-3.5-turbo模型
    base_url="https://api.openai-proxy.org/v1",
    api_key="sk-zD4CB2Qe7G2Dp6veCfPRSxeDx9fQPxCUIfOFAk20ETV5B2VA",

)

# 调用模型
response = llm.invoke("什么是langchain?")

# 查看响应的文本
print(response)

## 3.2 使用环境变量的方式

说明：使用环境变量的方式，在jupyter中执行不合适，需要在.py文件中执行

In [None]:
from langchain_openai import ChatOpenAI


# 1、获取对话模型：
chat_model = ChatOpenAI(
    #必须要设置的3个参数
    model_name="gpt-4o-mini",   #默认使用的是gpt-3.5-turbo模型
    base_url=os.environ["OPENAI_BASE_URL"],
    api_key=os.environ["OPENAI_API_KEY"],

)

# 2、调用模型
response = chat_model.invoke("什么是langchain?")

# 3、查看响应的文本
# print(response.content)
print(response)

## 3.3 使用配置文件的方式（推荐）

使用.env的配置文件

方式1：

In [None]:
from langchain_openai import ChatOpenAI
import os
import dotenv

#加载配置文件
dotenv.load_dotenv()


# 1、获取对话模型：
chat_model = ChatOpenAI(
    #必须要设置的3个参数
    model_name="gpt-4o-mini",   #默认使用的是gpt-3.5-turbo模型
    base_url=os.getenv("OPENAI_BASE_URL"),
    api_key=os.getenv("OPENAI_API_KEY1"),

)

# 2、调用模型
response = chat_model.invoke("什么是langchain?")

# 3、查看响应的文本
# print(response.content)
print(response)

方式2：

In [None]:
from langchain_openai import ChatOpenAI
import os
import dotenv

#加载配置文件
dotenv.load_dotenv()


os.environ["OPENAI_BASE_URL"] = os.getenv("OPENAI_BASE_URL")
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY1")


# 1、获取对话模型：
chat_model = ChatOpenAI(
    #必须要设置的3个参数
    #model_name="gpt-4o-mini",   #默认使用的是gpt-3.5-turbo模型
    #当没有显式的声明base_url和api_key的时候，默认会从环境变量中查找
)

# 2、调用模型
response = chat_model.invoke("什么是langchain?")

# 3、查看响应的文本
# print(response.content)
print(response)

体会其它参数的使用：

In [None]:
from langchain_openai import ChatOpenAI
import os
import dotenv

#加载配置文件
dotenv.load_dotenv()


os.environ["OPENAI_BASE_URL"] = os.getenv("OPENAI_BASE_URL")
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY1")


# 1、获取对话模型：
chat_model = ChatOpenAI(
    temperature=0.7,
    max_tokens=20,
)

# 2、调用模型
response = chat_model.invoke("什么是langchain?")

# 3、查看响应的文本
# print(response.content)
print(response)

# 4、角度3：使用各个平台的API的调用大模型（了解）

## 4.1 OpenAI的方式

调用非对话模型

In [None]:
from openai import OpenAI

# 从环境变量读取API密钥（推荐安全存储）
client = OpenAI(
    api_key="sk-zD4CB2Qe7G2Dp6veCfPRSxeDx9fQPxCUIfOFAk20ETV5B2VA",  #填写自己的api-key
    base_url="https://api.openai-proxy.org/v1") #通过代码示例获取

# 调用Completion接口
response = client.completions.create(
    model="gpt-3.5-turbo-instruct",  # 非对话模型
    prompt="请将以下英文翻译成中文：\n'Artificial intelligence will reshape the future.'",
    max_tokens=100,  # 生成文本最大长度
    temperature=0.7,  # 控制随机性
)
# 提取结果
print(response.choices[0].text.strip())

调用对话模型

In [None]:
from openai import OpenAI

client = OpenAI(
    api_key="sk-zD4CB2Qe7G2Dp6veCfPRSxeDx9fQPxCUIfOFAk20ETV5B2VA", #填写自己的api-key
    base_url="https://api.openai-proxy.org/v1")

completion = client.chat.completions.create(
    model="gpt-3.5-turbo", # 对话模型
    messages=[
        {"role": "system", "content": "你是一个乐于助人的智能AI小助手"},
        {"role": "user", "content": "你好，请你介绍一下你自己"}
    ],
    max_tokens=150,
    temperature=0.5
)

print(completion.choices[0].message)

## 4.2 百度千帆平台

In [None]:
from openai import OpenAI

client = OpenAI(
    api_key="bce-v3/ALTAK-Ynzfb6RBYeGiyI08yEXuf/21f994aeb874bbc0c55c3c4dc37a6b9b0cccaac1",  # 千帆bearer token
    base_url="https://qianfan.baidubce.com/v2",  # 千帆域名
    default_headers={"appid": "app-y3sQKuT2"}   # 用户在千帆上的appid，非必传
)

completion = client.chat.completions.create(
    model="ernie-4.0-turbo-8k", # 预置服务请查看模型列表，定制服务请填入API地址
    messages=[{'role': 'system', 'content': 'You are a helpful assistant.'},
              {'role': 'user', 'content': 'Hello！'}]
)

print(completion.choices[0].message)

## 4.3 使用阿里云百炼平台

方式1：使用OpenAI的方式

In [None]:
import os
from openai import OpenAI

client = OpenAI(
    # 若没有配置环境变量，请用阿里云百炼API Key将下行替换为：api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),  # 如何获取API Key：https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
    base_url=os.getenv("DASHSCOPE_BASE_URL")
)

completion = client.chat.completions.create(
    model="deepseek-r1",  # 此处以 deepseek-r1 为例，可按需更换模型名称。
    messages=[
        {'role': 'user', 'content': '9.9和9.11谁大'}
    ]
)

# 通过reasoning_content字段打印思考过程
print("思考过程：")
print(completion.choices[0].message.reasoning_content)

# 通过content字段打印最终答案
print("最终答案：")
print(completion.choices[0].message.content)

方式2：使用dashscope

In [None]:
import os
import dashscope

messages = [
    {'role': 'user', 'content': '你是谁？'}
]

response = dashscope.Generation.call(
    # 若没有配置环境变量，请用阿里云百炼API Key将下行替换为：api_key="sk-xxx",
    api_key=os.getenv('DASHSCOPE_API_KEY'),
    model="deepseek-r1",  # 此处以 deepseek-r1 为例，可按需更换模型名称。
    messages=messages,
    # result_format参数不可以设置为"text"。
    result_format='message'
)

print("=" * 20 + "思考过程" + "=" * 20)
print(response.output.choices[0].message.reasoning_content)
print("=" * 20 + "最终答案" + "=" * 20)
print(response.output.choices[0].message.content)

## 4.4 智谱的GLM

方式1：使用OpenAI的方式

In [None]:
from openai import OpenAI

client = OpenAI(
    api_key="4806f93a9fa948b3ad0da1ec6f989261.sRf49YGloBNigTox",
    base_url="https://open.bigmodel.cn/api/paas/v4/"
)

completion = client.chat.completions.create(
    model="glm-4.5",
    messages=[
        {"role": "system", "content": "你是一个聪明且富有创造力的小说作家"},
        {"role": "user", "content": "请你作为童话故事大王，写一篇短篇童话故事"}
    ],
    top_p=0.7,
    temperature=0.9
)

print(completion.choices[0].message.content)

方式2：使用langchain的方式

In [None]:
from langchain_openai import ChatOpenAI
from langchain.schema import HumanMessage, SystemMessage

# 创建LLM实例
llm = ChatOpenAI(
    temperature=0.7,
    model="glm-4.5",
    openai_api_key="4806f93a9fa948b3ad0da1ec6f989261.sRf49YGloBNigTox",
    openai_api_base="https://open.bigmodel.cn/api/paas/v4/"
)

# 创建消息
messages = [
    SystemMessage(content="你是一个有用的AI助手"),
    HumanMessage(content="请介绍一下人工智能的发展历程")
]

# 调用模型
response = llm(messages)
print(response.content)

## 4.5 硅基流动平台的演示

In [None]:
import requests

url = "https://api.siliconflow.cn/v1/chat/completions"

payload = {
    "model": "Qwen/QwQ-32B",
    "messages": [
        {
            "role": "user",
            "content": "What opportunities and challenges will the Chinese large model industry face in 2025?"
        }
    ]
}
headers = {
    "Authorization": "Bearer sk-auciaxqpzchyauiovpzkwrjhznkzepozralhwleyrdoyjani", #填写自己的api-key
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.json())