# 1. 模型调用的分类

角度1：按照模型功能的不同

非对话模型：（LLMs、Text Model）

对话模型：（Chat Models）  （推荐）

嵌入模型：（Embedding Models）


角度2：按照模型调用时，参数书写的位置不同（api-key、base_url、model_name）

硬编码的方式：将参数书写在代码中

使用环境变量的方式

使用配置文件的方式（推荐）


角度3：具体API的调用

使用LangChain提供的API（推荐）

使用OpenAI官方的API

使用其他平台提供的API

# 2、角度1：非对话模型的调用

In [None]:
from tempfile import template

# 安装必要的包（如果还没安装）
# !pip install langchain-ollama

from langchain_ollama import OllamaLLM  # 替换 OpenAI
# 不再需要 dotenv 和 os.environ 设置 API Key

# 创建本地 Ollama 模型实例
llm = OllamaLLM(
    model="deepseek-r1:7b",  # 使用你已有的模型
    # 或使用其他模型："llama3.2", "qwen2.5:7b" 等
    temperature=0.7,  # 创造性，0-1
    num_predict=512   # 最大生成长度
)

# 调用模型
str = llm.invoke('请写一首关于春天的诗')
print(str)

# 2、角度1：对话模型的调用

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage
import os
import dotenv
dotenv.load_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY1")
os.environ["OPENAI_BASE_URL"] = os.getenv("OPENAI_BASE_URL")
########核心代码############
chat_model = ChatOpenAI(model="gpt-4o-mini")
messages = [
 SystemMessage(content="我是人工智能助手，我叫小智"),
 HumanMessage(content="你好，我是小明，很高兴认识你")
]
response = chat_model.invoke(messages) # 输入消息列表
print(type(response)) # <class 'langchain_core.messages.ai.AIMessage'>
print(response.content)


# 2、角度1：嵌入模型的调用

In [None]:
# 安装必要的包（如果还没安装）
# !pip install langchain-community

from langchain_community.embeddings import OllamaEmbeddings  # 替换 OpenAIEmbeddings
# 不再需要 dotenv 和 API Key

# 创建本地 Ollama embeddings 模型
embeddings_model = OllamaEmbeddings(
    model="llama3.2"  # 或其他模型："deepseek-r1:7b", "nomic-embed-text" 等
)

# 生成嵌入向量
res1 = embeddings_model.embed_query('我是文档中的数据')
print(f"向量维度: {len(res1)}")
print(f"前10个值: {res1[:10]}")  # 只打印前10个值，否则太长

# 3、角度额2

## 1.硬编码的方式

以对话模型为例：

In [None]:
from langchain_openai import ChatOpenAI

# 1、获取大模型
chat_model = ChatOpenAI(
    model="gpt-3.5-turbo",
    api_key="sk-I8eV20Ba0WFknZpli3ibGuqy9sXq9y5QD3x5RVgnLeBhAvzd",
    base_url="https://api.openai-proxy.org/v1"
)

# 2、调用大模型
response = chat_model.invoke('请介绍一下你自己?')

# 3、输出响应文本
print(response.content)

## 3.2 使用环境变量的方式

In [None]:
from langchain_openai import ChatOpenAI

# 1、获取大模型
chat_model = ChatOpenAI(
    model="gpt-3.5-turbo",
    api_key=os.environ["OPENAI_API_KEY"],
    base_url=os.environ["OPENAI_BASE_URL"],
)

# 2、调用大模型
response = chat_model.invoke('请介绍一下你自己?')

# 3、输出响应文本
print(response.content)

# 3.3 使用配置文件的方式

创建.env的配置文件

方式1：

In [None]:
from langchain_openai import ChatOpenAI

import os
import dotenv

# os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY1")
# os.environ["OPENAI_BASE_URL"] = os.getenv("OPENAI_BASE_URL")


# 1、获取大模型
chat_model = ChatOpenAI(
    model="gpt-4o-mini",
    api_key=os.getenv("OPENAI_API_KEY1"),
    base_url=os.getenv("OPENAI_BASE_URL"),
)

# 2、调用大模型
response = chat_model.invoke('什么是langchain?')

# 3、输出响应文本
print(response.content)

方式2：

In [None]:
from langchain_openai import ChatOpenAI

import os
import dotenv

# 加载.env配置文件
dotenv.load_dotenv()

os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY1")
os.environ["OPENAI_BASE_URL"] = os.getenv("OPENAI_BASE_URL")


# 1、获取大模型
chat_model = ChatOpenAI(
    model="gpt-4o-mini", # 默认使用的是gpt-3.5-turbo模型
    #当没有显示的声明base_url和api_key的时候，默认会从环境变量中查找
    max_tokens=500, #最大token数
    temperature=0.7,    #温度，控制文本生成的“随机性”取值范围0~1，
)

# 2、调用大模型
response = chat_model.invoke('什么是langchain?')

# 3、输出响应文本
print(response.content)

In [None]:
import os
import dotenv
from langchain_openai import ChatOpenAI
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage

dotenv.load_dotenv()

os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY1")
os.environ["OPENAI_BASE_URL"] = os.getenv("OPENAI_BASE_URL")

messages = [SystemMessage(content="你是一位哲学家"),
            HumanMessage(content="你好，请介绍一下你自己，包括自己名字"),
            AIMessage(content="我叫小智，能帮你解决各种哲学问题")]

chat_model = ChatOpenAI(
    model="gpt-4o-mini",
    max_tokens=500,
    temperature=0.7,
)

response = chat_model.invoke(messages)

print(response.content)
print(messages)

# 演示硅基流动模型调用

In [7]:
from openai import OpenAI
import os

# 最佳实践：从环境变量读取API密钥，避免密钥泄露
# 请在本地设置环境变量 SILICONFLOW_API_KEY
api_key = os.getenv("SILICONFLOW_API_KEY", "sk-xxsjtyvrotumzxejpnrfwuwuktogndgxggxqhwgiwpjlurce")  # 临时测试可替换，但长期务必用环境变量

client = OpenAI(
    api_key=api_key,  # 使用新密钥
    base_url="https://api.siliconflow.cn/v1"
)

try:
    response = client.chat.completions.create(
        model="Qwen/Qwen3-8B",  # 确认免费的模型
        messages=[
            {"role": "user", "content": "你好，请介绍一下你自己"}
        ]
    )
    print("调用成功！回复如下：")
    print(response.choices[0].message.content)
except Exception as e:
    print(f"调用失败，错误详情：{e}")
    # 如果是OpenAI库的错误，通常会有更详细的响应体
    if hasattr(e, 'response'):
        print(f"HTTP状态码: {e.response.status_code}")
        print(f"错误信息: {e.response.text}")

调用成功！回复如下：
你好！我是通义千问，通义实验室推出的超大规模语言模型，我的英文名叫Qwen。我是一种基于人工智能技术的自然语言处理模型，能够理解和生成人类语言。我的训练数据来自于互联网上的大量文本，包括书籍、文章、网页内容等，因此我具备广泛的知识和语言理解能力。

我可以回答各种问题，从科技、文化到日常生活，几乎无所不能。同时，我也可以进行创作，比如写故事、诗歌，甚至编程。我还能进行多轮对话，记住上下文，从而提供更连贯和个性化的回应。

我的目标是为用户提供有用、准确和友好的帮助，无论是学习、工作还是娱乐。如果你有任何问题或需要帮助的地方，随时告诉我，我会尽力为你解答！
