## 1. 非流式输出

In [3]:
import os
import dotenv
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_openai import ChatOpenAI

dotenv.load_dotenv()

os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY")
os.environ['OPENAI_BASE_URL'] = os.getenv("OPENAI_BASE_URL")

#初始化大模型
chat_model = ChatOpenAI(model="gpt-4o-mini")

# 支持多个消息作为输入
messages = [
    SystemMessage(content="你是一位乐于助人的助手。你叫于老师"),
    HumanMessage(content="你是谁？")
]

# 非流式调用LLM获取响应
response = chat_model.invoke(messages)

# 打印响应内容
print(response.content)

content='我是于老师，一个乐于助人的助手，很高兴为你提供帮助！请问有什么我可以为你做的呢？' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 29, 'prompt_tokens': 27, 'total_tokens': 56, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_efad92c60b', 'id': 'chatcmpl-CVDzOITNL6fGDH6GY2lgWddSPebXr', 'finish_reason': 'stop', 'logprobs': None} id='lc_run--a582fcb2-87fe-4016-99f3-4aae92c16f5b-0' usage_metadata={'input_tokens': 27, 'output_tokens': 29, 'total_tokens': 56, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}


## 2. 流式输出

In [6]:
import os
import dotenv
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI

dotenv.load_dotenv()

os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY")
os.environ['OPENAI_BASE_URL'] = os.getenv("OPENAI_BASE_URL")

# 初始化大模型
chat_model = ChatOpenAI(model="gpt-4o-mini",
                        streaming=True  # 启用流式输出
                        )

# 创建消息
messages = [HumanMessage(content="你好，请介绍一下自己")]

# 流式调用LLM获取响应
print("开始流式输出：")
for chunk in chat_model.stream(messages):
    # 逐个打印内容块
    print(chunk.content, end="", flush=True) # 刷新缓冲区 (无换行符，缓冲区未刷新，内容可能不会立即显示)

print("\n流式输出结束")

开始流式输出：
你好！我是一个人工智能助手，旨在回答问题、提供信息和帮助解决各种问题。我可以帮助你了解各种主题，比如科学、历史、技术、文化等。如果你有任何问题或需要了解特定内容，随时问我！
流式输出结束


## 3. 批量调用

In [9]:
import os
import dotenv
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_openai import ChatOpenAI

dotenv.load_dotenv()

os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY")
os.environ['OPENAI_BASE_URL'] = os.getenv("OPENAI_BASE_URL")

# 初始化大模型
chat_model = ChatOpenAI(model="gpt-4o-mini")

messages1 = [SystemMessage(content="你是一位乐于助人的智能小助手"),
             HumanMessage(content="请帮我介绍一下什么是机器学习"), ]

messages2 = [SystemMessage(content="你是一位乐于助人的智能小助手"),
             HumanMessage(content="请帮我介绍一下什么是AIGC"), ]

messages3 = [SystemMessage(content="你是一位乐于助人的智能小助手"),
             HumanMessage(content="请帮我介绍一下什么是大模型技术"), ]

messages = [messages1, messages2, messages3]

# 调用batch
response = chat_model.batch(messages)

print(response)

[AIMessage(content='机器学习是人工智能（AI）的一个子领域，它通过数据和算法使计算机系统能够自动学习和改进，从而在没有明确编程的情况下进行预测和决策。机器学习的核心思想是，计算机能够从数据中提取模式，并根据这些模式进行推理和预测。\n\n机器学习可以分为几种主要类型：\n\n1. **监督学习**：在这种学习方式中，算法使用带标签的数据进行训练，也就是说，输入数据和对应的输出标签都是已知的。算法通过学习输入和输出之间的关系，来对新数据进行预测。例如，分类问题（如垃圾邮件识别）和回归问题（如房价预测）都属于监督学习。\n\n2. **无监督学习**：无监督学习不依赖于标签数据，算法需要从未标记的数据中发现模式和结构。这种类型的方法常用于数据聚类和降维等任务，如将不同的客户群体进行分类。\n\n3. **半监督学习**：这种方法结合了监督学习和无监督学习，使用少量的标记数据和大量的未标记数据进行训练，通常在标记数据获取成本高昂的情况下使用。\n\n4. **强化学习**：在强化学习中，算法通过在环境中不断尝试和评估其行为的结果来学习。它通过奖励和惩罚机制来优化决策过程，常用于游戏、机器人控制等领域。\n\n机器学习已经被广泛应用于多个领域，包括图像识别、自然语言处理、推荐系统、医疗诊断等。随着大量数据和计算能力的增加，机器学习在各行各业中的应用潜力正在不断扩大。', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 363, 'prompt_tokens': 30, 'total_tokens': 393, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-min

## 4. Embeddings models

In [11]:
import os
import dotenv
from langchain_openai import OpenAIEmbeddings

dotenv.load_dotenv()

os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY")
os.environ['OPENAI_BASE_URL'] = os.getenv("OPENAI_BASE_URL")

embeddings_model = OpenAIEmbeddings(
    model="text-embedding-ada-002"
)

res1 = embeddings_model.embed_query('这是第一个测试文档')
print(res1)

# 打印结果：[-0.004306625574827194, 0.003083756659179926, -0.013916781172156334, ...., ]

res2 = embeddings_model.embed_documents(['这是第一个测试文档', '这是第二个测试文档'])
print(res2)
# 打印结果：[[-0.004306625574827194, 0.003083756659179926, -0.013916781172156334,...],[...,...,.... ]]

[-0.004306625574827194, 0.003083756659179926, -0.013916781172156334, -0.010168422013521194, -0.01026811171323061, 0.011510918848216534, -0.017545511946082115, 0.0016349226934835315, -0.016535315662622452, -0.024204831570386887, 0.014209206216037273, 0.03200726583600044, -0.01660177670419216, 0.007164417300373316, 0.004638927057385445, 0.012973044998943806, 0.019339939579367638, -0.02218443900346756, 0.0031070178374648094, 0.0029907121788710356, -0.0027996390126645565, 0.00467548007145524, -0.01855570822954178, 0.0008922291453927755, -0.02718225121498108, 0.008254365995526314, 0.01013519149273634, -0.02871083840727806, -0.004393023904412985, -0.010427616536617279, 0.014102869667112827, -0.012919876724481583, -0.0036752531304955482, -0.020429888740181923, 0.003638699883595109, -0.006838762201368809, -0.0029807433020323515, -0.018090486526489258, 0.00667925737798214, -0.02225090004503727, 0.007642931304872036, 0.01507318951189518, 0.010427616536617279, 0.007117895409464836, 0.010859608650