In [4]:
import asyncio

from langchain_ollama import OllamaLLM
from langchain_core.prompts import ChatPromptTemplate
llm = OllamaLLM(model="deepseek-r1:14b",
                verbose=True)

# 创建一个提示模板(prompt template)
# 这里以对话模型的消息格式为例子，不熟悉openai对话模型消息格式，建议先学习OpenAI的API教程
# 下面消息模板，定义两条消息，system消息告诉模型扮演什么角色，user消息代表用户输入的问题，这里用了一个占位符{input} 代表接受一个模版参数input。
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是世界级的技术专家"),
    ("user", "{input}")
])

# 基于LCEL表达式构建LLM链，lcel语法类似linux的pipeline语法，从左到右按顺序执行
# 下面编排了一个简单的工作流，首先执行prompt完成提示词模板(prompt template)格式化处理， 然后将格式化后的prompt传递给llm模型执行，最终返回llm执行结果。
chain = prompt | llm

# 调用LLM链并设置模板参数input,  invoke会把调用参数传递给prompt提示模板，开始chain定义的步骤开始逐步执行。
chain.invoke({"input": "帮我写一篇关于AI的技术文章，100个字"})

'<think>\n嗯，用户让我帮忙写一篇关于AI的技术文章，要求是100个字。首先，我需要明确用户的需求是什么。他可能是一个学生或者刚接触AI领域的人，想要一个简洁明了的介绍。\n\n接下来，我要考虑内容的方向。AI是个很广泛的领域，100字的话不能太深入，所以得选择最核心的部分。生成式AI最近挺火的，特别是像GPT这样的模型，应该是个不错的选择。\n\n然后，我需要确定文章的结构。开头可以点出AI的发展和现状，中间部分介绍生成式AI的能力及其应用领域，最后总结其对社会的影响和未来的潜力。\n\n在语言上，要保持简洁明了，避免使用过于专业的术语，让读者容易理解。同时，要突出重点，确保信息准确且有条理。\n\n现在，我得控制字数，大约100字左右，所以每句话都要精炼。开头提到AI发展现状，接着介绍生成式AI的特点和应用领域，最后点出其对社会的影响和未来发展潜力。\n\n检查一下，这样结构是否合理，内容是否全面，同时确保没有超过字数限制。嗯，应该没问题了。\n</think>\n\n人工智能（Artificial Intelligence, AI）正迅速改变世界。当前，生成式AI技术如GPT系列模型展现出强大的理解和生成能力，能够完成对话、文本创作、图像生成等多种任务。这种技术基于深度学习和大语言模型，在自然语言处理领域取得了突破性进展。其应用已广泛覆盖教育、医疗、金融等多个行业，并将持续推动社会进步与创新。未来，AI将继续深度融合人类生活，带来更多可能性。'

In [5]:
from langchain_core.output_parsers import StrOutputParser

# 创建一个字符串输出解析器
output_parser = StrOutputParser()

# 将输出解析器添加到LLM链中，跟前面的例子，区别就是工作流编排，最后一步将llm模型输出的结果传递给output_parser进行格式转换
chain = prompt | llm | output_parser

# 调用LLM链并提出问题
result = chain.invoke({"input": "帮我写一篇langchain的技术文章，100个字"})
print(result)

<think>
嗯，用户让我帮他写一篇关于LangChain的技术文章，大概100个字。首先，我要弄清楚什么是LangChain。我记得它是一个用于LLM应用的开源框架，可能和链表结构有关？或者是不是跟链式方法有关系？

接下来，我需要确定用户的需求是什么。他可能是一位开发者或者是技术专家，想要快速了解LangChain的核心概念、优势以及应用场景。所以，文章应该简洁明了，突出重点。

然后，我要考虑结构。开头可以介绍什么是LangChain，接着说明它的主要特点，比如模块化组件和灵活的架构。然后提到它支持哪些功能，比如记忆机制和数据增强。最后，举一个例子或者应用领域，让读者明白它如何帮助开发者构建高效的应用。

在写作过程中，要注意用词准确，同时保持语言简洁，控制在100字左右。可能需要多次精简内容，确保信息全面又不冗长。还要检查有没有遗漏的重要点，比如它是否支持多种模型或者集成工具链的能力。
</think>

LangChain 是一个开源框架，专为构建复杂的语言模型（LLM）应用而设计。其核心思想是将 LLM 与外部数据源、推理逻辑和记忆机制相结合，形成链式处理流程。通过模块化组件和灵活的架构，开发者可以轻松构建高效、可扩展的应用程序，支持对话系统、任务自动化等多种场景。LangChain 的最大优势在于它允许用户自定义链的结构，从而实现高度智能化的任务处理。


## 2. LangChain提示词工程

In [12]:
from langchain_core.messages import SystemMessage
from langchain_core.prompts import HumanMessagePromptTemplate
#导入langchain提示词模板库
from langchain_core.prompts import ChatPromptTemplate
chat_template = ChatPromptTemplate.from_messages(
        [
            SystemMessage(
                content=(
                    "你是一个非常有帮助的助手，可以润色内容，使其看起来更简单易读."
                )
            ),
            HumanMessagePromptTemplate.from_template("{text}"),
        ]
)

#使用模板参数格式化模板
message = chat_template.format_messages(text="我不喜欢吃好吃的东西")
print(message)

[SystemMessage(content='你是一个非常有帮助的助手，可以润色内容，使其看起来更简单易读.', additional_kwargs={}, response_metadata={}), HumanMessage(content='我不喜欢吃好吃的东西', additional_kwargs={}, response_metadata={})]


In [14]:
# MessagePlaceholder
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.messages import HumanMessage
prompt_template = ChatPromptTemplate.from_messages([
    ("system", "You are a helpful assistant"),
    MessagesPlaceholder("msgs")
])
prompt_template.invoke({"msgs": [HumanMessage(content="hi!")]})

ChatPromptValue(messages=[SystemMessage(content='You are a helpful assistant', additional_kwargs={}, response_metadata={}), HumanMessage(content='hi!', additional_kwargs={}, response_metadata={})])

In [1]:
#提示词追加示例
from langchain.prompts import FewShotPromptTemplate
from langchain.prompts.prompt import PromptTemplate

examples = [
  {
    "question": "谁的寿命更长，穆罕默德·阿里还是艾伦·图灵？",
    "answer":
"""
这里需要跟进问题吗：是的。
跟进：穆罕默德·阿里去世时多大？
中间答案：穆罕默德·阿里去世时74岁。
跟进：艾伦·图灵去世时多大？
中间答案：艾伦·图灵去世时41岁。
所以最终答案是：穆罕默德·阿里
"""
  },
  {
    "question": "craigslist的创始人是什么时候出生的？",
    "answer":
"""
这里需要跟进问题吗：是的。
跟进：craigslist的创始人是谁？
中间答案：craigslist由Craig Newmark创立。
跟进：Craig Newmark是什么时候出生的？
中间答案：Craig Newmark于1952年12月6日出生。
所以最终答案是：1952年12月6日
"""
  },
  {
    "question": "乔治·华盛顿的祖父母中的母亲是谁？",
    "answer":
"""
这里需要跟进问题吗：是的。
跟进：乔治·华盛顿的母亲是谁？
中间答案：乔治·华盛顿的母亲是Mary Ball Washington。
跟进：Mary Ball Washington的父亲是谁？
中间答案：Mary Ball Washington的父亲是Joseph Ball。
所以最终答案是：Joseph Ball
"""
  },
  {
    "question": "《大白鲨》和《皇家赌场》的导演都来自同一个国家吗？",
    "answer":
"""
这里需要跟进问题吗：是的。
跟进：《大白鲨》的导演是谁？
中间答案：《大白鲨》的导演是Steven Spielberg。
跟进：Steven Spielberg来自哪里？
中间答案：美国。
跟进：《皇家赌场》的导演是谁？
中间答案：《皇家赌场》的导演是Martin Campbell。
跟进：Martin Campbell来自哪里？
中间答案：新西兰。
所以最终答案是：不是
"""
  }
]

In [2]:
#创建小样本示例的格式化程序
example_prompt = PromptTemplate(input_variables=["question", "answer"], template="问题：{question}\\n{answer}")

# 提取examples示例集合的一个示例的内容，用于格式化模板内容
#examples[0] = {"name":'乔治·华盛顿的祖父母中的母亲是谁？','answer':'Joseph ball'}
#**examples[0] name='乔治·华盛顿的祖父母中的母亲是谁？', answer='Joseph ball'
print(example_prompt.format(**examples[0]))

问题：谁的寿命更长，穆罕默德·阿里还是艾伦·图灵？\n
这里需要跟进问题吗：是的。
跟进：穆罕默德·阿里去世时多大？
中间答案：穆罕默德·阿里去世时74岁。
跟进：艾伦·图灵去世时多大？
中间答案：艾伦·图灵去世时41岁。
所以最终答案是：穆罕默德·阿里



In [15]:
#将示例和格式化程序提供给FewShotPromptTemplate
# 接收examples示例数组参数，通过example_prompt提示词模板批量渲染示例内容
# suffix和input_variables参数用于在提示词模板最后追加内容， input_variables用于定义suffix中包含的模板参数
prompt = FewShotPromptTemplate(
    examples=examples,
    example_prompt=example_prompt,
    suffix="问题：{input}",
    input_variables=["input"]
)

print(prompt.format(input="乔治·华盛顿的父亲是谁？"))

问题：谁的寿命更长，穆罕默德·阿里还是艾伦·图灵？\n
这里需要跟进问题吗：是的。
跟进：穆罕默德·阿里去世时多大？
中间答案：穆罕默德·阿里去世时74岁。
跟进：艾伦·图灵去世时多大？
中间答案：艾伦·图灵去世时41岁。
所以最终答案是：穆罕默德·阿里


问题：craigslist的创始人是什么时候出生的？\n
这里需要跟进问题吗：是的。
跟进：craigslist的创始人是谁？
中间答案：craigslist由Craig Newmark创立。
跟进：Craig Newmark是什么时候出生的？
中间答案：Craig Newmark于1952年12月6日出生。
所以最终答案是：1952年12月6日


问题：乔治·华盛顿的祖父母中的母亲是谁？\n
这里需要跟进问题吗：是的。
跟进：乔治·华盛顿的母亲是谁？
中间答案：乔治·华盛顿的母亲是Mary Ball Washington。
跟进：Mary Ball Washington的父亲是谁？
中间答案：Mary Ball Washington的父亲是Joseph Ball。
所以最终答案是：Joseph Ball


问题：《大白鲨》和《皇家赌场》的导演都来自同一个国家吗？\n
这里需要跟进问题吗：是的。
跟进：《大白鲨》的导演是谁？
中间答案：《大白鲨》的导演是Steven Spielberg。
跟进：Steven Spielberg来自哪里？
中间答案：美国。
跟进：《皇家赌场》的导演是谁？
中间答案：《皇家赌场》的导演是Martin Campbell。
跟进：Martin Campbell来自哪里？
中间答案：新西兰。
所以最终答案是：不是


问题：乔治·华盛顿的父亲是谁？


In [3]:
#大模型有上下文限制，以及token数量限制，所以不可能把所有示例都提供给大模型，需要通过示例选择器选择少量的示例提供给大模型
#使用示例选择器
from langchain.prompts.example_selector import SemanticSimilarityExampleSelector
from langchain_community.vectorstores import Chroma
from langchain.embeddings import OllamaEmbeddings
# 初始化Ollama嵌入模型
embeddings = OllamaEmbeddings(model="nomic-embed-text:latest")
example_selector = SemanticSimilarityExampleSelector.from_examples(
    # 这是可供选择的示例列表。
    examples,
    # 这是用于生成嵌入的嵌入类，该嵌入用于衡量语义相似性。
    embeddings,
    # 这是用于存储嵌入和执行相似性搜索的VectorStore类。
    Chroma,
    # 这是要生成的示例数。
    k=1
)

# 选择与输入最相似的示例。
question = "大白鲨的导演是谁？"
selected_examples = example_selector.select_examples({"question": question})
print(f"最相似的示例：{question}")
for example in selected_examples:
    print("\\n")
    for k, v in example.items():
        print(f"{k}：{v}")

  embeddings = OllamaEmbeddings(model="nomic-embed-text:latest")


In [6]:
prompt = FewShotPromptTemplate(
    example_selector=example_selector,
    example_prompt=example_prompt,
    suffix="问题：{input}",
    input_variables=["input"]
)

print(prompt.format(input="乔治·华盛顿的父亲是谁？"))

问题：乔治·华盛顿的祖父母中的母亲是谁？\n
这里需要跟进问题吗：是的。
跟进：乔治·华盛顿的母亲是谁？
中间答案：乔治·华盛顿的母亲是Mary Ball Washington。
跟进：Mary Ball Washington的父亲是谁？
中间答案：Mary Ball Washington的父亲是Joseph Ball。
所以最终答案是：Joseph Ball


问题：乔治·华盛顿的父亲是谁？


## 3. LangChain工作流编排

In [9]:
from langchain_ollama import OllamaLLM
model = OllamaLLM(model="deepseek-r1:14b",
                verbose=True)

chunks=[]
for chunk in model.stream("你好，我是langchain"):
    chunks.append(chunk)
    print(chunk,end="|",flush=True)

<think>|

|</think>|

|你好|！|我是|由|中国的|深度|求|索|（|Deep|Seek|）|公司|独立|开发|的|智能|助手|Deep|Seek|-R|1|-L|ite|-|Preview|，|很高兴|为您提供|服务|！||

In [17]:
#chain(链） LCEL通过将LangChain对象连接在一起，形成工作流,使用LCEL创建的链，可以自动实现stream和astream方法,从而实现对最终输出的流式传输。
#astream_chain.py
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_template("给我讲一个关于{topic}的笑话")
parser = StrOutputParser()
chain = prompt | model | parser

async for chunk in chain.astream({"topic": "鹦鹉"}):
    print(chunk, end="|", flush=True)

<think>|
|好吧|，|我现在|要|给|用户|讲|一个|关于|鹦|鹉|的|笑话|。|首先|，|我|需要|回想|一下|有哪些|常见的|鹦|鹉|笑话|主题|，|通常|这些|笑话|都|涉及到|鹦|鹉|模仿|说话|的能力|或者|它们|的|聪明|程度|。

|然后|，|我想|到了|一个|经典的|结构|：“|为什么|鹦|鹉|？”| 这|种|结构|通常|用来|引|出|双|关|语|或|谐|音|笑|点|。|比如|，|使用|“|啤酒|”|和|“|皮|”的|发音|相似|，|可能会|制造|笑|点|。

|接下来|，|我|需要|考虑|如何|让|笑话|自然|流畅|。|例如|，|设置|一个|场景|：|一个人|在|买|鹦|鹉|，|然后|问|鹦|鹉|是否会|说|某些|话|。|鹦|鹉|的回答|带|有一个|双|关|语|，|比如|提到|啤酒|和|皮|，|这样|能|引发|笑声|。

|最后|，|确保|笑话|简|短|有趣|，|容易|理解|，|同时|结尾|有一个|出|人|意|料|的|笑|点|，|让|听众|会|心|一笑|。
|</think>|

|为什么|鹦|鹉|总|喜欢|谈论|啤酒|？

|因为|它们|想|“|皮|”|一下|！|😄||

In [21]:
from langchain_core.output_parsers import JsonOutputParser

#流式输出json

parser = StrOutputParser()
chain = (
        model | JsonOutputParser()
    # 由于Langchain旧版本中的一个错误，JsonOutputParser未能从某些模型中流式传输结果
)
# async def async_stream():
#     async for text in chain.astream(
#             "以JSON 格式输出法国、西班牙和日本的国家及其人口列表。"
#             '使用一个带有“countries”外部键的字典，其中包含国家列表。'
#             "每个国家都应该有键`name`和`population`"
#     ):
#         print(text, flush=True)

async for text in chain.astream(
        "以JSON 格式输出法国、西班牙和日本的国家及其人口列表。"
        '使用一个带有“countries”外部键的字典，其中包含国家列表。'
        "每个国家都应该有键`name`和`population`"):
        print(text, flush=True)

{}
{'countries': []}
{'countries': [{}]}
{'countries': [{'name': ''}]}
{'countries': [{'name': '法国'}]}
{'countries': [{'name': '法国', 'population': 6}]}
{'countries': [{'name': '法国', 'population': 67}]}
{'countries': [{'name': '法国', 'population': 670}]}
{'countries': [{'name': '法国', 'population': 6700}]}
{'countries': [{'name': '法国', 'population': 67000}]}
{'countries': [{'name': '法国', 'population': 670000}]}
{'countries': [{'name': '法国', 'population': 6700000}]}
{'countries': [{'name': '法国', 'population': 67000000}]}
{'countries': [{'name': '法国', 'population': 67000000}, {}]}
{'countries': [{'name': '法国', 'population': 67000000}, {'name': ''}]}
{'countries': [{'name': '法国', 'population': 67000000}, {'name': '西班牙'}]}
{'countries': [{'name': '法国', 'population': 67000000}, {'name': '西班牙', 'population': 4}]}
{'countries': [{'name': '法国', 'population': 67000000}, {'name': '西班牙', 'population': 47}]}
{'countries': [{'name': '法国', 'population': 67000000}, {'name': '西班牙', 'population': 470}]}
{