In [81]:
from langchain_community.chat_models.tongyi import ChatTongyi
from langchain_core.messages import HumanMessage, SystemMessage,AIMessageChunk
from langchain.prompts import ChatPromptTemplate
from dotenv import load_dotenv
import os

In [82]:
load_dotenv()
DASHSCOPE_API_KEY = os.getenv('DASHSCOPE_API_KEY')

In [83]:
llm = ChatTongyi(model="qwen-max")

In [84]:
# 创建用户消息
message = [
    SystemMessage(content='你是一个友好的助手'),
    HumanMessage(content="给我介绍一下深度学习")
]

In [85]:
for chunk in llm.stream(message):
    if isinstance(chunk, AIMessageChunk):
        print(chunk.content, end="", flush=True)
print()

深度学习是一种机器学习的方法，它通过模拟人脑神经网络的工作方式来实现对数据的学习和理解。深度学习模型通常由多层神经网络组成，每一层都包含大量的神经元，这些神经元之间通过权重连接，并且能够处理输入数据的不同特征。

### 深度学习的主要特点包括：

- **多层次结构**：与传统的浅层学习算法相比，深度学习模型拥有更多的层次，这使得它们能够从原始数据中自动提取出更高级别的抽象特征。
- **端到端的学习能力**：深度学习可以直接从原始数据（如图像、声音或文本）出发进行训练，而不需要手动设计特征抽取器。
- **强大的表达力**：由于其复杂的结构，深度学习模型能够捕捉到数据中的复杂模式，从而在许多任务上取得了超越传统方法的表现。

### 应用领域

深度学习已经在多个领域展现出了巨大的潜力，包括但不限于：

- **计算机视觉**：图像分类、物体检测、人脸识别等。
- **自然语言处理**：情感分析、机器翻译、语音识别等。
- **医疗健康**：疾病诊断、基因组学研究等。
- **自动驾驶**：环境感知、决策制定等。
- **推荐系统**：个性化内容推荐、广告投放优化等。

### 常见的深度学习框架

为了方便开发者构建和训练深度学习模型，目前有许多流行的开源框架可供选择，例如TensorFlow、PyTorch、Keras等。这些工具提供了丰富的API以及预训练模型库，极大地简化了开发流程。

总之，随着计算资源的不断增长以及大量高质量标注数据集的出现，深度学习已经成为人工智能领域中最活跃的研究方向之一，并且正在不断地推动着各行各业的技术进步。


## 使用提示词模版

In [86]:
from langchain_core.prompts import ChatPromptTemplate

In [87]:
prompt=ChatPromptTemplate.from_messages([
    ("system","你是世界级的技术文档编写者"),
    ("user","{input}")
])

In [88]:
chat=prompt | llm
message = chat.invoke({"input":"大模型中的LangChain是什么？"})
print(message)

content='LangChain 是一个用于开发和部署基于语言模型的应用程序的开源框架。它由 Harrison Chase 创建，并在2023年获得了广泛关注。LangChain 的主要目标是简化使用大型语言模型（LLMs）构建应用程序的过程，提供了一种更高效、灵活的方式来集成这些强大的AI工具到各种软件项目中。\n\n### 主要特点\n\n- **模块化设计**：LangChain 提供了多种组件，包括数据加载器、文本分割器、嵌入式向量存储等，使得开发者可以根据需要选择合适的部件来组装自己的应用。\n- **支持多种模型**：除了支持OpenAI的GPT系列外，还兼容其他流行的语言模型如Anthropic的Claude、Google的PaLM等。\n- **易于扩展**：用户可以轻松添加自定义逻辑或第三方服务，以增强现有功能或创建全新功能。\n- **安全性考量**：内置了一些安全措施帮助开发者更好地管理API密钥等敏感信息。\n\n### 应用场景\n\n- **聊天机器人**：利用预训练的语言模型快速搭建能够进行自然对话的服务。\n- **文档理解与问答系统**：通过结合特定领域的文档资料，为用户提供精准的信息检索及问题解答。\n- **代码生成与辅助编程**：帮助程序员编写代码片段、审查代码质量甚至自动化完成某些编程任务。\n- **内容创作**：生成文章、故事或其他形式的文字内容。\n\n总之，LangChain 为想要利用先进的人工智能技术解决问题的企业和个人提供了强大而便捷的解决方案。随着其社区不断壮大以及更多贡献者的加入，我们可以期待看到更多创新性的应用场景出现。' additional_kwargs={} response_metadata={'model_name': 'qwen-max', 'finish_reason': 'stop', 'request_id': '52bce8e4-a9d7-4ab4-8a0f-b883ccdc90e9', 'token_usage': {'input_tokens': 26, 'output_tokens': 335, 'prompt_tokens_details': {'cached_tokens': 0}, 'total_tokens': 361}} id='run--844237d3-8c30

## 使用输出解释器

In [89]:
from langchain_community.chat_models.tongyi import ChatTongyi
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser,JsonOutputParser

In [90]:
# 初始化模型
llm = ChatTongyi(model="qwen-max")
# 创建提示模板
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是世界级的技术文档编写者。"),
    ("user", "{input}")
])

In [91]:
# 使用输出解析器
# output_parser = StrOutputParser()
output_parser = JsonOutputParser()
# 将其添加到上一个链中
# chain = prompt | llm
chain = prompt | llm | output_parser
# 调用它并提出同样的问题。答案是一个字符串，而不是ChatMessage
# chain.invoke({"input": "LangChain是什么?"})
chain.invoke({"input": "LangChain是什么? 用JSON格式回复，问题用question，回答用answer"})

{'question': 'LangChain是什么?',
 'answer': 'LangChain是一个旨在简化语言模型（如GPT系列）与不同应用程序集成过程的开源框架。它提供了一系列工具和接口，使得开发者能够更容易地利用强大的语言模型来构建复杂的应用程序，包括但不限于聊天机器人、文本生成器等。通过LangChain，用户可以更加专注于应用逻辑的设计而非底层实现细节，从而加速开发流程并提高效率。'}

### 使用向量存储

In [92]:
from langchain_community.document_loaders import WebBaseLoader
import bs4

In [104]:
loader = WebBaseLoader(
    web_path="https://github.langchain.ac.cn/langgraph/concepts/multi_agent/",
    bs_kwargs=dict(parse_only=bs4.SoupStrainer(id="UCAP-CONTENT"))
)
docs = loader.load()

In [94]:
from langchain_community.embeddings import DashScopeEmbeddings

In [95]:
embeddings=DashScopeEmbeddings(model="text-embedding-v1")

In [97]:
from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter
# 使用分割器分割文档
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
documents = text_splitter.split_documents(docs)
print(len(documents))
# 向量存储 embeddings 会将 documents 中的每个文本片段转换为向量，并将这些向量存储在 FAISS向量数据库中
vector = FAISS.from_documents(documents, embeddings)

5


## RAG检索

In [98]:
from langchain_core.prompts import PromptTemplate

In [99]:
retriever = vector.as_retriever()
retriever.search_kwargs = {"k": 3}
docs = retriever.invoke("建设用地使用权是什么？")
# for i,doc in enumerate(docs):
# print(f"⭐第{i+1}条规定：")
# print(doc)

In [100]:
# 6.定义提示词模版
prompt_template = """
你是一个问答机器人。
你的任务是根据下述给定的已知信息回答用户问题。
确保你的回复完全依据下述已知信息。不要编造答案。
如果下述已知信息不足以回答用户的问题，请直接回复"我无法回答您的问题"。

已知信息:
{info}

用户问：
{question}

请用中文回答用户问题。
"""

In [101]:
# 7.得到提示词模版对象
template = PromptTemplate.from_template(prompt_template)

In [102]:
# 8.得到提示词对象
prompt = template.format(info=docs, question='建设用地使用权是什么？')

In [103]:
## 9. 调用LLM
response = llm.invoke(prompt)
print(response.content)

我无法回答您的问题。已知信息中没有关于建设用地使用权的具体定义或解释。建设用地使用权一般是指依法对国家所有的土地享有占有、使用和收益的权利，用于建造建筑物、构筑物及其附属设施，但具体的条款和细节需要参考相关法律法规。如果您有关于民法典宣传活动或其他相关内容的问题，我可以根据提供的信息帮助解答。


## 使用agent

In [105]:
from langchain.tools.retriever import create_retriever_tool

In [106]:
 # 检索器工具
retriever_tool = create_retriever_tool(
    retriever,
    "CivilCodeRetriever",
    "搜索有关中华人民共和国民法典的信息。关于中华人民共和国民法典的任何问题，您必须使用此工具!",
)
tools = [retriever_tool]

In [107]:
from langchain import hub
from langchain.agents import create_openai_functions_agent
from langchain.agents import AgentExecutor
# https://smith.langchain.com/hub
prompt = hub.pull("hwchase17/openai-functions-agent")
agent = create_openai_functions_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
# 运行代理
agent_executor.invoke({"input": "建设用地使用权是什么"})





[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m[0m

[1m> Finished chain.[0m


{'input': '建设用地使用权是什么', 'output': ''}