### LLM_Chain

使用本地的开源模型，利用ollama来运行llama2

确保ollama服务处于运行状态

In [None]:
from langchain_community.llms import Ollama
llm = Ollama(model="llama2")

接下来我们就可以尝试使用llm调用llama2模型了。我们问它"LangSmith"是什么。
这是训练数据中没有出现过的东西，所有它并不能给出很好的回答

In [None]:
llm.invoke("how can langsmith help with testing?")

我们也可以使用提示模板来指导模型作出响应。提示模版的作用是，将用户的原始输入转换为对于llm更好的输入。

In [None]:
from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are world class technical documentation writer."),
    ("user", "{input}")
])

现在我们可以将这些组合成一个简单的LLM链

In [None]:
chain = prompt | llm 

我们现在可以调用它并问同样的问题。虽然它仍然不知道答案，但能以一种更适合技术作家的语气来回应!

In [None]:
chain.invoke({"input": "how can langsmith help with testing?"})

ChatModel的输出(也是这个链的输出)是一条消息。然而，使用字符串通常要方便得多。让我们添加一个简单的输出解析器，将聊天消息转换为字符串。

In [None]:
from langchain_core.output_parsers import StrOutputParser

output_parser = StrOutputParser()

现在可以把这个添加到前面的链中:

In [None]:
chain = prompt | llm | output_parser

现在可以调用它并问同样的问题。现在答案将是一个字符串(而不是ChatMessage)。·

In [None]:
chain.invoke({"input": "how can langsmith help with testing?"})

### Retrieval_Chain

为了正确回答最初的问题(“langsmith如何帮助测试?”)，我们需要为LLM提供额外的知识。可以通过检索来实现。当有太多的数据需要直接传递给LLM时，检索非常有用。然后，可以使用检索器只获取最相关的部分并将它们传递给LLM。在这个过程中，我们将查找相关文档，然后将它们传递给提示词。检索器可以由任何东西支持，比如SQL表、互联网等。但在本例中，我们将填充一个向量存储并将其用作检索器。

首先，我们需要加载要建立索引的数据。为此，我们将使用WebBaseLoader。这需要安装BeautifulSoup

In [None]:
pip install beautifulsoup4

之后，我们可以导入和使用WebBaseLoader。

In [None]:
from langchain_community.document_loaders import WebBaseLoader
loader = WebBaseLoader("https://docs.smith.langchain.com/user_guide")

docs = loader.load()

接下来，我们需要将其索引到vectorstore中。这需要几个组件，即embedding模型和vectorstore。

对于嵌入模型，我们再次提供了通过API或运行本地模型进行访问的示例。

确保Ollama正在运行(与LLM的设置相同)。

In [None]:
from langchain_community.embeddings import OllamaEmbeddings

embeddings = OllamaEmbeddings()

现在，我们可以使用这个嵌入模型将文档存储到vectorstore中。为了简单起见，我们将使用一个简单的本地矢量库FAISS。


首先，我们需要安装所需的软件包

In [None]:
pip install faiss-cpu

然后我们可以建立索引

In [None]:
from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter


text_splitter = RecursiveCharacterTextSplitter()
documents = text_splitter.split_documents(docs)
vector = FAISS.from_documents(documents, embeddings)

现在我们已经在vectorstore中为这些数据建立了索引，我们将创建一个检索链。该链将接收传入的问题，查找相关文档，然后将这些文档与原始问题一起传递给LLM，并要求它回答原始问题。

首先，让我们建立一个链，它接受一个问题和检索到的文档，并生成一个答案。


In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain.chains.combine_documents import create_stuff_documents_chain

prompt = ChatPromptTemplate.from_template("""Answer the following question based only on the provided context:

<context>
{context}
</context>

Question: {input}""")

document_chain = create_stuff_documents_chain(llm, prompt)

如果需要，我们可以通过直接传递文档来运行这个

In [None]:
from langchain_core.documents import Document

document_chain.invoke({
    "input": "how can langsmith help with testing?",
    "context": [Document(page_content="langsmith can let you visualize test results")]
})

然而，我们希望文档首先来自我们刚刚设置的检索器。这样，我们可以使用检索器动态地选择最相关的文档，并为给定的问题传递这些文档。

In [None]:
from langchain.chains import create_retrieval_chain

retriever = vector.as_retriever()
retrieval_chain = create_retrieval_chain(retriever, document_chain)

现在我们可以调用这个链。这将返回一个字典，来自LLM的响应在答案键中

In [None]:
response = retrieval_chain.invoke({"input": "how can langsmith help with testing?"})
print(response["answer"])

# LangSmith offers several features that can help with testing:...

这个答案应该准确得多

### Conversation Retrieval Chain

我们目前创建的链只能回答单一的问题。人们正在构建的LLM应用程序的主要类型之一是聊天机器人。那么，我们如何把这条链变成一条能够回答后续问题的链呢?

我们仍然可以使用create_retrieval_chain函数，但是我们需要改变两件事:

1.检索方法现在不应该只处理最近的输入，而是应该考虑整个历史。

2.最后的LLM链也应该考虑到整个历史

**Updating Retrieval**

为了更新检索，我们将创建一个新的链。该链将接受最近的输入(input)和对话历史(chat_history)，并使用LLM生成搜索查询。

In [None]:
from langchain.chains import create_history_aware_retriever
from langchain_core.prompts import MessagesPlaceholder

# First we need a prompt that we can pass into an LLM to generate this search query

prompt = ChatPromptTemplate.from_messages([
    MessagesPlaceholder(variable_name="chat_history"),
    ("user", "{input}"),
    ("user", "Given the above conversation, generate a search query to look up to get information relevant to the conversation")
])
retriever_chain = create_history_aware_retriever(llm, retriever, prompt)

我们可以通过传递一个用户提出后续问题的实例来对此进行测试。

In [None]:
from langchain_core.messages import HumanMessage, AIMessage

chat_history = [HumanMessage(content="Can LangSmith help test my LLM applications?"), AIMessage(content="Yes!")]
retriever_chain.invoke({
    "chat_history": chat_history,
    "input": "Tell me how"
})

您应该看到，这将返回关于在LangSmith中进行测试的文档。这是因为LLM生成了一个新的查询，将聊天历史记录与后续问题结合起来。

现在我们有了这个新的检索器，我们可以创建一个新的链，以便在记住这些检索到的文档的情况下继续对话

In [None]:
prompt = ChatPromptTemplate.from_messages([
    ("system", "Answer the user's questions based on the below context:\n\n{context}"),
    MessagesPlaceholder(variable_name="chat_history"),
    ("user", "{input}"),
])
document_chain = create_stuff_documents_chain(llm, prompt)

retrieval_chain = create_retrieval_chain(retriever_chain, document_chain)

我们现在可以端到端测试

In [None]:
chat_history = [HumanMessage(content="Can LangSmith help test my LLM applications?"), AIMessage(content="Yes!")]
retrieval_chain.invoke({
    "chat_history": chat_history,
    "input": "Tell me how"
})

我们可以看到，这给出了一个连贯的答案——我们已经成功地把检索链变成了一个聊天机器人!

### Agent

到目前为止，我们已经创建了链的例子，其中每一步都是提前知道的。我们将创建的最后一个东西是代理——LLM决定采取什么步骤。

**NOTE: 对于本例，我们将只展示如何使用OpenAI模型创建代理，因为本地模型还不够可靠。**

构建代理时要做的第一件事是决定它应该访问哪些工具。对于本例，我们将为代理提供两个工具的访问权限:

1.我们刚刚创造的检索器。这将使它很容易回答有关LangSmith的问题

2.一个搜索工具。这将使它很容易回答需要最新信息的问题。

首先，让我们为刚刚创建的检索器设置一个工具:

In [None]:
from langchain.tools.retriever import create_retriever_tool

retriever_tool = create_retriever_tool(
    retriever,
    "langsmith_search",
    "Search for information about LangSmith. For any questions about LangSmith, you must use this tool!",
)

我们将使用的搜索工具是Tavily。这将需要一个API密钥(他们有免费的)。在他们的平台上创建它之后，你需要将它设置为一个环境变量:

In [None]:
export TAVILY_API_KEY=...

如果您不想设置API密钥，可以跳过创建此工具

In [None]:
from langchain_community.tools.tavily_search import TavilySearchResults

search = TavilySearchResults()

现在我们可以创建一个我们想要使用的工具列表

In [None]:
tools = [retriever_tool, search]

现在我们有了这些工具，我们可以创建一个代理来使用它们。我们将很快地过一遍这一点——要更深入地了解到底发生了什么，请查看Agent的入门文档

Install langchain hub first

In [None]:
pip install langchainhub

要与OpenAI交互，我们需要使用与OpenAI SDK连接的langchain-openai [https://github.com/langchain-ai/langchain/tree/master/libs/partners/openai]]

In [None]:
pip install langchain-openai

现在我们可以使用它来获得一个预定义的提示符

In [None]:
from langchain_openai import ChatOpenAI
from langchain import hub
from langchain.agents import create_openai_functions_agent
from langchain.agents import AgentExecutor

# Get the prompt to use - you can modify this!
prompt = hub.pull("hwchase17/openai-functions-agent")

# You need to set OPENAI_API_KEY environment variable or pass it as argument `openai_api_key`.
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
agent = create_openai_functions_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

现在我们可以调用代理，看看它是如何响应的!我们可以问它关于LangSmith的问题

In [None]:
agent_executor.invoke({"input": "how can langsmith help with testing?"})

我们可以问它关于天气的问题

In [None]:
agent_executor.invoke({"input": "what is the weather in SF?"})

我们可以和它对话

In [None]:
chat_history = [HumanMessage(content="Can LangSmith help test my LLM applications?"), AIMessage(content="Yes!")]
agent_executor.invoke({
    "chat_history": chat_history,
    "input": "Tell me how"
})

### Serving with LangServe

现在我们已经构建了一个应用程序，我们需要为它提供服务。这就是LangServe的用武之地。LangServe帮助开发人员将LangChain链部署为REST API。你不需要使用LangServe来使用LangChain，但在本指南中，我们将展示如何使用LangServe部署应用程序。

虽然本指南的第一部分在Jupyter Notebook中运行，但我们现在将不再使用它。我们将创建一个Python文件，然后从命令行与它交互。

要为我们的应用程序创建一个服务器，我们将创建一个server .py文件。这将包含为应用程序提供服务的逻辑。它由三部分组成:

* 我们刚刚构建的链的定义
* FastAPI应用
* 为链提供服务的路由的定义，使用langserve.add_routes完成

```
#!/usr/bin/env python
from typing import List

from fastapi import FastAPI
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_community.document_loaders import WebBaseLoader
from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.tools.retriever import create_retriever_tool
from langchain_community.tools.tavily_search import TavilySearchResults
from langchain import hub
from langchain.agents import create_openai_functions_agent
from langchain.agents import AgentExecutor
from langchain.pydantic_v1 import BaseModel, Field
from langchain_core.messages import BaseMessage
from langserve import add_routes

# 1. Load Retriever
loader = WebBaseLoader("https://docs.smith.langchain.com/user_guide")
docs = loader.load()
text_splitter = RecursiveCharacterTextSplitter()
documents = text_splitter.split_documents(docs)
embeddings = OpenAIEmbeddings()
vector = FAISS.from_documents(documents, embeddings)
retriever = vector.as_retriever()

# 2. Create Tools
retriever_tool = create_retriever_tool(
    retriever,
    "langsmith_search",
    "Search for information about LangSmith. For any questions about LangSmith, you must use this tool!",
)
search = TavilySearchResults()
tools = [retriever_tool, search]


# 3. Create Agent
prompt = hub.pull("hwchase17/openai-functions-agent")
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
agent = create_openai_functions_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)


# 4. App definition
app = FastAPI(
  title="LangChain Server",
  version="1.0",
  description="A simple API server using LangChain's Runnable interfaces",
)

# 5. Adding chain route

# We need to add these input/output schemas because the current AgentExecutor
# is lacking in schemas.

class Input(BaseModel):
    input: str
    chat_history: List[BaseMessage] = Field(
        ...,
        extra={"widget": {"type": "chat", "input": "location"}},
    )


class Output(BaseModel):
    output: str

add_routes(
    app,
    agent_executor.with_types(input_type=Input, output_type=Output),
    path="/agent",
)

if __name__ == "__main__":
    import uvicorn

    uvicorn.run(app, host="localhost", port=8000)
    
```

执行这个文件

```python serve.py```

我们可以看到我们的链在8000端口服务