# 1.获取大模型

In [1]:
from tabnanny import verbose

import dotenv
from jedi.settings import cache_directory
from langchain_community.tools import TavilySearchResults
from langchain_core.tracers import LangChainTracer
from langchain_openai import ChatOpenAI
import os

from openai import max_retries

dotenv.load_dotenv()
os.environ['OPENAI_API_KEY'] = os.getenv('OPENAI_API_KEY')
os.environ['OPENAI_BASE_URL'] = os.getenv('OPENAI_BASE_URL')

# 创建大模型实例
llm = ChatOpenAI(model=os.getenv('OPENAI_MODEL'))

# 直接提供问题，并调用llm
response = llm.invoke("什么是大模型？")
print(response)


  from .autonotebook import tqdm as notebook_tqdm


APIConnectionError: Connection error.

# 2.使用提示词模板


In [None]:
from langchain_core.prompts import ChatPromptTemplate

# 需要注意的一点是，这里需要指明具体的role，在这里是system和用户
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是世界级的技术文档编写者"),
    ("user", "{input}")  # {input} 为变量
])

# 我们可以把prompt和具体的llm的调用合在一起
chain= prompt | llm
message = chain.invoke({"input":"大模型中的langchain是什么"})
print(message)
print(type(message))


# 3.使用输出解析器

In [None]:
from langchain_core.output_parsers import StrOutputParser, JsonOutputParser
#使用输出解析器
output_parser = JsonOutputParser()
#将其添加到一个链上
chain = prompt | llm | output_parser

# 答案是一个字符串，而不是ChatMessage
# chain.invoke({"input":"langchain是什么"})

chain.invoke({"input":"LangChain是什么？用JSON格式回复，问题用question，回答用answer"})


# 4.使用向量存储

pip install faiss-cpu

pip install langchain-community


In [None]:
from langchain_community.document_loaders import WebBaseLoader
import bs4

loader = WebBaseLoader(
    web_path = "https://www.gov.cn/xinwen/2020-06/01/countent_5516649.htm",
    bs_kwargs=dict(parse_only=bs4.SoupStrainer(id="UCAP-CONTENT"))
)
docs = loader.load()
print(docs)

from langchain_openai import OpenAIEmbeddings

embeddings = OpenAIEmbeddings(model="text-embedding-ada-002")

from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter

# 使用分割器分割文档
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
documents = text_splitter.split_documents(docs)
print(documents)
# 向量存储 embeddings 会将documents中的每个文本片段转换为向量，并将这些向量存储在 FAISS向量数据库中
vector = FAISS.from_documents(documents, embeddings)


# 5.RAG(检索增强生成)

In [None]:
from langchain_core.prompts import PromptTemplate

retriever = vector.as_retriever()
retriever.search_kwargs = {"k":3}
docs = retriever.invoker("建设用地使用权是什么？")

# for i,doc in enumerate(docs):
#     print(f"第{i+1}条规则：")
#     print(doc)

# 定义提示词模板
prompt_template = """
你是一个问答机器人。
你的任务是根据下述给定的已知信息回答用户问题。
确保你的回复完全依据下述已知信息。不要编造答案。
如果下述已知信息不足以回答用户的问题，请直接回复“我无法回答您的问题”。

已知信息:
{info}

用户问:
{question}

请用中文回答用户问题。
"""
template = PromptTemplate.from_template(prompt_template)
prompt = template.format(info=docs, question="建设用地使用权是什么？")

response = llm.invoke(prompt)
print(response.content)



# 6.使用Agent

In [None]:
from langchain_core.tools.retriever import create_retriever_tool
from langchain_tavily import TavilySearch

# 检索器工具
retriever_tool = create_retriever_tool(
    retriever,
    "CivilCodeRetriever",
    "搜索有关中华人民共和国民法典的信息，关于中华人民共和国民法典的任何问题，您必须使用此工具！"
)

#内置工具
web_search = TavilySearch.i

tools = [retriever_tool, web_search]
from langchain_classic import hub
from langchain.agents import create_agent

prompt = hub.pull("hwchase17/openai-functions-agent")
agent = create_agent(model=llm, tools=tools, system_prompt=prompt)

result = agent.invoke({
    "message": [{"role": "user", "content": "建设用地使用权是什么"}]
})
print(result)
#
print(result['messages'][-1].content)

In [3]:
l = [1,2,3,4,5]
print(l[0])
print(l[-2])

1
4
