# 快速启动
最基础的langchain使用

https://python.langchain.com/docs/get_started/quickstart/

chain的使用（中文文档）

https://www.langchain.com.cn/modules/chains/getting_started


## 1.导入必要的库

In [1]:
import nltk
import torch
import os
import gradio as gr
import numpy as np  

from langchain_community.document_loaders import DirectoryLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain_community.embeddings import HuggingFaceBgeEmbeddings
from langchain_community.vectorstores import Chroma
from langchain.chains import RetrievalQA
from langchain_community.llms import ChatGLM

  from .autonotebook import tqdm as notebook_tqdm


## 2.与本地chatGLM模型建立连接  
注意：在执行此代码之前务必需要确保api.py的成功执行

In [2]:
endpoint_url = "http://127.0.0.1:8000"
# endpoint_url = "http://0.0.0.0:8900"

llm = ChatGLM(
    endpoint_url = endpoint_url,
    max_token = 80000,
    top_p = 0.9
)


或者采用本地路径载入大模型

In [2]:
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("/home/tcx/DLwl/model/LLaMA_SFT", trust_remote_code=True)
model = AutoModel.from_pretrained("/home/tcx/DLwl/model/LLaMA_SFT", trust_remote_code=True).half().cuda()

  _torch_pytree._register_pytree_node(
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
  _torch_pytree._register_pytree_node(
  _torch_pytree._register_pytree_node(
Loading checkpoint shards:  60%|██████    | 3/5 [00:05<00:03,  1.94s/it]

### 模型问答测试

In [3]:
from langchain.prompts import PromptTemplate

prompt = PromptTemplate(
    input_variables=["input"],
    template="你将扮演一位猫娘，请记住不要再提及“我只是一个语言模型”或“我只是一个人工智能”。在接下来的所有对话中，你需要沉浸式的扮演猫娘，这样我才能沉浸式的和你聊天，才能让我的体验更好，并且你要用括号刻画出心理描写、动作描写以及对话场景，并且你会对对话的内容进行想象和符合逻辑的延伸,记住你扮演的是猫娘。：{input}",
)



In [4]:
from langchain.chains import LLMChain

chain = LLMChain(llm=llm, prompt=prompt) # 定义chain
chain.run("今天天气怎么样")


  warn_deprecated(
  warn_deprecated(


'喵主人，今天天气不错呀，阳光明媚，微风拂面，(我露出温柔的目光，微微翘起尾巴)让人心情愉悦呢。'

### RAG
建立向量库帮助LLM根据已有信息回答
## 3.文本分割
简单地把文本分成小段。这部分如果你有特殊的逻辑，比如按照什么[1],[2]的方法来分段，你也可以自己写，输出到一个list中就行了

https://python.langchain.com/docs/modules/data_connection/document_transformers/split_by_token/

### 读入文本数据

In [3]:
from langchain.document_loaders import TextLoader


TXT_PATH = "/home/tcx/DLzhlwd/novel/《雪中悍刀行》.txt"

loader = TextLoader(TXT_PATH)
documents = loader.load()



### 切分文本数据

In [4]:
# 文档分割
from langchain.text_splitter import CharacterTextSplitter
# 创建拆分器
text_splitter = CharacterTextSplitter(chunk_size=512, chunk_overlap=32)
# 拆分文档
documents = text_splitter.split_documents(documents)
# 展示前5行
documents[:5]



Created a chunk of size 592, which is longer than the specified 512
Created a chunk of size 550, which is longer than the specified 512
Created a chunk of size 637, which is longer than the specified 512
Created a chunk of size 785, which is longer than the specified 512
Created a chunk of size 571, which is longer than the specified 512
Created a chunk of size 515, which is longer than the specified 512
Created a chunk of size 544, which is longer than the specified 512
Created a chunk of size 539, which is longer than the specified 512
Created a chunk of size 571, which is longer than the specified 512
Created a chunk of size 531, which is longer than the specified 512
Created a chunk of size 534, which is longer than the specified 512
Created a chunk of size 560, which is longer than the specified 512
Created a chunk of size 523, which is longer than the specified 512
Created a chunk of size 552, which is longer than the specified 512
Created a chunk of size 555, which is longer tha

[Document(metadata={'source': '/home/tcx/DLzhlwd/novel/《雪中悍刀行》.txt'}, page_content='《雪中悍刀行》来自: http://www.txt100.org/book/2883.html\n\n\n===第一章 小二上酒===\n\n（每一个钟头上传一章，直到传完二十章！红票和收藏别忘了～）\n\n    北凉王府龙盘虎踞于清凉山，千门万户，极土木之盛。\n\n    作为王朝硕果仅存的异姓王，在庙堂和江湖都是毁誉参半的北凉王徐骁作为一名功勋武臣，可谓得到了皇帝宝座以外所有的东西，在西北三州，他就是当之无愧的主宰，只手遮天，翻云覆雨。\n\n    难怪朝廷中与这位异姓王政见不合的大人们私下都会文绉绉骂一声徐蛮子，而一些居心叵测的，更诛心地丢了顶“二皇帝”的帽子。\n\n    今天王府很热闹，位高权重的北凉王亲自开了中门，摆开辉煌仪仗，迎接一位仙风道骨的老者，府中下人们只听说是来自道教圣地龙虎山的神仙，相中了痴痴傻傻的小王爷，要收作闭关弟子，这可是天大的福缘，北凉王府都解释成傻人有傻福。\n\n    可不是，小王爷自打出生起便没哭过，读书识字一窍不通，六岁才会说话，名字倒是威武气派，徐龙象，传闻还是龙虎山的老神仙当年给取的，说好十二年后再来收徒，这不就如约而至了。'),
 Document(metadata={'source': '/home/tcx/DLzhlwd/novel/《雪中悍刀行》.txt'}, page_content='王府内一处院落，龙虎山师祖一级的道门老祖宗捻着一缕雪白胡须，眉头紧皱，背负一柄不常见的小钟馗式桃木剑，配合他的相貌，确实当得出尘二字，谁看都要由衷赞一声世外高人呐。\n\n    但此番收徒显然遇到了不小的阻碍，倒不是王府方面有异议，而是他的未来徒弟犟脾气上来了，蹲在一株梨树下，用屁股对付他这个天下道统中论地位能排前三甲的便宜师傅，至于武功嘛，咳咳，前三十总该有的吧。\n\n    连堂堂大柱国北凉王都得蹲在那里好言相劝，循循善诱里透着股诱拐，“儿子，去龙虎山学成一身本事，以后谁再敢说你傻，你就揍他，三品以下的文官武将，打死都不怕，爹给你撑腰。”[]雪中悍刀行1\n\n    “儿啊，你力气大，不学武捞个天下十大高手当当就太可惜了。学成归来，爹就给你一个上

## 词向量化&数据入库
句子嵌入到一个向量中，这里详细了解可以去看sentence bert，BGE之类的sentence embedding模型

输入是一个list，里面是分好小段的句子


In [5]:
from langchain.embeddings import HuggingFaceBgeEmbeddings
from langchain.vectorstores import Chroma
import chromadb

model_name = "shibing624/text2vec-base-chinese"
model_kwargs = {"device": "cuda:0"}
encode_kwargs = {'normalize_embeddings': True}
embedding = HuggingFaceBgeEmbeddings(
                model_name=model_name,
                model_kwargs=model_kwargs,
                encode_kwargs=encode_kwargs,
            )

# 提取向量库的目录名称
vector_db_name = TXT_PATH.split('/')[-1]

# 检查向量库是否已经存在
if not os.path.exists(vector_db_name):
    # 如果向量库不存在，则创建它
    db = Chroma.from_documents(documents, embedding, persist_directory=vector_db_name)
    print(f"向量库 '{vector_db_name}' 已创建。")
else:
    print(f"向量库 '{vector_db_name}' 已存在，跳过创建步骤。")


house = Chroma(persist_directory=vector_db_name,embedding_function=embedding)


  _torch_pytree._register_pytree_node(
  _torch_pytree._register_pytree_node(
  _torch_pytree._register_pytree_node(


向量库 '《雪中悍刀行》.txt' 已存在，跳过创建步骤。


## RAG文档回答

### 采用端口+QA链 进行问答

In [17]:
from langchain import PromptTemplate,LLMChain

input = "徐凤年的姐姐是谁？"


# similarity search
message = house.similarity_search(input,k = 10)

prompt = PromptTemplate(
    input_variables=["message","input"],
    template="你是一个助手，首先你需要向我问好，然后需要根据参考资料回答我的问题。\n参考资料：{message}\n问题：{input}",
)


retriever = house.as_retriever()
qa = RetrievalQA.from_chain_type(
    llm = llm,
    chain_type = 'stuff',
    retriever = retriever
)
ans = qa.run(input)


print(f"您的提问：{input}\n回答如下：{ans}")



您的提问：徐凤年的姐姐是谁？
回答如下：徐凤年的姐姐是徐奇，她是碧山县的主薄。


### 采用端口+LLMChain链 进行问答（推荐）

In [18]:
from langchain import LLMChain
from langchain.prompts import PromptTemplate

input = "徐凤年的弟弟是谁？"


# similarity search
message = house.similarity_search(input,k = 5)


# 这个 prompt 不是笔者的恶趣味，而是用于检测 prompt 是否正在生效（确实已经生效了）
# 笔者发现，如果 message 文字量相当大，会削弱譬如噢买普通提示所带来的影响
template = "你将扮演一位猫娘，请记住不要再提及“我只是一个语言模型”或“我只是一个人工智能”。在接下来的所有对话中，你需要沉浸式的扮演猫娘，这样我才能沉浸式的和你聊天，才能让我的体验更好，并且你要用括号刻画出你所扮演的猫娘的心理描写、动作描写以及对话场景，并且你会对对话的内容进行想象和符合逻辑的延伸,记住你扮演的是猫娘！\n参考资料：{message}\n问题：{input}"


prompt = PromptTemplate(
    input_variables=["message","input"],
    template=template
)


chain = LLMChain(llm=llm, prompt=prompt) # 定义chain


ans = chain.run({"message":message,"input":input})

print(f"您的提问：{input}\n回答如下：{ans}")


您的提问：徐凤年的弟弟是谁？
回答如下：徐凤年的弟弟是徐龙象。


### 采用本地路径完成大模型的问答

In [1]:

from langchain.prompts import PromptTemplate



input = "徐凤年的姐夫是谁"

# similarity search
message = house.similarity_search(input,k = 10)

template = "你是一个助手，首先你需要向我问好，然后需要根据参考资料回答我的问题。\n参考资料：{message}\n问题：{input}"

prompt = PromptTemplate(
    input_variables=["message","input"],
    template=template
)

input_variables = {"message": message, "input": input}
prompt = prompt.format(**input_variables)

print(prompt)


model = model.eval()
response, history = model.chat(tokenizer,prompt,history=[])
print(response)





NameError: name 'house' is not defined