# LangChain

## Required Packages

In [1]:
# %pip install transformers
# %pip install openai
# %pip install langchain
# %pip install sentence_transformers
# %pip install requests
# %pip install faiss-cpu
# %pip install auto-gptq
# %pip install peft
# %pip install accelerate

%env PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True

env: PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True


In [2]:
# from google.colab import drive
# drive.mount('/content/drive')

## Required Libraries

In [3]:
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline, logging
from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfig
import torch
from langchain import LLMChain
from langchain.prompts.prompt import PromptTemplate
from langchain.memory import ConversationBufferMemory
from langchain.llms import HuggingFacePipeline
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.document_loaders import DirectoryLoader
from langchain.embeddings import HuggingFaceEmbeddings

  from .autonotebook import tqdm as notebook_tqdm


## Quantized model

In [4]:
access_token = "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"
# model_name_or_path = "TheBloke/CodeLlama-7B-GPTQ"
model_name_or_path = "Viet-Mistral/Vistral-7B-Chat"

tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True, token=access_token)
# model = AutoModelForCausalLM.from_pretrained(model_name_or_path, token=access_token)
# tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, token=access_token)
model = AutoModelForCausalLM.from_pretrained(
    model_name_or_path,
    torch_dtype=torch.bfloat16, # change to torch.float16 if you're using V100
    device_map="auto",
    use_cache=True,
    token=access_token
)

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Loading checkpoint shards: 100%|██████████| 2/2 [00:03<00:00,  1.67s/it]


## Model Pipeline

In [5]:
#logging.set_verbosity(logging.CRITICAL)

pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=512,
    temperature=0.1,
    top_p=0.95,
    repetition_penalty=1.15
)

## Embeddings Model

In [6]:
embeddings=HuggingFaceEmbeddings(model_name='intfloat/multilingual-e5-small', model_kwargs={"device": "cuda:0"})

## Local Vector Database

In [7]:
vector_db_path = "vectorstores/db_faiss"
db = FAISS.load_local(vector_db_path, embeddings)

In [8]:
db.similarity_search('Cá nhân kinh doanh bất động sản có thể cho thuê mấy căn nhà?')

[Document(page_content='15.1. Truy vấn thư tín dụng15. Truy vấn tài trợ \nthương mại\n15.2. Truy vấnnhờthu\n15.3. Truy vấnbảolãnh ngân hàngTruy vấn các khoản tài trợ thương mại doanh nghiệp', metadata={'source': 'data/HDSD_Techcombank_Business_Web.pdf', 'page': 123}),
 Document(page_content='10. Trảlương theo lô\n10.1. Khởi tạo\n10.2. Truy vấn\n10.3. Phê duyệ tChitrảlương chocánbộnhân viên', metadata={'source': 'data/HDSD_Techcombank_Business_Web.pdf', 'page': 74}),
 Document(page_content='Trường hợp ápdụng tỷgiáthỏa thuận\nCẩm nang hướng dẫn 46', metadata={'source': 'data/HDSD-DV-NHDT.pdf', 'page': 44}),
 Document(page_content='-Yêucầutrasoát\n-Chuyển tiềnquốc tế\n-Mua ngoại tệthanh toán nợ\n-Mua ngoại tệThanh toán lương\n-Bánngoại tệ-Chuyển ngoại tệtrong nước\n-Thanh toán khoản vay\n-YêucầutớiNgân hàng\n-Thanh toán trựctuyến\n-Chuyển tiềnnhanh 24/7Loại giao dịch :', metadata={'source': 'data/HDSD-DV-NHDT.pdf', 'page': 17})]

## Code QA Bot

In [9]:
llm=HuggingFacePipeline(pipeline=pipe)

In [10]:
memory = ConversationBufferMemory(memory_key="chat_history",    k=3,
    return_messages=True)

In [11]:
CodeLlama = RetrievalQA.from_chain_type(llm=llm,
                                chain_type="stuff",
                                retriever=db.as_retriever(),
                                return_source_documents=True)

## Querying

In [14]:
query = "Khôi phục mật khẩu trực tuyến như thế nào?"
result = CodeLlama({"query": query})

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


In [15]:
print("ANSWER:\n\n",result['result'])

ANSWER:

  Để khôi phục lại mật khẩu của bạn trực tuyến, hãy làm theo các bước sau đây :
1. Chọn "Quên Mật Khẩu" từ màn hình đăng nhập F@st EBank.
2. Nhập địa chỉ thư điện tử hoặc số CMND mà bạn sử dụng cho dịch vụ ngân hàng trực tuyến.
3. Nếu là người dùng không phải đại lý (Non Agent User ), hệ thống sẽ yêu cầu bạn cung cấp một câu hỏi bí mật trước đó cùng với đáp án tương ứng. Bạn có thể tìm thấy những chi tiết này ở phần hồ sơ cá nhân của mình. Sau khi trả lời chính xác cả hai câu hỏi thì nhấp chuột vào nút 'Gửi'.
Nếu là Đại Lý, bạn sẽ được chuyển sang trang web Ngân Hàng Trực Tuyến nơi bạn có thể tạo ra một mật khẩu tạm thời. Hãy nhớ rằng mật khẩu tạm thời này chỉ tồn tại tối đa ba ngày kể từ lúc nó được tạo ra.
4. Khi bạn đã đặt xong mật khẩu mới, đừng quên cập nhật chúng ngay sau lần truy cập đầu tiên. Điều này rất quan trọng đối với sự an toàn của bạn! Đảm bảo rằng mật khẩu mới phù hợp với quy định về độ dài cũng như cấu trúc do website đưa ra. Nhấn tiếp tục để hoàn tất quá trì