In [1]:
import os
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import warnings
warnings.filterwarnings('ignore')

# Dataset

In [2]:
json_file = "./Ecommerce_FAQ_Chatbot_dataset_Persian.json"
bank = pd.read_json(json_file)
bank = pd.json_normalize(bank['questions'])
bank.head()

Unnamed: 0,question,answer
0,چگونه می‌توانم یک حساب کاربری ایجاد کنم؟,برای ایجاد یک حساب کاربری، روی دکمه 'Sign Up' ...
1,چه روش‌های پرداختی را قبول می‌کنید؟,ما کارت‌های اعتباری اصلی، کارت‌های بدهی و PayP...
2,چگونه می‌توانم سفارش خود را پیگیری کنم؟,شما می‌توانید با ورود به حساب کاربری خود و مرا...
3,سیاست بازگشت کالاهای شما چیست؟,سیاست بازگشت ما به شما اجازه می‌دهد تا محصولات...
4,آیا می‌توانم سفارش خود را لغو کنم؟,شما می‌توانید سفارش خود را در صورتی که هنوز ار...


In [3]:
bank["content"] = bank.apply(lambda row: f"Question: {row['question']}\nAnswer: {row['answer']}", axis=1)
bank.head()

Unnamed: 0,question,answer,content
0,چگونه می‌توانم یک حساب کاربری ایجاد کنم؟,برای ایجاد یک حساب کاربری، روی دکمه 'Sign Up' ...,Question: چگونه می‌توانم یک حساب کاربری ایجاد ...
1,چه روش‌های پرداختی را قبول می‌کنید؟,ما کارت‌های اعتباری اصلی، کارت‌های بدهی و PayP...,Question: چه روش‌های پرداختی را قبول می‌کنید؟\...
2,چگونه می‌توانم سفارش خود را پیگیری کنم؟,شما می‌توانید با ورود به حساب کاربری خود و مرا...,Question: چگونه می‌توانم سفارش خود را پیگیری ک...
3,سیاست بازگشت کالاهای شما چیست؟,سیاست بازگشت ما به شما اجازه می‌دهد تا محصولات...,Question: سیاست بازگشت کالاهای شما چیست؟\nAnsw...
4,آیا می‌توانم سفارش خود را لغو کنم؟,شما می‌توانید سفارش خود را در صورتی که هنوز ار...,Question: آیا می‌توانم سفارش خود را لغو کنم؟\n...


# LangChain Document

In [4]:
from langchain.docstore.document import Document

# Prepare documents for LangChain
documents = []
for _, row in bank.iterrows():
    documents.append(Document(page_content=row["content"]))

documents[1]

Document(page_content='Question: چه روش\u200cهای پرداختی را قبول می\u200cکنید؟\nAnswer: ما کارت\u200cهای اعتباری اصلی، کارت\u200cهای بدهی و PayPal را به عنوان روش\u200cهای پرداخت برای سفارش\u200cهای آنلاین قبول می\u200cکنیم.')

# Embedding

In [5]:
# from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_huggingface import HuggingFaceEmbeddings
hg_embeddings = HuggingFaceEmbeddings()

.gitattributes:   0%|          | 0.00/1.23k [00:00<?, ?B/s]

1_Pooling/config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/10.6k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/571 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

data_config.json:   0%|          | 0.00/39.3k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/438M [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/438M [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/239 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/363 [00:00<?, ?B/s]

train_script.py:   0%|          | 0.00/13.1k [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

In [6]:
from langchain.vectorstores import Chroma

persist_directory = './Reg3_Data'

langchain_chroma = Chroma.from_documents(
    documents=documents,
    collection_name="chatbot_finance",
    embedding=hg_embeddings,
    persist_directory=persist_directory
)

# Loading LLM Model

In [7]:
from torch import cuda, bfloat16
import torch
import transformers
from transformers import AutoTokenizer
from time import time
from langchain.llms import HuggingFacePipeline
from langchain.chains import RetrievalQA
from langchain.vectorstores import Chroma

In [8]:
model_id = "MehdiHosseiniMoghadam/AVA-Llama-3-V2"

device = f'cuda:{cuda.current_device()}' if cuda.is_available() else 'cpu'

# set quantization configuration to load large model with less GPU memory
# this requires the `bitsandbytes` library
bnb_config = transformers.BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type='nf4',
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=bfloat16
)

print(device)

cuda:0


In [9]:
import os
os.environ['CUDA_LAUNCH_BLOCKING'] = '1'

model_config = transformers.AutoConfig.from_pretrained(
   model_id,
    trust_remote_code=True,
    max_new_tokens=1024
)
model = transformers.AutoModelForCausalLM.from_pretrained(
    model_id,
    trust_remote_code=True,
    config=model_config,
    quantization_config=bnb_config,
    device_map='auto',
)
tokenizer = AutoTokenizer.from_pretrained(model_id)

Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]

# Pipeline

In [12]:
# Initialize the query pipeline with increased max_length
query_pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    torch_dtype=torch.float16,
    max_length=6000,  # Increase max_length
    max_new_tokens=500,  # Control the number of new tokens generated
    device_map="auto",
)

# Evaluate LLM

In [13]:
from IPython.display import display, Markdown

def colorize_text(text):
    for word, color in zip(["Reasoning", "Question", "Answer", "Total time"], ["blue", "red", "green", "magenta"]):
        text = text.replace(f"{word}:", f"\n\n**<font color='{color}'>{word}:</font>**")
    return text

llm = HuggingFacePipeline(pipeline=query_pipeline)

question = "چت بات چیست؟"
response = llm(prompt=question)

full_response =  f"Question: {question}\nAnswer: {response}"
display(Markdown(colorize_text(full_response)))

Both `max_new_tokens` (=500) and `max_length`(=6000) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)




**<font color='red'>Question:</font>** چت بات چیست؟


**<font color='green'>Answer:</font>** چت بات چیست؟ بات (به انگلیسی: Bat) یک پرنده شب‌زی است که در شب پرواز می‌کند و شبانه به دنبال شکار می‌رود. بات‌ها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها وجود دارد. بات‌ها معمولاً در شب پرواز می‌کنند و شبانه به دنبال شکار می‌روند. آنها معمولاً در مناطق مختلف جهان یافت می‌شوند و انواع مختلفی از آنها

# Building the RAG QA Chain using Langchain and Create Chatbot Interface

In [14]:
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from langchain_community.llms import HuggingFaceHub
from IPython.display import display, Markdown
import os
import warnings
warnings.filterwarnings('ignore')

In [15]:
os.environ["HUGGINGFACEHUB_API_TOKEN"] = "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"

In [None]:
def GetAnswer(prompt):
    prompt = f"### Human:{prompt}\n### Assistant:"
    
    
    # inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
    inputs = tokenizer(prompt, return_tensors="pt")
    
    generation_config = GenerationConfig(
        do_sample=True,
        top_k=1,
        temperature=0.99,
        max_new_tokens=90,
        pad_token_id=tokenizer.eos_token_id
    )
    
    outputs = model.generate(**inputs, generation_config=generation_config)
    print(tokenizer.decode(outputs[0], skip_special_tokens=True))

In [18]:
# Define the prompt template
template = """
You are a Finance QNA Expert, Analyze the Query and Respond to Customer with suitable answer. If you don't know the answer, just say "Sorry, I don't know."
Question: {question}
Context: {context}
Answer:
"""

# template = "### Human:{prompt}\n### Assistant:"

PROMPT = PromptTemplate(input_variables=["context", "query"], template=template)

retriever = langchain_chroma.as_retriever(search_kwargs={"k": 1})

qa_chain = RetrievalQA.from_chain_type(
    llm, retriever=retriever, chain_type_kwargs={"prompt": PROMPT}
)

In [None]:
def chat_with_rag():
    print("Welcome to the GenAI Financial Chatbot. Type 'exit' to end the conversation.")
    while True:
        query = input("You: ")
        if query.lower() in ["exit", "quit"]:
            break
        context = "Your context here"  # Provide context if necessary, otherwise leave it empty
        try:
            result = qa_chain({"context": context, "query": query})
            print(f"Chatbot: {result['result']}")
        except RuntimeError as e:
            print(f"RuntimeError encountered: {e}")

# Run the chat
chat_with_rag()

Welcome to the GenAI Financial Chatbot. Type 'exit' to end the conversation.


You:  سلام چگونه م یتوانم یک حساب کاربری ایجاد کنم ؟ 


Both `max_new_tokens` (=500) and `max_length`(=6000) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Chatbot: 
You are a Finance QNA Expert, Analyze the Query and Respond to Customer with suitable answer. If you don't know the answer, just say "Sorry, I don't know."
Question: سلام چگونه م یتوانم یک حساب کاربری ایجاد کنم ؟ 
Context: Question: چگونه می‌توانم یک حساب کاربری ایجاد کنم؟
Answer: برای ایجاد یک حساب کاربری، روی دکمه 'Sign Up' در گوشه بالا سمت راست وبسایت ما کلیک کنید و دستورالعمل‌ها را برای تکمیل فرآیند ثبت‌نام دنبال کنید.
Answer:
To create an account, click on the "Sign Up" button in the top right corner of our website and follow the instructions to complete the registration process.


You:  چه رو شهای پرداختی را قبول م یکنید؟


Both `max_new_tokens` (=500) and `max_length`(=6000) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Chatbot: 
You are a Finance QNA Expert, Analyze the Query and Respond to Customer with suitable answer. If you don't know the answer, just say "Sorry, I don't know."
Question: چه رو شهای پرداختی را قبول م یکنید؟
Context: Question: آیا می‌توانم از چند کد تخفیف در یک سفارش استفاده کنم؟
Answer: معمولاً تنها یک کد تخفیف برای هر سفارش قابل اعمال است. در فرآیند پرداخت، کد تخفیف خود را در بخش مربوطه وارد کنید تا تخفیف برای سفارش شما اعمال شود.
Answer:
Yes, you can use multiple discount codes for a single order. You can apply the discount codes in the payment process, and the system will automatically calculate the total discount amount. Please note that the discount codes must be valid and not expired. If you have any questions or concerns, please feel free to ask.
