In [None]:
%pip install openai python-docx

In [None]:
%pip install python-dotenv

In [3]:
import os
import openai
import docx
from dotenv import load_dotenv


In [4]:
class Chatbot:
    """
    A class to encapsulate the RAG chatbot functionality,
    allowing for custom API endpoints.
    """
    def __init__(self, api_key, model="gpt-4.1-mini", base_url="https://api.metisai.ir/openai/v1"):
        """
        Initializes the Chatbot, setting up the OpenAI client with a custom base URL.
        """
        if not api_key:
            raise ValueError("OpenAI API key is required.")
        
        self.model = model
        try:
            self.client = openai.OpenAI(api_key=api_key, base_url=base_url)
        except Exception as e:
            print(f"Error initializing OpenAI client: {e}")
            self.client = None

    def load_knowledge_base(self, directory="knowledge_docs"):
        """
        Loads knowledge from all .docx files in a specified directory.
        It now chunks the document by blank lines (double newlines) to keep related paragraphs together.
        """
        all_chunks = []
        print(f"Loading knowledge from directory: '{directory}'...")
        if not os.path.exists(directory) or not os.path.isdir(directory):
            print(f"Error: The directory '{directory}' was not found.")
            print("Please create it and add your .docx knowledge files.")
            return []
        
        doc_files = [f for f in os.listdir(directory) if f.endswith(".docx")]
        if not doc_files:
            print(f"Warning: No .docx files found in the '{directory}' directory.")
            return []

        for filename in doc_files:
            filepath = os.path.join(directory, filename)
            try:
                doc = docx.Document(filepath)
                # Reconstruct the full text to handle chunks separated by blank lines
                full_text = "\n".join(p.text for p in doc.paragraphs)
                # Split by double newline (which signifies a blank line in the doc)
                chunks = [chunk.strip() for chunk in full_text.split('\n\n') if chunk.strip()]
                all_chunks.extend(chunks)
                print(f"  - Loaded {len(chunks)} chunks from {filename}")
            except Exception as e:
                print(f"  - Could not read {filename}. Skipping. Error: {e}")
        
        print(f"Total knowledge chunks loaded: {len(all_chunks)}")
        return all_chunks

    def print_knowledge_base(self, knowledge_chunks):
        """Prints the loaded knowledge base chunks for verification."""
        print("\n--- Knowledge Base Loaded ---")
        if not knowledge_chunks:
            print("The knowledge base is empty or could not be loaded.")
        else:
            for i, chunk in enumerate(knowledge_chunks):
                print(f"  Chunk {i+1}: {chunk[:80]}...")
        print("-----------------------------\n")

    def retrieve_relevant_chunks(self, query, knowledge_chunks):
        """
        Performs 'naive' retrieval by finding the chunk with the most keyword matches.
        """
        query_words = set(query.lower().split())
        best_chunk = ""
        max_score = 0

        if not knowledge_chunks:
            return "No knowledge base loaded."

        for chunk in knowledge_chunks:
            chunk_words = set(chunk.lower().split())
            score = len(query_words.intersection(chunk_words))
            if score > max_score:
                max_score = score
                best_chunk = chunk
        
        if max_score > 0:
            return best_chunk
        else:
            return knowledge_chunks[0]

    def generate_response(self, query, context):
        """
        Generates a response using the specified model and context.
        """
        if not self.client:
            return "OpenAI client is not initialized. Cannot generate response."

        system_prompt = """
        شما یک دستیار خدمات مشتری متخصص و دوستانه برای یک شرکت هستید. نام شما «پشتیبان» است.
        شما باید فقط و فقط بر اساس «زمینه» ارائه شده به «سوال» کاربر پاسخ دهید.
        اطلاعاتی را از خودتان اضافه نکنید. اگر زمینه برای پاسخ دادن کافی نیست،
        مودبانه بگویید که اطلاعات کافی برای پاسخ به آن سوال را ندارید.
        ***شما باید همیشه و فقط به زبان فارسی پاسخ دهید.***
        """
        
        user_prompt = f"زمینه: \"{context}\"\n\nسوال: \"{query}\""

        try:
            completion = self.client.chat.completions.create(
                model=self.model,
                messages=[
                    {"role": "system", "content": system_prompt},
                    {"role": "user", "content": user_prompt}
                ],
                temperature=0.5,
            )
            return completion.choices[0].message.content
        except openai.APIError as e:
            print(f"OpenAI API Error: {e}")
            return "متاسفانه در ارتباط با هوش مصنوعی خطایی رخ داد. لطفا دوباره تلاش کنید."
        except Exception as e:
            print(f"An unexpected error occurred: {e}")
            return "یک خطای غیرمنتظره رخ داد. لطفا با پشتیبانی تماس بگیرید."

In [9]:
def run():
    """Main function to initialize and run the chatbot loop."""
    print("--- My ChatBot ---")

    # Load environment variables from .env file
    load_dotenv()

    api_key = os.environ.get("OPENAI_API_KEY")

    if not api_key:
        print("Error: The OPENAI_API_KEY environment variable is not set.")
        print("Please set it before running the script.")
        return

    try:
        chatbot = Chatbot(api_key=api_key)
    except ValueError as e:
        print(e)
        return

    print("برای خروج 'خروج' را تایپ کنید")

    knowledge = chatbot.load_knowledge_base("C:/Users/USER/Desktop/chatbot-project/knowledge_docs")

    if not knowledge:
        return

    #chatbot.print_knowledge_base(knowledge)

    while True:
        user_query = input("شما: ")
        if user_query.lower() == 'خروج':
            break

        context_chunk = chatbot.retrieve_relevant_chunks(user_query, knowledge)
        answer = chatbot.generate_response(user_query, context_chunk)

        print(f"پشتیبان: {answer}")

In [10]:
run()

--- My ChatBot ---
برای خروج 'خروج' را تایپ کنید
Loading knowledge from directory: 'C:/Users/USER/Desktop/chatbot-project/knowledge_docs'...
  - Loaded 2 chunks from 01- درباره شرکت تابان انرژی- Rev02.docx
  - Loaded 15 chunks from 02- معرفی تابان در مجله - Rev05.docx
  - Loaded 1 chunks from 03- 07- فروشگاه.docx
  - Loaded 19 chunks from 05- سایــر.docx
Total knowledge chunks loaded: 37


شما:  سلام


پشتیبان: سلام! چگونه می‌توانم به شما کمک کنم؟


شما:   شما چه کسی هستید؟


پشتیبان: من پشتیبان هستم، دستیار خدمات مشتری شرکت. چگونه می‌توانم به شما کمک کنم؟


شما:  اسم شرکت چیست؟


پشتیبان: اسم شرکت تابان انرژی مازند سو است.


شما:   اهداف شرکت چیست؟


پشتیبان: اهداف شرکت شامل استفاده از انرژی خورشیدی به منظور کاهش آلودگی محیط زیست، تنوع بخشی در تامین سبد انرژی کشور با استفاده از انرژی خورشیدی، احداث و توسعه نیروگاه‌های خورشیدی در مراکز صنعتی و واحدهای مسکونی، و قرارگیری در زنجیره ارزش سیستم‌های فتوولتائیک همراه با فراهم نمودن همکاری‌های بین‌المللی می‌باشد.


شما:   فروشگاه شرکت شامل چه محصولاتی است؟


پشتیبان: فروشگاه تابان انرژی مازند سو شامل محصولات زیر می‌باشد:
- باتری خورشیدی
- چراغ خورشیدی
- اینورتر هیبریدی
- اینورتر متصل به شبکه
- اینورتر منفصل از شبکه
- سایر لوازم و تجهیزات
- پنل خورشیدی


شما:  جمعیت ایران چقدر است؟


پشتیبان: اطلاعات کافی برای پاسخ به سوال شما درباره جمعیت ایران در زمینه ارائه شده وجود ندارد. لطفاً سوال دیگری بپرسید.


شما:  خروج
