In [3]:

import pysqlite3
import sys
sys.modules["sqlite3"] = sys.modules.pop("pysqlite3")
import chromadb

In [4]:
import gradio as gr
from llama_index.llms.ollama import Ollama
from langchain.memory import ConversationBufferMemory
from langchain.llms.base import LLM

from langchain_community.embeddings import OllamaEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_chroma import Chroma
from transformers import AutoTokenizer
from langchain.document_loaders.csv_loader import CSVLoader
from langchain import hub
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain.document_loaders import DirectoryLoader, PyPDFLoader
from langdetect import detect

  from .autonotebook import tqdm as notebook_tqdm


In [5]:
MODEL_NAME = "meta-llama/Llama-3.2-1B"
token = "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"

In [6]:
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_auth_token=token)

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


In [7]:
 # create the length function
def tiktoken_len(text):
    tokens = tokenizer.tokenize(text)
    return len(tokens)

In [8]:
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=20,  # number of tokens overlap between chunks
    length_function=tiktoken_len,
    separators=['\n\n', '\n']
)

In [9]:
query = "Resume les traits des Tieffelin"

In [10]:
def route_query(query):
    # Detect the language of the query
    language = detect(query)
    return language

In [11]:
lang = route_query(query)
print(lang)

fr


In [12]:
# Select sources
read_pdf = True
read_web_online = False
read_csv = False

de = lang == "de"
en = lang == "en"
fr = lang == "fr"
# All data will be in the list documents
documents=[]

In [13]:
if read_pdf:
    if en:
        # Load and process the text files
        # loader = TextLoader('single_text_file.txt')
        loader = DirectoryLoader('./docs_en/', glob="./*.pdf", loader_cls=PyPDFLoader)
        
        pdf_docs = loader.load()
        len(pdf_docs)

        # tokenize pdf
        documents.extend(text_splitter.split_documents(pdf_docs))
        len(documents)
    if de:
        # Load and process the text files
        # loader = TextLoader('single_text_file.txt')
        loader = DirectoryLoader('./docs_de/', glob="./*.pdf", loader_cls=PyPDFLoader)
        
        pdf_docs = loader.load()
        len(pdf_docs)

        # tokenize pdf
        documents.extend(text_splitter.split_documents(pdf_docs))
        len(documents)
    if fr:
        # Load and process the text files
        # loader = TextLoader('single_text_file.txt')
        loader = DirectoryLoader('./docs_fr/', glob="./*.pdf", loader_cls=PyPDFLoader)
        
        pdf_docs = loader.load()
        len(pdf_docs)

        # tokenize pdf
        documents.extend(text_splitter.split_documents(pdf_docs))
        len(documents)

  from cryptography.hazmat.primitives.ciphers.algorithms import AES, ARC4


In [9]:
from langchain.document_loaders import WebBaseLoader  # Read one or a list of pages
from langchain.document_loaders.recursive_url_loader import RecursiveUrlLoader  # Read recursively from a root page
from bs4 import BeautifulSoup as Soup

# Initialize variables
is_recursively = False
documents = []  # Ensure this is defined

# Conditional loading
if is_recursively:
    url = "https://www.aidedd.org/regles/races"
    loader = RecursiveUrlLoader(
        url=url,
        max_depth=5,  # Consider a smaller depth for efficiency
        extractor=lambda x: Soup(x, "html.parser").text
    )
    web_docs_up = loader.load()
else:
    urls = [
        "https://www.aidedd.org/regles/races",
    ]
    loader = WebBaseLoader(urls)
    web_docs_up = loader.load()

# Tokenize web online
# Ensure text_splitter is defined before this step
try:
    web_docs = text_splitter.split_documents(web_docs_up)

    # Define or import filter_complex_metadata
    def filter_complex_metadata(docs):
        # Placeholder for actual filtering logic
        return docs

    # Filter documents and extend the list
    documents.extend(filter_complex_metadata(web_docs))
    print(f"Number of documents: {len(documents)}")

except NameError as e:
    print(f"Error: {e}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")


USER_AGENT environment variable not set, consider setting it to identify your requests.


Number of documents: 4


In [73]:
if read_csv:
    # Load the CSV file
    loader = CSVLoader(file_path="docs/*.csv")
    data = loader.load_and_split()
    
    # we filter out metadata that the embedding below will not be able to manage
    data = filter_complex_metadata(data)
    documents.extend(data)
    
    len(documents)

In [14]:
# Iterate over the documents
for idx, doc in enumerate(documents, start=1):  # Enumerate to track the document index
    # Safely access metadata and page content
    page_number = doc.metadata.get("page_number", "N/A")  # Default to 'N/A' if 'page_number' is not present
    content_preview = doc.page_content[:10000] if doc.page_content else "No content"  # Handle missing content gracefully

    # Print the page number and a preview of the content
    print(f"Document {idx} - Page Number: {page_number}\nContent Preview:\n{content_preview}...\n")


Document 1 - Page Number: N/A
Content Preview:
Interdit à la revente. Vous êtes autorisés à imprimer ou photocopier  
ce document pour votre strict usage personnel .  Document de Référence du Système 5.1  2 Document de Référence du  Système  5.1 
 
Si vous constatez des erreurs dans ce document, veuillez 
nous en informer par e -mail à l’adresse askdnd@wizards.com . 
Races  
Traits raciaux  
La description de chaque race comprend des traits 
raciaux communs aux membres de ce peuple. Les entrées ci -après figurent parmi les traits de 
la plupart des races.  
Âge 
L’entrée « Âge » indique l’âge auquel un membre 
de la race est considéré comme adulte, ainsi que 
l’espérance de vie moyenne propre à ce peuple. Cette information est prévue pour vous aider à déterminer l’âge initial de votre personnage en début d’aventure.  
Vous êtes cependant libre de décider de l’âge de votre 
personnage, ce qui peut expliquer telle ou telle valeur  
de caractéristique. Si, par exemple, vous incarnez un 
p

In [15]:
# Define a custom LangChain wrapper for the Ollama LLaMA model
class OllamaLangChain(LLM):
    model_name: str = "llama3.2:latest"  # Declared field
    request_timeout: int = 9000          # Declared field

    def __init__(self, model_name="llama3.2:latest", request_timeout=9000):
        super().__init__()
        self.model_name = model_name
        self.request_timeout = request_timeout
        # Use object.__setattr__ to bypass Pydantic's field validation
        object.__setattr__(self, "_client", Ollama(model=model_name, request_timeout=request_timeout))
    
    @property
    def _llm_type(self):
        return "ollama"

    def _call(self, prompt, stop=None):
        # Access the private client
        client = object.__getattribute__(self, "_client")
        response = client.complete(prompt)
        return response.text

In [16]:
if lang == "fr" or lang == "de":
    embeddings = OllamaEmbeddings(
        model="bge-m3"
    )
else:
    embeddings = OllamaEmbeddings(
        model="llama3.2"
    )

In [17]:
# Initialize Chroma client
chroma_client = chromadb.Client()

# Set up a persist directory
persist_directory = "./chroma_persistent_data"

# Use get_or_create_collection to avoid re-creating collection each time
collection_name = f"{lang}_cn1"
collection = chroma_client.get_or_create_collection(name=collection_name)

# Create the vector store using the existing collection
vectorstore = Chroma(
    embedding_function=embeddings,
    collection_name=collection_name,
    client=chroma_client,
    persist_directory=persist_directory
)

In [18]:
def add_documents_to_vectorstore(vectorstore, documents):
    # Extract text and metadata from the documents
    text = [document.page_content for document in documents]
    metadata = [document.metadata for document in documents if document.metadata]

    # Ensure embedding function is set
    if vectorstore._embedding_function is None:
        raise ValueError("Embedding function must be set.")
    
    # Generate embeddings
    embeddings = []
    for idx, doc_text in enumerate(text):
        print(f"Generating embedding for document {idx + 1}/{len(text)}...")
        embedding = vectorstore._embedding_function.embed_documents([doc_text])[0]
        embeddings.append(embedding)
    
    # Add documents to the vector store
    ids = [str(i) for i in range(len(text))]
    vectorstore._collection.add(
        ids=ids,
        embeddings=embeddings,
        documents=text,
        metadatas=metadata,
    )
    print(f"Successfully added {len(documents)} documents to the vector store.")

In [19]:
add_documents_to_vectorstore(vectorstore, documents)

print(f"Successfully added {len(documents)} documents to the vector store.")

Generating embedding for document 1/2...
Generating embedding for document 2/2...
Successfully added 2 documents to the vector store.
Successfully added 2 documents to the vector store.


In [20]:
retriever = vectorstore.as_retriever()

In [21]:
llm = OllamaLangChain()
memory = ConversationBufferMemory()  

In [22]:
prompt_mapping = {
    "en": "kpikpo/dnd_prompt",
    "de": "kpikpo/ger",
    "fr": "kpikpo/dnd_prompt_fr"
}

# Use the detected language to pull the appropriate prompt
prompt = hub.pull(prompt_mapping.get(lang, "default/prompt"))

print(f"Using prompt: {prompt}")





Using prompt: input_variables=['context', 'question'] metadata={'lc_hub_owner': 'kpikpo', 'lc_hub_repo': 'dnd_prompt_fr', 'lc_hub_commit_hash': 'aec2effc0779b3b52eb624247d175e308b29dde841a20272f6d75f882c7b4ce4'} messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['context', 'question'], template="Analysez le contexte en profondeur pour répondre à la question. Si la réponse n'est pas trouvée, reconnaissez-le. En tant qu'expert de Donjons et Dragons, fournissez des informations détaillées lorsque c'est possible, en utilisant un maximum de 10 phrases.\nQuestion : {question}\nContext : {context}\nRéponse :"))]


In [38]:
# Mapping languages to their respective reflection prompts
reflect_prompt_mapping = {
    "en": (
        "Always start saying Hmmm\n\n"
        "You provided the following response based on the given context:\n\n"
        "Response:\n{response}\n\n"
        "Context:\n{context}\n\n"
        "Reflect critically on the response. Does it fully answer the question based on the provided context? "
        "Identify any inaccuracies, gaps, or areas for improvement, and revise the response accordingly to ensure it is concise, accurate, and contextually relevant. "
        "If the response is satisfactory, confirm it as is."
    ),
    "de": (
        "Anfag mit Hmmmm\n\n"
        "Sie haben die folgende Antwort basierend auf dem gegebenen Kontext bereitgestellt:\n\n"
        "Antwort:\n{response}\n\n"
        "Kontext:\n{context}\n\n"
        "Reflektieren Sie kritisch über die Antwort. Beantwortet sie die Frage vollständig basierend auf dem bereitgestellten Kontext? "
        "Identifizieren Sie eventuelle Ungenauigkeiten, Lücken oder Verbesserungsbereiche und überarbeiten Sie die Antwort entsprechend, "
        "um sicherzustellen, dass sie präzise, korrekt und kontextbezogen ist. "
        "Falls die Antwort zufriedenstellend ist, bestätigen Sie dies entsprechend."
    ),
    "fr": (
        "Debute en disant Hmmm\n\n"
        "Vous avez fourni la réponse suivante en fonction du contexte donné :\n\n"
        "Réponse :\n{response}\n\n"
        "Contexte :\n{context}\n\n"
        "Réfléchissez de manière critique à la réponse. Répond-elle pleinement à la question en fonction du contexte fourni ? "
        "Identifiez les éventuelles inexactitudes, lacunes ou domaines à améliorer, et révisez la réponse en conséquence pour garantir qu'elle soit concise, précise et contextuellement pertinente. "
        "Si la réponse est satisfaisante, confirmez-le en l'état."
    )
}

# Use the detected language to select the appropriate reflection prompt
reflect_prompt = reflect_prompt_mapping.get(lang, "Default reflection prompt if language is unsupported")

print(f"Using reflect prompt for language '{lang}':\n{reflect_prompt}")


Using reflect prompt for language 'fr':
Debute en disant Hmmm

Vous avez fourni la réponse suivante en fonction du contexte donné :

Réponse :
{response}

Contexte :
{context}

Réfléchissez de manière critique à la réponse. Répond-elle pleinement à la question en fonction du contexte fourni ? Identifiez les éventuelles inexactitudes, lacunes ou domaines à améliorer, et révisez la réponse en conséquence pour garantir qu'elle soit concise, précise et contextuellement pertinente. Si la réponse est satisfaisante, confirmez-le en l'état.


In [24]:
def format_docs(retrieved_documents):
    # Format documents to include content and metadata
    formatted_docs = []
    for doc in retrieved_documents:
        content = doc.page_content
        metadata = doc.metadata  # Extract metadata

        formatted_docs.append({
            "content": content,
            "metadata": metadata  # Add metadata to the formatted output
        })

    return formatted_docs


In [31]:
retrieved_documents = retriever.invoke(query)

Number of requested results 4 is greater than number of elements in index 2, updating n_results = 2


In [35]:
self_reflection = True

In [36]:
if self_reflection:
    
    qa_chain = (
        {
            "context": vectorstore.as_retriever() | format_docs,
            "question": RunnablePassthrough(),
        }
        | prompt
        | llm
        | StrOutputParser()
        | (  # Self-reflection step
            lambda response: reflect_prompt.format(
                response=response,
                context=format_docs(retrieved_documents)
            )  # Returns a string directly
        )
        | llm  # Directly pass the reflection prompt as input to llm
        | StrOutputParser()
    )
else:
    qa_chain = (
        {
            "context": vectorstore.as_retriever() | format_docs,
            "question": RunnablePassthrough(),
        }
        | prompt
        | llm
        | StrOutputParser()
    )


In [37]:
results = qa_chain.invoke(query)
results

Number of requested results 4 is greater than number of elements in index 2, updating n_results = 2


"Bonjour ! Je vais analyser votre réponse et identifier les points forts et les points faibles.\n\nPoints forts :\n\n* Vous avez identifié le contexte de la question, qui concerne les variantes raciales dans Donjons et Dragons.\n* Vous avez mentionné que vous ne pouvez pas fournir une réponse spécifique à cette question en raison du manque de contenus fournis.\n* Vous avez proposé d'obtenir plus d'informations sur les variantes raciales en consultant les manuels officiels ou les ressources en ligne dédiées à Donjons et Dragons.\n\nPoints faibles :\n\n* Votre réponse est très générale et ne répond pas pleinement à la question. Vous avez mentionné que vous ne pouvez pas fournir une réponse spécifique, mais vous n'avez pas expliqué pourquoi.\n* Vous n'avez pas analysé les informations contenues dans le document fourni pour identifier les variantes raciales des elfes.\n* Votre réponse manque de concision et de précision. Vous avez mentionné plusieurs points sans fournir d'explications déta

In [39]:
sources = []
for doc in retrieved_documents:
    source = doc.metadata.get('source', 'Unknown source')
    page = doc.metadata.get('page', 'Unknown page')
    sources.append(f"{source} (page {page})")

sources_text = ", ".join(sources)
output = f"The answer is: {results} [Sources: {sources_text}]"

print(output)

The answer is: Bonjour ! Je vais analyser votre réponse et identifier les points forts et les points faibles.

Points forts :

* Vous avez identifié le contexte de la question, qui concerne les variantes raciales dans Donjons et Dragons.
* Vous avez mentionné que vous ne pouvez pas fournir une réponse spécifique à cette question en raison du manque de contenus fournis.
* Vous avez proposé d'obtenir plus d'informations sur les variantes raciales en consultant les manuels officiels ou les ressources en ligne dédiées à Donjons et Dragons.

Points faibles :

* Votre réponse est très générale et ne répond pas pleinement à la question. Vous avez mentionné que vous ne pouvez pas fournir une réponse spécifique, mais vous n'avez pas expliqué pourquoi.
* Vous n'avez pas analysé les informations contenues dans le document fourni pour identifier les variantes raciales des elfes.
* Votre réponse manque de concision et de précision. Vous avez mentionné plusieurs points sans fournir d'explications dé

In [109]:
from openai import OpenAI

In [None]:
import os
import gradio as gr

# Assuming the OpenAI client and retriever/qa_chain are already initialized
client = OpenAI()

def generate_speech(text):
    """
    Generate speech using OpenAI's TTS API.
    """
    # Generate speech using OpenAI's TTS API without streaming response
    speech = client.audio.speech.create(
        model="tts-1",  # Use the appropriate TTS model
        voice="alloy",  # Choose the preferred voice
        input=text,
        response_format="mp3"  # Specify the audio response format
    )

    # Get the binary response content (audio data)
    audio_data = speech.content  # Access the 'content' attribute

    # Define the audio file path based on the current working directory
    audio_file_path = os.path.join(os.getcwd(), "response_audio.mp3")
    
    # Write the binary content to the audio file
    with open(audio_file_path, "wb") as f:
        f.write(audio_data)  # Write the raw binary data

    # Return the path to the saved audio file
    return audio_file_path

def answer_question(query):
    """
    Answer a question and return both text and audio responses.
    """
    # Retrieve documents based on the query
    retrieved_documents = retriever.invoke(query)
    
    # Get the result from the QA chain
    results = qa_chain.invoke(query)
    
    # Extract sources from the retrieved documents
    sources = []
    for doc in retrieved_documents:
        source = doc.metadata.get('source', 'Unknown source')
        page = doc.metadata.get('page', 'Unknown page')
        sources.append(f"{source} (page {page})")

    # Format the sources as a text string
    sources_text = ", ".join(sources)
    
    # Prepare the output text
    output_text = f"{results} [Sources: {sources_text}]"
    
    # Generate the TTS audio file
    audio_file_path = generate_speech(results)
    
    # Return the text and audio file path
    return output_text, audio_file_path

# Gradio interface
interface = gr.Interface(
    fn=answer_question,
    inputs="text",
    outputs=["text", "audio"],  # Output both text and audio
    title="DnD ChatBot with TTS",
    description="Ask questions and receive answers with sources, along with an audio response."
)

interface.launch(share=True)


Running on local URL:  http://127.0.0.1:7862
Running on public URL: https://2c9084f8a5b0dbe4d1.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)




Traceback (most recent call last):
  File "/home/capmars/SemAgent/.venv/lib/python3.11/site-packages/gradio/queueing.py", line 536, in process_events
    response = await route_utils.call_process_api(
               ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/capmars/SemAgent/.venv/lib/python3.11/site-packages/gradio/route_utils.py", line 322, in call_process_api
    output = await app.get_blocks().process_api(
             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/capmars/SemAgent/.venv/lib/python3.11/site-packages/gradio/blocks.py", line 1935, in process_api
    result = await self.call_function(
             ^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/capmars/SemAgent/.venv/lib/python3.11/site-packages/gradio/blocks.py", line 1520, in call_function
    prediction = await anyio.to_thread.run_sync(  # type: ignore
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/capmars/SemAgent/.venv/lib/python3.11/site-packages/anyio/to_thread.py", line 56, in

In [29]:
def answer_question(query):
    # Retrieve documents based on the query
    retrieved_documents = retriever.invoke(query)
    
    # Get the result from the QA chain
    results = qa_chain.invoke(query)
    
    # Extract sources from the retrieved documents
    sources = []
    for doc in retrieved_documents:
        source = doc.metadata.get('source', 'Unknown source')
        page = doc.metadata.get('page', 'Unknown page')
        sources.append(f"{source} (page {page})")

    # Format the sources as a text string
    sources_text = ", ".join(sources)
    
    # Prepare the output
    output = f"{results} [Sources: {sources_text}]"
    
    return output

In [28]:
interface = gr.Interface(
    fn=answer_question,
    inputs="text",
    outputs="text",
    title="DnD ChatBot"
)
interface.launch(share=True)

Running on local URL:  http://127.0.0.1:7860
Running on public URL: https://68c000aa2a6b274052.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)


