# WikiRag

## Overview 

Notebook used to make preliminary test about the WikiRag class. 

# Prerequisistes

A conda environment is needed. 

For example: 
```
cd path/to/conda/dir
conda env create -f wiki_rag_notebooks.yaml
conda activate wiki_rag_notebooks
python -m ipykernel install --user --name wiki_rag_notebooks --display-name "wiki_rag_notebooks"
```

In [1]:
# Import the necessary libraries
from langchain_ollama import ChatOllama
from langchain_core.messages import AIMessage

In [2]:
llm = ChatOllama(
    model="llama3.1",
    temperature=0,
    # other params...
)

In [4]:
messages = [
    (
        "system",
        "You are a helpful assistant that translates English to French. Translate the user sentence.",
    ),
    ("human", "I love programming."),
]
ai_msg = llm.invoke(messages)
ai_msg

AIMessage(content='The translation of "I love programming" from English to French is:\n\n"J\'adore programmer."', response_metadata={'model': 'llama3.1', 'created_at': '2024-08-24T08:35:12.2478659Z', 'message': {'role': 'assistant', 'content': ''}, 'done_reason': 'stop', 'done': True, 'total_duration': 17496895700, 'load_duration': 9489942300, 'prompt_eval_count': 35, 'prompt_eval_duration': 4641573000, 'eval_count': 22, 'eval_duration': 3348253000}, id='run-96ac8c01-a00a-4866-9d95-71715c77e143-0', usage_metadata={'input_tokens': 35, 'output_tokens': 22, 'total_tokens': 57})

In [5]:
from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "You are a helpful assistant that translates {input_language} to {output_language}.",
        ),
        ("human", "{input}"),
    ]
)

chain = prompt | llm
chain.invoke(
    {
        "input_language": "English",
        "output_language": "German",
        "input": "I love programming.",
    }
)

AIMessage(content='Das Programmieren ist mir sehr ansprechend.\n\nWould you like me to translate something else?', response_metadata={'model': 'llama3.1', 'created_at': '2024-08-24T08:37:32.6222737Z', 'message': {'role': 'assistant', 'content': ''}, 'done_reason': 'stop', 'done': True, 'total_duration': 116648839900, 'load_duration': 47936200, 'prompt_eval_count': 30, 'prompt_eval_duration': 22834258000, 'eval_count': 20, 'eval_duration': 93770313000}, id='run-c13ce09f-12fe-44b8-b2a7-10037c97855a-0', usage_metadata={'input_tokens': 30, 'output_tokens': 20, 'total_tokens': 50})

### Test the WikiRag Class

In [3]:
# Import the wiki_rag package from path
import sys
sys.path.insert(1, "../")

In [4]:
from wiki_rag import WikiRag

In [5]:
# Create an instance of the WikiRag class
wiki_rag = WikiRag(
    qdrant_url="http://localhost:6333",
    qdrant_collection_name="olympics"
)

  from tqdm.autonotebook import tqdm, trange


## Test the WikiRag class

In [6]:
# 1. Quale città ospitò i primi Giochi Olimpici estivi dell’età moderna? In che anno?
question_1 = "Quale città ospitò i primi Giochi Olimpici estivi dell’età moderna? In che anno?"

# 2. Quante volte i Giochi Olimpici estivi sono stati ospitati in Francia (Parigi 2024 incluso)?
question_2 = "Quante volte i Giochi Olimpici estivi sono stati ospitati in Francia (Parigi 2024 incluso)?"

# 3. Quanto tempo è passato dall’ultima volta che Parigi ha ospitato le olimpiadi estive?
question_3 = "Quanto tempo è passato dall’ultima volta che Parigi ha ospitato le olimpiadi estive?"

# 4. La prima edizione dei Giochi Olimpici invernali è avvenuta prima della prima edizione dei Giochi Olimpici estivi?
question_4 = "La prima edizione dei Giochi Olimpici invernali è avvenuta prima della prima edizione dei Giochi Olimpici estivi?"

# 5. L’arrampicata sportiva non è uno sport olimpico: vero o falso?
question_5 = "L’arrampicata sportiva non è uno sport olimpico: vero o falso?"

# 6. Quale è il numero medio di ori olimpici per edizione per l’Italia?
question_6 = "Quale è il numero medio di ori olimpici per edizione per l’Italia?"

# 7. Chi è l’ultima vincitrice dei 100 metri piani? Con quale tempo?
question_7 = "Chi è l’ultima vincitrice dei 100 metri piani? Con quale tempo?"

In [9]:
questions = [question_1, question_2, question_3, question_4, question_5, question_6, question_7]

In [7]:
answer1 = wiki_rag.invoke(query=question_1)
print(f"Given the question: {question_1}, the answer is: {answer1}")

Given the question: Quale città ospitò i primi Giochi Olimpici estivi dell’età moderna? In che anno?, the answer is: La risposta è: Atene, nel 1896.


In [10]:
# Response to all the questions
for question in questions:
    answer = wiki_rag.invoke(query=question)
    print(f"Data la domanda: {question}")
    print(f"La risposta è: {answer}\n")

Data la domanda: Quale città ospitò i primi Giochi Olimpici estivi dell’età moderna? In che anno?
La risposta è: La risposta è: Atene nel 1896.

Data la domanda: Quante volte i Giochi Olimpici estivi sono stati ospitati in Francia (Parigi 2024 incluso)?
La risposta è: La risposta è 3. La città di Parigi ha già ospitato i Giochi Olimpici estivi nel 1900 e nel 1924, e sarà la terza volta che lo farà con l'edizione del 2024.

Data la domanda: Quanto tempo è passato dall’ultima volta che Parigi ha ospitato le olimpiadi estive?
La risposta è: Non so.

Data la domanda: La prima edizione dei Giochi Olimpici invernali è avvenuta prima della prima edizione dei Giochi Olimpici estivi?
La risposta è: Sì, la prima edizione dei Giochi Olimpici invernali è avvenuta prima della prima edizione dei Giochi Olimpici estivi. La prima edizione dei Giochi Olimpici invernali si è tenuta a Chamonix nel 1924, mentre la prima edizione dei Giochi Olimpici estivi si è tenuta a Atene nel 1896.

Data la domanda: L’

## Expand the context with Web Search

Useful links:
- [DuckDuckGo Search](https://python.langchain.com/v0.2/docs/integrations/tools/ddg/)
- [Source Code duckduckgo_search](https://python.langchain.com/v0.2/api_reference/_modules/langchain_community/utilities/duckduckgo_search.html#DuckDuckGoSearchAPIWrapper)
- [Available regions](https://pypi.org/project/duckduckgo-search/#regions)

In [14]:
from langchain_community.tools import DuckDuckGoSearchRun
from langchain_community.utilities import DuckDuckGoSearchAPIWrapper
from langchain_community.tools import DuckDuckGoSearchResults

In [15]:
wrapper = DuckDuckGoSearchAPIWrapper(region="it-it")

search = DuckDuckGoSearchRun(api_wrapper=wrapper)

result = search.invoke("Qual'è il primo nome di Obama?")

In [16]:
print(f"The result is: {result}")
print(f"typeof(result): {type(result)}")

The result is: Ma chi è Barack Hussein Obama? La sua storia parte da lontano, lontanissimo. Nasce nelle Hawaii, a Honolulu. Il padre originario del Kenya, la madre del Kansas. Lui economista, lei antropologa. Si separano subito, con Barack ancora piccolissimo. Dal figlio di Tim Walz alle "dimensioni" di Obama, i momenti più virali della convention dei Democratici Barack Obama torna sul palco di una Convention democratica due decenni dopo il suo memorabile debutto. Stavolta il suo compito è diverso. Nel 2004, era un giovane senatore statale dell'Illinois ... Quarantatré anni, famiglia scampata ai lager, il prozio fu il primo capo di Obama, da tre anni scrive i discorsi della vicepresidente e candidata a… Barack Obama torna sul palco di una Convention democratica due decenni dopo il suo memorabile debutto. Stavolta il suo compito è diverso. Nel 2004 Obama era un giovane senatore statale dell ...
typeof(result): <class 'str'>


In [30]:
result = search.invoke("Chi è l’ultima vincitrice dei 100 metri piani? Con quale tempo?")

In [31]:
print(f"The result is: {result}")
print(f"typeof(result): {type(result)}")

The result is: Noah Lyles, nato a Gainesville il 18 luglio 1997, è un velocista statunitense, campione mondiale dei 100 metri piani e dei 200 metri piani a Budapest 2023 e dei 200 metri... Domenica sera Noah Lyles ha vinto la finale dei 100 metri piani. L'americano ha "bissato" il titolo Mondiale di Budapest e si è confermato il padrone totale della velocità in pista, battendo atleti del calibro di Kishane Thompson, Fred Kerley, Akani Simbine e il nostro Marcell Jacobs. Marcell Jacobs centra la finale dei 100 metri. Nell'ultima batteria di semifinale il miglior tempo è del giamaicano Thompson in 9"80, davanti all'americano Kerley i 9"84 e al sudafricano... Domenica 4 agosto lo statunitense Noah Lyles ha vinto in 9,79 secondi una finale olimpica dei 100 metri molto equilibrata e competitiva (l'italiano Marcell Jacobs è arrivato quinto in 9,85). OLIMPIADI PARIGI - Marcell Jacobs chiude al quinto posto la finale dei 100 metri, correndo in 9''85 (record stagionale) nella gara simbolo dei G

In [26]:
# To get more additional information (e.g. link, source) use DuckDuckGoSearchResults()
wrapper = DuckDuckGoSearchAPIWrapper(region="it-it")

search = DuckDuckGoSearchResults(api_wrapper=wrapper)

result = search.invoke("Qual'è il primo nome di Obama?")