<a href="https://colab.research.google.com/github/doukansurel/Retrieval-Augmented-Generation/blob/main/RAG_RouterQueryEngineWithLLamaIndex.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install llama-index

In [None]:
!pip install pypdf

In [2]:
from IPython.display import Markdown, display


# define prompt viewing function
def display_prompt_dict(prompts_dict):
    for k, p in prompts_dict.items():
        text_md = f"**Prompt Key**: {k}<br>" f"**Text:** <br>"
        display(Markdown(text_md))
        print(p.get_template())
        display(Markdown("<br><br>"))

In [6]:
import os
os.environ["OPENAI_API_KEY"] = "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"

In [8]:
from google.colab import drive
drive.mount("/content/drive")

Mounted at /content/drive


#Routing

Router, bir kullanıcı sorgusunu ve bir dizi "seçenekleri" (meta verilerle tanımlanır) alan ve seçilen bir veya daha fazla seçeneği döndüren modüllerdir.

Kendi başlarına ("seçici modüller" olarak) kullanılabilirler veya bir sorgu motoru veya alıcı olarak (örneğin diğer sorgu motorları/alıcıların üstünde) kullanılabilirler.

Karar verme yetenekleri için LLM'leri kullanan basit ama güçlü modüllerdir. Aşağıdaki kullanım durumları ve daha fazlası için kullanılabilirler:

Çok çeşitli veri kaynakları arasından doğru veri kaynağını seçme

Özetleme mi (örneğin özet indeks sorgu motoru kullanarak) yoksa anlamsal arama mı (örneğin vektör indeks sorgu motoru kullanarak) yapılacağına karar verme

Bir grup seçeneği aynı anda "deneyip deneymeyeceğinize" ve sonuçları birleştirip birleştirmeyeceğinize karar vermek (çoklu yönlendirme yeteneklerini kullanarak).

In [9]:
import nest_asyncio

nest_asyncio.apply()

In [10]:
import logging
import sys

logging.basicConfig(stream=sys.stdout, level=logging.INFO)
logging.getLogger().handlers = []
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

from llama_index import (
    VectorStoreIndex,
    SummaryIndex,
    SimpleDirectoryReader,
    ServiceContext,
    StorageContext,
)

In [14]:
#Download Data
documents = SimpleDirectoryReader(input_dir="/content/drive/MyDrive/RAG/2").load_data()

In [15]:
service_context = ServiceContext.from_defaults(chunk_size=1024)
nodes = service_context.node_parser.get_nodes_from_documents(documents)

In [16]:
storage_context = StorageContext.from_defaults()
storage_context.docstore.add_documents(nodes)

#Aynı Veri Üzerinden Özet İndeks ve Vektör İndeksi Tanımlama

In [17]:
summary_index = SummaryIndex(nodes, storage_context=storage_context)#Özet
vector_index = VectorStoreIndex(nodes, storage_context=storage_context)#İndex

In [18]:
list_query_engine = summary_index.as_query_engine(
    response_mode="tree_summarize",
    use_async=True,
)
vector_query_engine = vector_index.as_query_engine()

In [19]:
from llama_index.tools.query_engine import QueryEngineTool


list_tool = QueryEngineTool.from_defaults(
    query_engine=list_query_engine,
    description=(
        "Türkiye ve Türkiye Cumhuriyeti Anayasası ile ilgili özetleme soruları için faydalı"

    ),
)

vector_tool = QueryEngineTool.from_defaults(
    query_engine=vector_query_engine,
    description=(
        "Türkiye ve Türkiye Cumhuriyeti Anayasası makalelerinden belirli bir bağlam elde etmek için kullanışlıdır."

    ),
)

#Router Query Engine Tanımlama

PydanticMultiSelector
Sorguların birden fazla dizine yönlendirilmesini beklediğimiz zamanlarda MultiSelector kullanılır.   MultiSelector, sorgulamayı birden fazla alt dizine gönderir ve ardından tam bir yanıt oluşturmak için bir özet dizini kullanarak tüm yanıtları toplar.

In [21]:
from llama_index import SimpleKeywordTableIndex

keyword_index = SimpleKeywordTableIndex(nodes, storage_context=storage_context)

keyword_tool = QueryEngineTool.from_defaults(
    query_engine=vector_query_engine,
    description=(
        "Türkiye'den anahtar kelimeler kullanarak belirli bir içeriğe ulaşmak için kullanışlıdır"
         "Articles of the Constitution of Türkiye and the Republic of Turkey"
    ),
)

In [24]:
from llama_index.query_engine.router_query_engine import RouterQueryEngine
from llama_index.selectors.pydantic_selectors import (
    PydanticMultiSelector,)
query_engine = RouterQueryEngine(
    selector=PydanticMultiSelector.from_defaults(),
    query_engine_tools=[
        list_tool,
        vector_tool,
        keyword_tool,
    ],
)

In [None]:
response = query_engine.query(
    "Türkiye'nin başkenti neredir?"

)
print(str(response))