<a href="https://colab.research.google.com/github/Ahmetyldrr/RAG-Driven-Generative-AI/blob/main/Ch03_Building_Index_Based_RAG_with_LlamaIndex%2C_Deep_Lake%2C_and_OpenAI.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## İndeks Tabanlı RAG (Retrieval-Augmented Generative) Yapıların Oluşturulması

İndeksler, kesinlik ve hız performansını artırır, ancak bundan daha fazlasını sunar. İndeksler, bir RAG modelinin ürettiği yanıtın kaynağını tamamen izlenebilir hale getirerek, kullanılan verilerin kesin konumu ve ayrıntılı içeriği hakkında görünürlük sağlar. Bu iyileştirme, yalnızca önyargı ve halüsinasyon gibi sorunları azaltmakla kalmaz, aynı zamanda telif hakkı ve veri bütünlüğü ile ilgili endişeleri de giderir.

Bu bölümde, indekslenmiş verilerin üretken yapay zeka uygulamaları üzerinde nasıl daha fazla kontrol sağladığını keşfedeceğiz. Çıktı tatmin edici değilse, indeks sayesinde sorunun tam veri kaynağını belirleyip incelemek mümkün hale gelir. Bu yetenek, veri girdilerini iyileştirmek, sistem yapılandırmalarını ayarlamak veya vektör depolama yazılımı ve üretken modeller gibi bileşenleri değiştirmek için kullanılır.

## İndeks Tabanlı RAG Pipeline Mimarisi

İndeks tabanlı bir RAG pipeline mimarisini ortaya koyarak başlayacağız. Bu, hız, kesinlik ve izlenebilirliği artıracaktır. LlamaIndex, Deep Lake ve OpenAI'ın sorunsuz bir şekilde entegre edilebileceğini göstereceğiz. Bu, sağlam bir temel oluşturur.

### Kullanılan Teknikler ve Kütüphaneler

*   **LlamaIndex**: LlamaIndex, büyük dil modelleri (LLM) için indeksleme ve retrieval tabanlı bir çerçevedir.
*   **Deep Lake**: Deep Lake, vektör depolama ve yönetimi için kullanılan bir kütüphanedir.
*   **OpenAI**: OpenAI, üretken yapay zeka modelleri için kullanılan bir API'dir.

## İndeks Türleri

*   **Vektör İndeksleme (Vector Indexing)**: Vektör indeksleme, verileri vektör uzayında temsil eder ve benzerlik tabanlı aramalar için kullanılır.
    Örnek kod:
    ```python
    from llama_index import VectorStoreIndex

    # Vektör indeks oluşturma
    index = VectorStoreIndex(nodes)
    ```
*   **Ağaç İndeksleme (Tree Indexing)**: Ağaç indeksleme, verileri hiyerarşik bir yapıya göre düzenler ve hızlı arama için kullanılır.
    Örnek kod:
    ```python
    from llama_index import TreeIndex

    # Ağaç indeks oluşturma
    index = TreeIndex(nodes)
    ```
*   **Liste İndeksleme (List Indexing)**: Liste indeksleme, verileri sıralı bir liste halinde depolar ve basit aramalar için kullanılır.
    Örnek kod:
    ```python
    from llama_index import ListIndex

    # Liste indeks oluşturma
    index = ListIndex(nodes)
    ```
*   **Anahtar Kelime İndeksleme (Keyword Indexing)**: Anahtar kelime indeksleme, verileri anahtar kelimelerle ilişkilendirir ve anahtar kelime tabanlı aramalar için kullanılır.
    Örnek kod:
    ```python
    from llama_index import KeywordTableIndex

    # Anahtar kelime indeks oluşturma
    index = KeywordTableIndex(nodes)
    ```

## Drone Teknolojisi LLM RAG Ajanı Oluşturma

Drone teknolojisi, yangın tespiti, trafik bilgisi ve spor etkinlikleri gibi birçok alanda genişlemektedir. Bu örnekte, drone teknolojisi ile ilgili bir LLM RAG ajanı oluşturacağız.

### Adım 1: Veri Hazırlama

Drone teknolojisi ile ilgili metin verilerini hazırlayın.

### Adım 2: İndeks Oluşturma

LlamaIndex kullanarak vektör, ağaç, liste ve anahtar kelime indeksleri oluşturun.

### Adım 3: Deep Lake Vektör Deposu Oluşturma

Deep Lake kullanarak vektör deposu oluşturun ve indeksleri bu depoya yükleyin.

### Adım 4: OpenAI ile Entegrasyon

OpenAI API'sini kullanarak üretken yapay zeka modeli ile entegrasyon sağlayın.

### Adım 5: Skor Sıralama ve Kosinüs Benzerliği

Skor sıralama ve kosinüs benzerliği metriklerini kullanarak retrieval sonuçlarını iyileştirin.

### Adım 6: Meta Veri Geliştirme

İzlenebilirlik için meta verileri geliştirin.

### Adım 7: Sorgu Kurulumu ve Üretim Yapılandırması

Sorgu kurulumu ve üretim yapılandırmasını ayarlayın.

### Adım 8: Otomatik Doküman Sıralama

Otomatik doküman sıralamasını tanıtın.

## Sonuç

Bu bölümde, indeks tabanlı RAG yapıların oluşturulmasını keşfettik. LlamaIndex, Deep Lake ve OpenAI'ın entegrasyonunu gösterdik. Vektör, ağaç, liste ve anahtar kelime indeks türlerini tanıttık. Drone teknolojisi LLM RAG ajanı oluşturma örneğini verdik.

## Kaynaklar

*   [LlamaIndex Dokümantasyonu](https://gpt-index.readthedocs.io/en/latest/)
*   [Deep Lake Dokümantasyonu](https://docs.activeloop.ai/)
*   [OpenAI API Dokümantasyonu](https://beta.openai.com/docs/)

## İndeks Tabanlı RAG (Retrieval-Augmented Generation) Kullanmanın Önemi
İndeks tabanlı arama, gelişmiş RAG-driven üretken yapay zekayı bir sonraki seviyeye taşır. Büyük hacimli verilerle karşılaşıldığında, veri yığınlarından organize edilmiş, indekslenmiş düğümlere geçerek geri getirme hızını artırır ve böylece bir belgenin kaynağına ve konumuna kadar izlenebilirlik sağlar.

## Vektör Tabanlı Benzerlik Araması ile İndeks Tabanlı Arama Arasındaki Farklar
Vektör tabanlı benzerlik araması ve indeks tabanlı arama arasındaki farkları anlamak için, indeks tabanlı RAG'ın mimarisini analiz edeceğiz.

### Mimarisi
İndeks tabanlı arama, RAG'da vektör tabanlı aramadan daha hızlıdır çünkü doğrudan indeksleri kullanarak ilgili verilere erişir. Vektör tabanlı arama ise tüm kayıtlar arasında sırayla embedding karşılaştırmaları yapar.

## İşlem Adımları
1. **Veri Toplama ve Hazırlama (Pipeline #1)**: Verileri toplar ve hazırlarız. Ancak bu kez, veri kaynağını tek bir belge olarak hazırlarız ve bunları ayrı dosyalarda saklarız. Daha sonra adlarını ve konumlarını vektör deposuna yüklediğimiz meta verilere ekleriz.
2. **Embedding ve Vektör Deposu (Pipeline #2)**: Verileri embedding yaparak vektör deposuna saklarız. Burada, llama-index-vector-stores-deeplake paketini kullanarak verileri chunking, embedding, depolama ve LLM entegrasyonu dahil olmak üzere optimize edilmiş bir başlangıç senaryosunda ihtiyacımız olan her şeye sahibiz.
3. **İndeks Tabanlı Geri Getirme ve Üretme (Pipeline #3)**: Verileri bir veri kümesine yükleyerek indeks tabanlı geri getirme ve üretme işlemlerini başlatırız. Burada da llama-index-vector-stores-deeplake paketini kullanırız.

## Kullanılan Teknikler ve Kodlar
- **Vektör Tabanlı Benzerlik Araması**: Vektör tabanlı benzerlik araması, verileri yüksek boyutlu vektörlere dönüştürerek benzerlik araması yapar.
- **İndeks Tabanlı Arama**: İndeks tabanlı arama, verileri indeksleyerek hızlı geri getirme sağlar.
- **LlamaIndex ve Deep Lake**: LlamaIndex ve Deep Lake, indeks tabanlı RAG için kullanılan kütüphanelerdir.

### Örnek Kod
```python
# Pipeline #1: Veri Toplama ve Hazırlama
import os
from llama_index import SimpleDirectoryReader

# Veri klasörünü oku
documents = SimpleDirectoryReader('data').load_data()

# Pipeline #2: Embedding ve Vektör Deposu
from llama_index import VectorStoreIndex
from llama_index.vector_stores import DeepLakeVectorStore

# Deep Lake vektör deposunu oluştur
vector_store = DeepLakeVectorStore(dataset_path='my_dataset')

# Vektör deposunu indeksle
index = VectorStoreIndex.from_documents(documents, vector_store)

# Pipeline #3: İndeks Tabanlı Geri Getirme ve Üretme
from llama_index import RetrieverQueryEngine

# Sorgu motorunu oluştur
query_engine = RetrieverQueryEngine(index)

# Sorguyu çalıştır
response = query_engine.query('Sorgu metni')

print(response)
```

## Neden İndeks Tabanlı RAG Kullanılır?
İndeks tabanlı RAG, büyük veri kümeleri üzerinde hızlı ve doğru geri getirme sağlar. Ayrıca, geri getirme işleminin kaynağına kadar izlenebilirlik sağlar.

## Kullanım Alanları
- **Doğal Dil İşleme**: İndeks tabanlı RAG, doğal dil işleme görevlerinde kullanılabilir.
- **Bilgi Geri Getirme**: İndeks tabanlı RAG, bilgi geri getirme sistemlerinde kullanılabilir.
- **Üretken Yapay Zeka**: İndeks tabanlı RAG, üretken yapay zeka uygulamalarında kullanılabilir.

## Diğer Teknikler
- **Vektör Tabanlı Benzerlik Araması**: Vektör tabanlı benzerlik araması, verileri yüksek boyutlu vektörlere dönüştürerek benzerlik araması yapar.
- **Liste Tabanlı Arama**: Liste tabanlı arama, verileri listeleyerek arama yapar.
- **Anahtar Kelime Tabanlı Arama**: Anahtar kelime tabanlı arama, verileri anahtar kelimelere göre arayarak geri getirme yapar.

## Sonuç
İndeks tabanlı RAG, büyük veri kümeleri üzerinde hızlı ve doğru geri getirme sağlar. LlamaIndex ve Deep Lake kütüphaneleri kullanılarak kolayca uygulanabilir.

# Drone Teknolojisi için Anlamsal Arama Motoru ve Üretken Ajan Oluşturma (Building a Semantic Search Engine and Generative Agent for Drone Technology)

Bu bölümde, Deep Lake vektör depoları (Deep Lake vector stores), LlamaIndex ve OpenAI kullanarak anlamsal indeks tabanlı bir arama motoru ve üretken yapay zeka ajan motoru oluşturacağız. Daha önce de belirtildiği gibi, drone teknolojisi yangın tespiti ve trafik kontrolü gibi alanlarda genişliyor. Bu nedenle, programın amacı drone teknolojisi soruları ve cevapları için indeks tabanlı bir RAG (Retrieval-Augmented Generation) ajanı sağlamaktır.

## Önemli Noktalar
*   Anlamsal indeks tabanlı arama motoru ve üretken yapay zeka ajan motoru oluşturma
*   Deep Lake vektör depoları, LlamaIndex ve OpenAI kullanma
*   Drone teknolojisi soruları ve cevapları için indeks tabanlı RAG ajanı oluşturma
*   Bilgisayar görüşü tekniklerini kullanarak araçları ve diğer nesneleri tanımlama

## Kodlar ve Açıklamalar
### Ortamın Kurulumu (Installing the Environment)
Ortamı kurmak için gerekli paketleri yükleyeceğiz. LlamaIndex, Deep Lake vektör depolama yetenekleri ve OpenAI modüllerini entegre eden paketleri yüklemek önemlidir.

```python
!pip install llama-index-vector-stores-deeplake==0.1.6
!pip install deeplake==3.9.8
!pip install llama-index==0.10.64
```

Bu kodlar, sırasıyla `llama-index-vector-stores-deeplake`, `deeplake` ve `llama-index` paketlerini yükler.

### Paketlerin İthal Edilmesi
Paketlerin doğru şekilde yüklendiğini doğrulamak için, `llama-index`'ten gerekli modülleri ithal edeceğiz.

```python
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Document
from llama_index.vector_stores.deeplake import DeepLakeVectorStore
```

Bu kod, `VectorStoreIndex`, `SimpleDirectoryReader`, `Document` ve `DeepLakeVectorStore` modüllerini `llama-index`'ten ithal eder.

## İşlem Hattı (Pipeline)
Program üç ana işlem hattından oluşur:
1.  **Dokümanların Toplanması ve Hazırlanması** (Collecting and Preparing the Documents): GitHub ve Wikipedia gibi kaynaklardan dokümanları toplar ve indeksleme için hazırlar.
2.  **Deep Lake Vektör Deposunun Oluşturulması ve Doldurulması** (Creating and Populating a Deep Lake Vector Store): Hazırlanan dokümanlarla Deep Lake vektör deposunu oluşturur ve doldurur.
3.  **İndeks Tabanlı RAG için Sorgu İşleme ve Üretme** (Index-based RAG for Query Processing and Generation): LLMs (Large Language Models) ve kosinüs benzerliği metriği (cosine similarity metric) kullanarak zaman ve skor performanslarını uygular.

Bu işlem hatları, projenin farklı bileşenlerini bağımsız olarak ve paralel olarak ilerletmesine olanak tanır.

## Pipeline 1: Dokümanların Toplanması ve Hazırlanması (Collecting and Preparing the Documents)
Bu bölümde, drone ile ilgili dokümanları, kaynaklarına geri izlenebilmeleri için gerekli meta verilerle birlikte toplayacağız ve hazırlayacağız. Hedef, bir yanıtın içeriğini, kaynağını bulmak için alınan veri parçasına kadar geri izlemektir.

### İlk Adım: Veri Dizinini Oluşturma (Creating a Data Directory)
İlk olarak, dokümanları yükleyeceğimiz bir veri dizini oluşturacağız:
```python
!mkdir data
```
Bu komut, `data` adında bir dizin oluşturur.

### Veri Toplama ve Temizleme (Data Collection and Cleaning)
Drone teknolojisi verileri için heterojen bir corpus kullanacağız ve bu verileri BeautifulSoup kullanarak işleyeceğiz:
```python
import requests
from bs4 import BeautifulSoup
import re
import os

urls = [
    "https://github.com/VisDrone/VisDrone-Dataset",
    "https://paperswithcode.com/dataset/visdrone",
    "https://openaccess.thecvf.com/content_ECCVW_2018/papers/11133/Zhu_VisDrone-DET2018_The_Vision_Meets_Drone_Object_Detection_in_Image_Challenge_ECCVW_2018_paper.pdf",
    "https://github.com/VisDrone/VisDrone2018-MOT-toolkit",
    "https://en.wikipedia.org/wiki/Object_detection",
    "https://en.wikipedia.org/wiki/Computer_vision",
    # ...
]

def clean_text(content):
    # Referansları ve istenmeyen karakterleri kaldır (Removing references and unwanted characters)
    content = re.sub(r'\[\d+\]', '', content)  # Referansları kaldır (Remove references)
    content = re.sub(r'[^\w\s\.]', '', content)  # Nokta hariç noktalama işaretlerini kaldır (Remove punctuation except periods)
    return content

def fetch_and_clean(url):
    try:
        response = requests.get(url)
        response.raise_for_status()  # Kötü yanıtlar için istisna oluştur (Raise exception for bad responses)
        soup = BeautifulSoup(response.content, 'html.parser')
        # "mw-parser-output" sınıfını önceliklendir, bulunamazsa "content" kimlikli öğeyi kullan (Prioritize "mw-parser-output" but fall back to "content" class if not found)
        content = soup.find('div', {'class': 'mw-parser-output'}) or soup.find('div', {'id': 'content'})
        if content is None:
            return None
        # Belirli bölümleri, iç içe olanları da dahil olmak üzere kaldır (Remove specific sections, including nested ones)
        for section_title in ['References', 'Bibliography', 'External links', 'See also', 'Notes']:
            section = content.find('span', id=section_title)
            while section:
                for sib in section.parent.find_next_siblings():
                    sib.decompose()
                section.parent.decompose()
                section = content.find('span', id=section_title)
        # Metni çıkar ve temizle (Extract and clean text)
        text = content.get_text(separator=' ', strip=True)
        text = clean_text(text)
        return text
    except requests.exceptions.RequestException as e:
        print(f"{url} adresinden içerik alınırken hata oluştu: {e}")
        return None  # Hata durumunda None döndür (Return None on error)
```
Bu kod, belirtilen URL'lerden içerik çeker, temizler ve işler.

### Temizlenen Verilerin Kaydedilmesi (Saving Cleaned Data)
Her bir URL için temizlenen metni, kaynak URL'sine göre adlandırılmış bir dosyaya kaydedeceğiz:
```python
output_dir = './data/'
os.makedirs(output_dir, exist_ok=True)

for url in urls:
    article_name = url.split('/')[-1].replace('.html', '')  # .html uzantısını işle (Handle .html extension)
    filename = os.path.join(output_dir, article_name + '.txt')  # Makale için dosya adı oluştur (Create a filename for the article)
    clean_article_text = fetch_and_clean(url)
    with open(filename, 'w', encoding='utf-8') as file:
        file.write(clean_article_text)

print(f"İçerikler (alınabilenler) '{output_dir}' dizinindeki dosyalara yazıldı.")
```
Bu kod, temizlenen metinleri `data` dizinine kaydeder.

### Dokümanların Yüklenmesi (Loading Documents)
Şimdi, dokümanları `./data/` dizininden yükleyeceğiz:
```python
documents = SimpleDirectoryReader("./data/").load_data()
```
`SimpleDirectoryReader`, LlamaIndex tarafından sağlanan ve dizindeki desteklenen dosya türlerini (`*.txt`, `*.pdf`, `*.docx` gibi) yükleyen bir sınıftır.

### İlk Dokümanın İncelenmesi (Inspecting the First Document)
Yüklenen doküman listesindeki ilk öğeyi inceleyelim:
```python
documents[0]
```
Bu, ilk dokümanın içeriğini ve meta verilerini gösterir.

## Önemli Noktalar (Key Points)
- Drone ile ilgili dokümanlar toplanır ve hazırlanır.
- Veri temizleme (`clean_text` ve `fetch_and_clean` fonksiyonları) işlemleri yapılır.
- Temizlenen veriler `data` dizinine kaydedilir.
- `SimpleDirectoryReader` kullanılarak dokümanlar yüklenir.
- İlk dokümanın içeriği ve meta verileri incelenir.

## Teknik Terimler (Technical Terms)
- **Corpus** (Corpus): Belirli bir içerik veya konu ile ilgili metinlerin toplanması.
- **BeautifulSoup** (BeautifulSoup): HTML ve XML dokümanlarını ayrıştırmak için kullanılan bir Python kütüphanesi.
- **SimpleDirectoryReader** (SimpleDirectoryReader): LlamaIndex tarafından sağlanan, dizindeki dosyaları yüklemeye yarayan bir sınıf.
- **RAG** (Retrieval-Augmented Generation): Bilgi erişimi ve metin oluşturma işlemlerini birleştiren bir yapay zeka modeli.

## PipeLine 2 : (Deep Lake) Vektör Deposu Oluşturma ve Doldurma
Bu bölümde, bir Derin Göl (Deep Lake) vektör deposu oluşturacağız ve bunu belgelerimizdeki verilerle dolduracağız. Standart bir tensor konfigürasyonu uygulayacağız:

*   **text (str)**: Metin, belgeler sözlüğünde listelenen metin dosyalarından birinin içeriğidir. Sorunsuz bir şekilde işlenir ve anlamlı parçalara bölünür (`chunking`).
*   **metadata (json)**: Bu durumda, metadata her bir metin parçasının kaynak dosyasını içerir. Bu bilgiye kodda nasıl erişeceğimizi göreceğiz.
*   **embedding (float32)**: Embedding, LlamaIndex-Derine Göl (Deep Lake)-OpenAI paketi tarafından doğrudan çağrılan bir OpenAI embedding modeli kullanılarak oluşturulur.
*   **id (str, otomatik olarak doldurulur)**: Her bir parçaya benzersiz bir ID atanır. Vektör deposu ayrıca 0'dan n'ye kadar bir sayı olan bir dizin içerir, ancak anlamsal olarak kullanılamaz çünkü veri kümesini her değiştirdiğimizde değişir. Ancak, benzersiz ID alanı değiştirilmeden kalacaktır.

### Kodları Açıklama

İlk olarak, vektör deposu ve veri kümesi yollarını tanımlarız:

```python
from llama_index.core import StorageContext
vector_store_path = "hub://denis76/drone_v2"
dataset_path = "hub://denis76/drone_v2"
```

Burada `vector_store_path` ve `dataset_path` değişkenlerine Derin Göl (Deep Lake) vektör deposunun ve veri kümesinin yollarını atıyoruz. Bu yolları kendi hesabınızın adıyla ve kullanmak istediğiniz veri kümesinin adıyla değiştirmelisiniz:

```python
vector_store_path = "hub://[YOUR VECTOR STORE/"
```

Ardından, bir vektör deposu oluşturur, onu doldurur ve belgeler üzerinde bir dizin oluştururuz:

```python
# overwrite=True veri kümesini üzerine yazar, False ise ekler
vector_store = DeepLakeVectorStore(dataset_path=dataset_path, overwrite=True)
storage_context = StorageContext.from_defaults(vector_store=vector_store)
# Belgelerden bir dizin oluştur
index = VectorStoreIndex.from_documents(documents, storage_context=storage_context)
```

`overwrite=True` olduğunda, vektör deposu oluşturulur ve mevcut olan üzerine yazılır. `overwrite=False` ise veri kümesini ekler.

### Veri Kümesinin Yapısı

Oluşturulan veri kümesinin yapısı aşağıdaki gibidir:

*   **text**: Metin içeriği
*   **metadata**: Metadata bilgileri (dosya yolu, dosya adı, dosya türü, dosya boyutu, oluşturma tarihi, son değiştirme tarihi vb.)
*   **embedding**: Metin içeriğinin embedding vektörü
*   **id**: Benzersiz ID

### Veri Kümesini Yükleme ve Görselleştirme

Veri kümesini yüklemek için:

```python
import deeplake
ds = deeplake.load(dataset_path)  # Veri kümesini yükle
```

Veri kümesini Jupyter Notebook'ta veya https://app.activeloop.ai/ adresinde görselleştirebiliriz:

```python
ds.visualize()
```

### Veri Kümesini Pandas DataFrame'e Yükleme

Veri kümesini bir Pandas DataFrame'e yüklemek için:

```python
import json
import pandas as pd
import numpy as np

# Veri kümesindeki tensorları bir sözlüğe yükle
data = {}
for tensor_name in ds.tensors:
    tensor_data = ds[tensor_name].numpy()
    if tensor_data.ndim > 1:
        data[tensor_name] = [np.array(e).flatten().tolist() for e in tensor_data]
    else:
        if tensor_name == "text":
            data[tensor_name] = [t.tobytes().decode('utf-8') if t else "" for t in tensor_data]
        else:
            data[tensor_name] = tensor_data.tolist()

# Sözlükten Pandas DataFrame oluştur
df = pd.DataFrame(data)
```

### Kaydı Görüntüleme

Bir kaydı görüntülemek için:

```python
# Seçilen kaydı görüntüleme fonksiyonu
def display_record(record_number):
    record = df.iloc[record_number]
    display_data = {
        "ID": record["id"] if "id" in record else "N/A",
        "Metadata": record["metadata"] if "metadata" in record else "N/A",
        "Text": record["text"] if "text" in record else "N/A",
        "Embedding": record["embedding"] if "embedding" in record else "N/A"
    }

# Kaydı görüntüle
rec = 0  # İstenen kayıt numarasıyla değiştirin
display_record(rec)
```

### Önemli Noktalar

*   Derin Göl (Deep Lake) vektör deposu oluşturma ve doldurma
*   Veri kümesinin yapısı (`text`, `metadata`, `embedding`, `id`)
*   Veri kümesini yükleme ve görselleştirme
*   Veri kümesini Pandas DataFrame'e yükleme
*   Kaydı görüntüleme

### Teknik Terimler

*   **Derin Göl (Deep Lake)**: Büyük veri kümelerini depolamak ve yönetmek için kullanılan bir veri gölü platformu
*   **Vektör Deposu (Vector Store)**: Vektörleri depolamak için kullanılan bir veri deposu
*   **Tensor**: Çok boyutlu diziler için kullanılan bir matematiksel nesne
*   **Embedding**: Metin veya diğer verileri vektör uzayında temsil etmek için kullanılan bir teknik
*   **Metadata**: Veriler hakkında bilgi sağlayan ek veriler

### İlgili Kodlar

*   `DeepLakeVectorStore`: Derin Göl (Deep Lake) vektör deposu oluşturmak için kullanılan sınıf
*   `StorageContext`: Depolama bağlamı oluşturmak için kullanılan sınıf
*   `VectorStoreIndex`: Vektör deposu dizini oluşturmak için kullanılan sınıf
*   `deeplake.load`: Derin Göl (Deep Lake) veri kümesini yüklemek için kullanılan fonksiyon
*   `ds.visualize`: Derin Göl (Deep Lake) veri kümesini görselleştirmek için kullanılan fonksiyon

## Pipeline 3: Index-based RAG (İndeks Tabanlı RAG)
Bu bölümde, Deep Lake ile hazırladığımız ve işlediğimiz verileri kullanarak LlamaIndex ile bir indeks tabanlı RAG pipeline'ı uygulayacağız. Heterojen (gürültü içeren) drone ile ilgili belge koleksiyonundan ilgili bilgileri alacağız ve OpenAI'ın LLM modelleri aracılığıyla yanıtı sentezleyeceğiz.

## Uygulanacak İndeks Motorları
Dört indeks motoru uygulayacağız:
*   ## Vector Store Index Engine (Vektör Depolama İndeks Motoru): Belgelerden bir vektör depolama indeksi oluşturur, böylece benzerlik tabanlı aramaları etkin kılar.
*   ## Tree Index (Ağaç İndeks): Belgelerden hiyerarşik bir ağaç indeksi oluşturur, alternatif bir erişim yapısı sunar.
*   ## List Index (Liste İndeks): Belgelerden basit bir liste indeksi oluşturur.
*   ## Keyword Table Index (Anahtar Kelime Tablosu İndeks): Belgelerden çıkarılan anahtar kelimelere dayalı bir indeks oluşturur.

## LLM ile Sorgulama
LLM ile sorgulama yapacağız:
*   ## Query Response and Source (Sorgu Yanıtı ve Kaynağı): Kullanıcı girdisini indeks ile sorgular, ilgili belgeleri alır ve sentezlenmiş bir yanıt ile kaynak bilgisini döndürür.

## Kullanıcı Girdisi ve Sorgu Parametreleri
Kullanıcı girdisi, çalıştıracağımız dört indeks motoru için referans sorusu olacaktır. Her yanıtı indeks motorunun erişimlerine göre değerlendireceğiz ve çıktıları zaman ve skor oranlarını kullanarak ölçütleyeceğiz.

Kullanıcı girdisi:
```python
user_input = "How do drones identify vehicles?"
```
Dört sorgu motoru, aynı parametrelerle sorunsuz bir şekilde çağrılacak. Ayarlayacağımız üç parametre:
```python
#similarity_top_k
k = 3
#temperature
temp = 0.1
#num_output
mt = 1024
```
Bu parametreler:
*   `k=3`: Sorgu motoru, en olası 3 yanıtı bulmak için `top-k` (en olası seçimler) değerini 3 olarak ayarlayacaktır. Bu durumda, `k` bir sıralama işlevi görecek ve LLM'yi en iyi belgeleri seçmeye zorlayacaktır.
*   `temp=0.1`: 0.1 gibi düşük bir sıcaklık, LLM'nin kesin sonuçlar üretmesini teşvik edecektir. Sıcaklık 0.9'a yükseltilirse, yanıt daha yaratıcı olacaktır. Ancak bu durumda, hassasiyet gerektiren drone teknolojisini araştırıyoruz.
*   `mt=1024`: Bu parametre, çıktıdaki token sayısını 1.024 ile sınırlayacaktır.

## Kosinüs Benzerliği Metriği (Cosine Similarity Metric)
Kosinüs benzerliği metriği, daha önce Chapter 2'de anlatılmıştır. Burada, yanıtlar için bir fonksiyon oluşturacağız:
```python
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
from sentence_transformers import SentenceTransformer

model = SentenceTransformer('all-MiniLM-L6-v2')

def calculate_cosine_similarity_with_embeddings(text1, text2):
    embeddings1 = model.encode(text1)
    embeddings2 = model.encode(text2)
    similarity = cosine_similarity([embeddings1], [embeddings2])
    return similarity[0][0]
```
Bu fonksiyon, sklearn ve Hugging Face'in SentenceTransformer'ını kullanır.

## Vektör Depolama İndeks Sorgu Motoru (Vector Store Index Query Engine)
VectorStoreIndex, LlamaIndex içinde belgelerden bilgi temsil etmek ve erişmek için vektör embedding'lerini uygulayan bir indeks türüdür. Benzer anlamlara sahip belgeler, vektör uzayında daha yakın embedding'lere sahip olacaktır.

```python
from llama_index.core import VectorStoreIndex

vector_store_index = VectorStoreIndex.from_documents(documents)
```
Bu kod, vektör depolama indeksini oluşturur.

```python
print(type(vector_store_index))
```
Bu kod, oluşturulan vektör depolama indeksinin türünü yazdırır.

```python
vector_query_engine = vector_store_index.as_query_engine(similarity_top_k=k, temperature=temp, num_output=mt)
```
Bu kod, sorgu motorunu oluşturur.

## Sorgu Yanıtı ve Kaynağı
Sorguyu yönetecek ve yanıtın içeriği hakkında bilgi döndürecek bir fonksiyon tanımlayacağız:
```python
import pandas as pd
import textwrap

def index_query(input_query):
    response = vector_query_engine.query(input_query)
    print(textwrap.fill(str(response), 100))
    node_data = []
    for node_with_score in response.source_nodes:
        node = node_with_score.node
        node_info = {
            'Node ID': node.id_,
            'Score': node_with_score.score,
            'Text': node.text
        }
        node_data.append(node_info)
    df = pd.DataFrame(node_data)
    return df, response
```
Bu fonksiyon, sorguyu çalıştırır ve sonuçları yapılandırılmış bir biçimde döndürür.

```python
import time

start_time = time.time()
df, response = index_query(user_input)
end_time = time.time()
elapsed_time = end_time - start_time
print(f"Query execution time: {elapsed_time:.4f} seconds")
print(df.to_markdown(index=False, numalign="left", stralign="left"))
```
Bu kod, sorgunun yürütülme süresini ölçer ve sonuçları yazdırır.

## Node ID ve Düğüm Bilgisi
Node ID, orijinal belgeye geri dönmeyi garanti eder. İlk düğümün node ID'sini almak için:
```python
nodeid = response.source_nodes[0].node_id
nodeid
```
Bu kod, ilk düğümün node ID'sini döndürür.

Düğümün tam metnini almak için:
```python
response.source_nodes[0].get_text()
```
Bu kod, düğümün tam metnini döndürür.

## Önemli Noktalar
*   Dört indeks motoru uygulanmıştır: Vector Store Index Engine, Tree Index, List Index ve Keyword Table Index.
*   LLM ile sorgulama yapılmıştır.
*   Kosinüs benzerliği metriği kullanılmıştır.
*   Vektör depolama indeks sorgu motoru oluşturulmuştur.
*   Sorgu yanıtı ve kaynağı işlenmiştir.
*   Node ID ve düğüm bilgisi alınmıştır.

Tüm kodlar tam olarak birebir aynı olmalıdır. Yukarıdaki kodları kullanarak, indeks tabanlı RAG pipeline'ını uygulayabilirsiniz.

### Optimize Edilmiş Parçalama (Optimized Chunking)
LlamaIndex, içerik parçalama boyutunu otomatik olarak belirleyebilir. Bu sayede, içerik daha anlamlı bir şekilde parçalanabilir.

## Parçalama Boyutunun Belirlenmesi
Aşağıdaki kod, içerik parçalama boyutunu otomatik olarak belirler:
```python
for node_with_score in response.source_nodes:
    node = node_with_score.node  # NodeWithScore'dan Node nesnesini çıkar
    chunk_size = len(node.text)
    print(f"Node ID: {node.id_}, Parçalama Boyutu: {chunk_size} karakter")
```
Bu kod, her bir node'un (`Node`) metin uzunluğunu (`len(node.text)`) hesaplar ve parçalama boyutunu (`chunk_size`) belirler.

## Performans Metriği (Performance Metric)
Performans metriği, sorguların doğruluğu ve geçen süre temel alınarak hesaplanır. Bu fonksiyon, sorgunun performans metriğini ve yürütme süresini hesaplar ve yazdırır.

### Performans Metriği Hesaplanması
```python
import numpy as np

def info_metrics(response):
    # Performans hesapla (None skorları işle)
    scores = [node.score for node in response.source_nodes if node.score is not None]
    if scores:  # Geçerli skor olup olmadığını kontrol et
        weights = np.exp(scores) / np.sum(np.exp(scores))
        perf = np.average(scores, weights=weights) / elapsed_time
    else:
        perf = 0  # Tüm skorlar None ise varsayılan değer

    # Sonuç, ağırlıklı ortalama skorun geçen süreye bölünmesiyle elde edilir:
    perf = np.average(scores, weights=weights) / elapsed_time
    return perf
```
Bu fonksiyon, node'ların skorlarını (`node.score`) kullanarak ağırlıklı ortalama skor hesaplar ve geçen süreye (`elapsed_time`) böler.

## Ağaç İndeks Sorgu Motoru (Tree Index Query Engine)
LlamaIndex'teki ağaç indeks (`TreeIndex`), metin belgelerini verimli bir şekilde yönetmek ve sorgulamak için hiyerarşik bir yapı oluşturur.

### Ağaç İndeks Oluşturma
Ağaç indeksi oluşturmak için aşağıdaki kod kullanılır:
```python
from llama_index.core import TreeIndex
tree_index = TreeIndex.from_documents(documents)
```
Bu kod, `documents` adlı belge koleksiyonundan bir `TreeIndex` nesnesi oluşturur.

### Ağaç İndeksi Sorgu Motoru Olarak Kullanma
```python
tree_query_engine = tree_index.as_query_engine(similarity_top_k=k, temperature=temp, num_output=mt)
```
Bu kod, `tree_index` nesnesini bir sorgu motoru (`query_engine`) olarak yapılandırır.

### Sorgu İşlemi ve Performans Metriği
```python
import time
import textwrap

# Zamanlayıcı başlat
start_time = time.time()
response = tree_query_engine.query(user_input)
# Zamanlayıcı durdur
end_time = time.time()
# Yürütme süresini hesapla ve yazdır
elapsed_time = end_time - start_time
print(f"Sorgu yürütme süresi: {elapsed_time:.4f} saniye")
print(textwrap.fill(str(response), 100))
```
Bu kod, sorguyu yürütür, yürütme süresini hesaplar ve sonucu yazdırır.

## Önemli Noktalar
*   Optimize edilmiş parçalama (`Optimized Chunking`), içerik parçalama boyutunu otomatik olarak belirler.
*   Performans metriği (`Performance Metric`), sorguların doğruluğu ve geçen süre temel alınarak hesaplanır.
*   Ağaç indeks (`Tree Index`), metin belgelerini verimli bir şekilde yönetmek ve sorgulamak için hiyerarşik bir yapı oluşturur.
*   LlamaIndex, Deep Lake ve OpenAI entegrasyonu, AI uygulamalarını daha verimli hale getirir.

## Teknik Terimler
*   **Chunking** (Parçalama): Büyük verileri daha küçük parçalara ayırma işlemi.
*   **LLM** (Large Language Model): Büyük dil modeli, metin işleme ve oluşturma için kullanılan bir yapay zeka modeli.
*   **Tree Index** (Ağaç İndeks): Verileri hiyerarşik bir yapı içinde düzenleyen bir veri yapısı.
*   **Query Engine** (Sorgu Motoru): Verileri sorgulamak için kullanılan bir bileşen.
*   **Performance Metric** (Performans Metriği): Bir sistemin veya algoritmanın performansını ölçmek için kullanılan bir ölçüt.

### Performans Metriği (Performance Metric)
Bu bölümde, Kullanıcı Girişi (User Input) ile RAG pipeline yanıtı arasındaki benzerliği ölçmek için Kosinüs Benzerliği (Cosine Similarity) metriği kullanılmıştır.

### Kod
```python
similarity_score = calculate_cosine_similarity_with_embeddings(user_input, str(response))
print(f"Kosinüs Benzerliği Skoru: {similarity_score:.3f}")
print(f"Sorgu Çalıştırma Süresi: {elapsed_time:.4f} saniye")
performance = similarity_score / elapsed_time
print(f"Performans Metriği: {performance:.4f}")
```
### Açıklama
Bu kod, Kullanıcı Girişi ve RAG pipeline yanıtı arasındaki Kosinüs Benzerliği skorunu hesaplar ve sorgu çalıştırma süresini ölçer. Performans metriği, Kosinüs Benzerliği skoru ile sorgu çalıştırma süresi arasındaki oran olarak hesaplanır.

## Liste İndeks Sorgu Motoru (List Index Query Engine)
Liste İndeks, düğümlerin bir listesi olarak düşünülmemelidir. Sorgu motoru, Kullanıcı Girişi ve her bir belgeyi bir LLM (Large Language Model) için bir istem olarak işler.

### Kod
```python
from llama_index.core import ListIndex
list_index = ListIndex.from_documents(documents)
list_query_engine = list_index.as_query_engine(similarity_top_k=k, temperature=temp, num_output=mt)
```
### Açıklama
Bu kod, Liste İndeks oluşturur ve onu bir sorgu motoru olarak kullanır. LLM parametreleri değiştirilmeden tutulur, böylece indeks türleri arasında karşılaştırma yapılabilir.

## Anahtar Kelime İndeks Sorgu Motoru (Keyword Index Query Engine)
Anahtar Kelime İndeks, belgelerden anahtar kelimeleri çıkarır ve onları bir tablo benzeri yapıya yerleştirir.

### Kod
```python
from llama_index.core import KeywordTableIndex
keyword_index = KeywordTableIndex.from_documents(documents)
keyword_query_engine = keyword_index.as_query_engine(similarity_top_k=k, temperature=temp, num_output=mt)
```
### Açıklama
Bu kod, Anahtar Kelime İndeks oluşturur ve onu bir sorgu motoru olarak kullanır. Anahtar kelimeler, ilgili düğümlere işaret eden ID'ler ile ilişkilendirilir.

## Performans Karşılaştırması
Farklı indeks türlerinin performansını karşılaştırmak için Kosinüs Benzerliği skoru ve sorgu çalıştırma süresi kullanılır.

### Kod
```python
similarity_score = calculate_cosine_similarity_with_embeddings(user_input, str(response))
print(f"Kosinüs Benzerliği Skoru: {similarity_score:.3f}")
print(f"Sorgu Çalıştırma Süresi: {elapsed_time:.4f} saniye")
performance = similarity_score / elapsed_time
print(f"Performans Metriği: {performance:.4f}")
```
### Açıklama
Bu kod, farklı indeks türlerinin performansını karşılaştırmak için kullanılır. Her bir indeks türü için Kosinüs Benzerliği skoru ve sorgu çalıştırma süresi ölçülür ve performans metriği hesaplanır.

## Özet (Summary)
Bu bölümde, indeks tabanlı arama ve RAG pipeline'ının dönüşümsel etkisi incelenmiştir. İndeks türleri (vektör, ağaç, liste ve anahtar kelime) ve sorgu motorları tanıtılmıştır.

### Önemli Noktalar
* İndeks tabanlı arama, RAG pipeline'ının performansını artırır.
* Farklı indeks türleri, farklı kullanım senaryolarına uygundur.
* Kosinüs Benzerliği skoru ve sorgu çalıştırma süresi, performans karşılaştırması için kullanılır.
* LlamaIndex, Deep Lake ve OpenAI gibi teknolojiler, RAG pipeline'ında kullanılır.

## Teknik Terimler
* Kosinüs Benzerliği (Cosine Similarity)
* Liste İndeks (List Index)
* Anahtar Kelime İndeks (Keyword Index)
* Vektör Store (Vector Store)
* LLM (Large Language Model)
* RAG (Retrieval-Augmented Generation)

## Sorular ve Cevaplar
Aşağıdaki soruları Evet veya Hayır olarak cevaplayın:

## Sorular
1. ## İndeksler, retrieval-augmented generative AI'de (İyileştirilmiş üretken yapay zeka) hassasiyeti (precision) ve hızı (speed) artırır mı?
Cevap: ## Evet
Açıklama: İndeksler (Indexes), büyük veri kümelerinde (large datasets) arama yaparken (search) hızı ve hassasiyeti artırır. Retrieval-augmented generative AI (RAG), üretken yapay zeka modellerinin (generative AI models) dış bilgi kaynaklarına (external knowledge sources) erişimini sağlar ve indeksler bu süreçte önemli rol oynar.

2. ## İndeksler, RAG çıktılarına (outputs) izlenebilirlik (traceability) sağlar mı?
Cevap: ## Evet
Açıklama: İndeksler, RAG modellerinin çıktılarına izlenebilirlik sağlar. Bu, modelin hangi bilgilere dayandığını (provenance) takip etmeyi mümkün kılar.

3. ## İndeks tabanlı arama (index-based search), büyük veri kümelerinde vektör tabanlı aramadan (vector-based search) daha mı yavaştır?
Cevap: ## Hayır
Açıklama: İndeks tabanlı arama genellikle vektör tabanlı aramadan daha hızlıdır. Çünkü indeksler, verileri önceden işlenmiş (pre-processed) ve organize edilmiş bir şekilde saklar.

4. ## LlamaIndex, Deep Lake ve OpenAI ile sorunsuz bir şekilde entegre olur mu?
Cevap: ## Evet
Açıklama: LlamaIndex, Deep Lake ve OpenAI gibi popüler araçlar ve platformlarla entegrasyon (integration) sağlar. Bu, geliştiricilerin (developers) farklı araçları bir arada kullanmalarını kolaylaştırır.

5. ## Ağaç (tree), liste (list), vektör (vector) ve anahtar kelime (keyword) indeksleri, mevcut olan tek indeks türleri midir?
Cevap: ## Hayır
Açıklama: Farklı indeks türleri vardır. Ağaç, liste, vektör ve anahtar kelime indeksleri yaygın kullanılan türlerdir, ancak başka indeks türleri de mevcuttur.

6. ## Anahtar kelime indeksi, veri alma işleminde anlamsal anlamaya (semantic understanding) dayanır mı?
Cevap: ## Hayır
Açıklama: Anahtar kelime indeksleri (keyword indexes), genellikle kelime eşleştirmesine (keyword matching) dayanır ve anlamsal anlamaya (semantic understanding) dayanmaz.

7. ## LlamaIndex, parçalama (chunking) ve embedding işlemlerini otomatik olarak halleder mi?
Cevap: ## Evet
Açıklama: LlamaIndex, veri hazırlama (data preparation) süreçlerini otomatikleştirir, bu da parçalama ve embedding işlemlerini içerir.

8. ## RAG tarafından üretilen çıktıların izlenebilirliğini sağlamak için meta veri (metadata) geliştirmeleri önemlidir?
Cevap: ## Evet
Açıklama: Meta veri geliştirmeleri, RAG çıktılarının izlenebilirliğini (traceability) sağlamak için önemlidir. Bu, modelin karar verme sürecini (decision-making process) anlamak için kritiktir.

9. ## Gerçek zamanlı güncellemeler (real-time updates), indeks tabanlı arama sistemine kolayca uygulanabilir mi?
Cevap: ## Hayır
Açıklama: Gerçek zamanlı güncellemeler, indeks tabanlı arama sistemlerinde zor olabilir. Çünkü indekslerin güncellenmesi (index updates) zaman alabilir ve sistemin performansını (performance) etkileyebilir.

10. ## Kosinüs benzerliği (cosine similarity), bu bölümde sorgu doğruluğunu (query accuracy) değerlendirmek için kullanılan bir metriktir?
Cevap: ## Evet
Açıklama: Kosinüs benzerliği, vektörler arasındaki benzerliği (vector similarity) ölçmek için kullanılan bir metriktir ve sorgu doğruluğunu değerlendirmek için kullanılır.

## Önemli Noktalar:
* ## İndeksler, retrieval-augmented generative AI'de hassasiyeti ve hızı artırır.
* ## İndeksler, RAG çıktılarına izlenebilirlik sağlar.
* ## LlamaIndex, Deep Lake ve OpenAI ile entegre olur.
* ## LlamaIndex, parçalama ve embedding işlemlerini otomatik olarak halleder.
* ## Meta veri geliştirmeleri, RAG çıktılarının izlenebilirliğini sağlamak için önemlidir.
* ## Kosinüs benzerliği, sorgu doğruluğunu değerlendirmek için kullanılan bir metriktir.

## Kod Örnekleri:
Aşağıdaki kod örnekleri, LlamaIndex'in nasıl kullanılacağını gösterir:
```python
from llama_index import SimpleDirectoryReader, GPTVectorStoreIndex

# Veri yükleme
documents = SimpleDirectoryReader('data').load_data()

# İndeks oluşturma
index = GPTVectorStoreIndex.from_documents(documents)

# Sorgu yapma
query_engine = index.as_query_engine()
response = query_engine.query("Sorgu metni")
print(response)
```
## Kod Açıklaması:
* `SimpleDirectoryReader`: Belirtilen dizindeki dosyaları okur ve `Document` nesnelerine dönüştürür.
* `GPTVectorStoreIndex`: Yüklenen belgelerden bir indeks oluşturur.
* `as_query_engine()`: İndeksi bir sorgu motoruna dönüştürür.
* `query()`: Belirtilen sorguyu çalıştırır ve sonuçları döndürür.

Bu kod, LlamaIndex kullanarak veri yüklemeyi, indeks oluşturmayı ve sorgu yapmayı gösterir.

In [13]:

from together import Together

def ask_together(content):

    client = Together(api_key="07e297e19eaabe78c4ae52006f8d7ea67d6470727fff514aba20559fb273ea31")

    response = client.chat.completions.create(
    model="meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8",
    messages=[{"role":"user","content":content}],
    temperature=0.51,
    top_p=0.91,
    seed=198
)
    return print(response.choices[0].message.content)


soru = """

Aşağıdaki paragrafta anlatılan konuyu türkçe olarak tekrar düzenle ve önemli noktaları maddeler halinde yaz aynı zamanda text içinde kodlar varsa yaz ve açıkla  , türkçenin yanına ingilizce teknik terimleri parantez içinde eklermisin , ayrıca konu da önemli gördüğün eklemeleri yapabilirsin , tüm yazıları markdown ##yazı şeklinde yaz , Lütfen tüm kodları eksiksiz olarak yaz , kodlar tam olarak birebir aynı olmalıdır,Ayrıca kodları ayrıntılı olarak açıkla nerede ve nasıl kullanıldığını kodun altına yaz,Texte olan tüm konuları eklemelisin


-----------------------------------------------------------------BAŞLA------------------------





Questions
Answer the following questions with Yes or No:

Do indexes increase precision and speed in retrieval-augmented generative AI?
Can indexes offer traceability for RAG outputs?
Is index-based search slower than vector-based search for large datasets?
Does LlamaIndex integrate seamlessly with Deep Lake and OpenAI?
Are tree, list, vector, and keyword indexes the only types of indexes?
Does the keyword index rely on semantic understanding to retrieve data?
Is LlamaIndex capable of automatically handling chunking and embedding?
Are metadata enhancements crucial for ensuring the traceability of RAG-generated outputs?
Can real-time updates easily be applied to an index-based search system?
Is cosine similarity a metric used in this chapter to evaluate query accuracy?











-------------------------------------BİTİR----------------------------------------------

"""

ask_together(soru)

## Sorular ve Cevaplar
Aşağıdaki soruları Evet veya Hayır olarak cevaplayın:

## Sorular
1. ## İndeksler, retrieval-augmented generative AI'de (İyileştirilmiş üretken yapay zeka) hassasiyeti (precision) ve hızı (speed) artırır mı?
Cevap: ## Evet
Açıklama: İndeksler (Indexes), büyük veri kümelerinde (large datasets) arama yaparken (search) hızı ve hassasiyeti artırır. Retrieval-augmented generative AI (RAG), üretken yapay zeka modellerinin (generative AI models) dış bilgi kaynaklarına (external knowledge sources) erişimini sağlar ve indeksler bu süreçte önemli rol oynar.

2. ## İndeksler, RAG çıktılarına (outputs) izlenebilirlik (traceability) sağlar mı?
Cevap: ## Evet
Açıklama: İndeksler, RAG modellerinin çıktılarına izlenebilirlik sağlar. Bu, modelin hangi bilgilere dayandığını (provenance) takip etmeyi mümkün kılar.

3. ## İndeks tabanlı arama (index-based search), büyük veri kümelerinde vektör tabanlı aramadan (vector-based search) daha mı yavaştır?
Cevap: ## Hayır
Açıklama: İndeks 