# Analisis dan Eksperimen Sistem Informasi Retrieval (IR) - UTS STKI

Notebook ini digunakan untuk mendokumentasikan proses dan hasil eksperimen pada sistem IR yang dibangun, termasuk visualisasi hasil evaluasi.

## 1. Pengenalan

Sistem IR ini menggunakan dua model utama:
- Boolean Retrieval
- Vector Space Model (VSM) dengan TF-IDF dan Cosine Similarity

Data yang digunakan adalah teks tentang berbagai penyakit dan gejala dalam bahasa Indonesia.

## 2. Setup dan Import

Import library yang diperlukan untuk analisis dan visualisasi.

In [None]:
# Setup path untuk import
import sys
import os
sys.path.append('..')

# Import libraries
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np
from src.evaluation import evaluate_model
from src.boolean_retrieval import BooleanRetrieval
from src.vsm import VectorSpaceModel

# Set style untuk visualisasi
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (12, 8)

## 3. Preprocessing Data

Langkah-langkah preprocessing:
- Lowercase
- Remove punctuation
- Stemming menggunakan Sastrawi

Implementasi ada di `src/preprocess.py`.

In [None]:
# Contoh penggunaan preprocessing
from src.preprocess import preprocess_file

# Preprocess file raw ke clean
preprocess_file('data/raw/alergi.txt', 'data/processed/alergi_clean.txt')
print("Preprocessing selesai untuk alergi.txt")

## 4. Eksperimen dan Evaluasi Model

Mari kita lakukan eksperimen dengan beberapa query dan bandingkan performa Boolean Retrieval vs VSM.

In [None]:
# Inisialisasi model
br = BooleanRetrieval()
vsm = VectorSpaceModel()

# Definisi queries dan ground truth untuk eksperimen
queries = ['demam', 'batuk', 'sakit kepala', 'flu']
ground_truth = {
    'demam': ['demam', 'flu'],
    'batuk': ['batuk', 'asma'],
    'sakit kepala': ['sakit_kepala', 'hipertensi'],
    'flu': ['flu', 'demam']
}

# Evaluasi kedua model
br_results = evaluate_model(br, queries, ground_truth, k=10)
vsm_results = evaluate_model(vsm, queries, ground_truth, k=10)

print("Evaluasi Boolean Retrieval:")
print(br_results)
print("\nEvaluasi VSM:")
print(vsm_results)

## 5. Visualisasi Hasil Evaluasi

Mari kita visualisasikan hasil evaluasi untuk membandingkan performa kedua model.

In [None]:
# Persiapkan data untuk visualisasi
data = []
for query in queries:
    data.append({
        'Query': query,
        'Model': 'Boolean Retrieval',
        'Precision': br_results[query]['precision'],
        'Recall': br_results[query]['recall'],
        'AP': br_results[query]['ap']
    })
    data.append({
        'Query': query,
        'Model': 'VSM',
        'Precision': vsm_results[query]['precision'],
        'Recall': vsm_results[query]['recall'],
        'AP': vsm_results[query]['ap']
    })

df = pd.DataFrame(data)
df

In [None]:
# Visualisasi Precision
plt.figure(figsize=(12, 6))
sns.barplot(data=df, x='Query', y='Precision', hue='Model', palette='viridis')
plt.title('Perbandingan Precision antara Boolean Retrieval dan VSM')
plt.ylabel('Precision')
plt.xlabel('Query')
plt.legend(title='Model')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

In [None]:
# Visualisasi Recall
plt.figure(figsize=(12, 6))
sns.barplot(data=df, x='Query', y='Recall', hue='Model', palette='plasma')
plt.title('Perbandingan Recall antara Boolean Retrieval dan VSM')
plt.ylabel('Recall')
plt.xlabel('Query')
plt.legend(title='Model')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

In [None]:
# Visualisasi Average Precision (AP)
plt.figure(figsize=(12, 6))
sns.barplot(data=df, x='Query', y='AP', hue='Model', palette='coolwarm')
plt.title('Perbandingan Average Precision (AP) antara Boolean Retrieval dan VSM')
plt.ylabel('Average Precision')
plt.xlabel('Query')
plt.legend(title='Model')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

In [None]:
# Visualisasi MAP@k
map_data = pd.DataFrame({
    'Model': ['Boolean Retrieval', 'VSM'],
    'MAP@k': [br_results['MAP@k'], vsm_results['MAP@k']]
})

plt.figure(figsize=(8, 6))
sns.barplot(data=map_data, x='Model', y='MAP@k', palette='Set2')
plt.title('Perbandingan Mean Average Precision (MAP@k)')
plt.ylabel('MAP@k')
plt.xlabel('Model')
plt.ylim(0, 1)
plt.tight_layout()
plt.show()

In [None]:
# Heatmap perbandingan metrik
pivot_precision = df.pivot(index='Query', columns='Model', values='Precision')
pivot_recall = df.pivot(index='Query', columns='Model', values='Recall')
pivot_ap = df.pivot(index='Query', columns='Model', values='AP')

fig, axes = plt.subplots(1, 3, figsize=(18, 6))

sns.heatmap(pivot_precision, annot=True, cmap='Blues', ax=axes[0], cbar_kws={'label': 'Precision'})
axes[0].set_title('Heatmap Precision')

sns.heatmap(pivot_recall, annot=True, cmap='Greens', ax=axes[1], cbar_kws={'label': 'Recall'})
axes[1].set_title('Heatmap Recall')

sns.heatmap(pivot_ap, annot=True, cmap='Reds', ax=axes[2], cbar_kws={'label': 'Average Precision'})
axes[2].set_title('Heatmap Average Precision')

plt.tight_layout()
plt.show()

## 6. Analisis Hasil

Berdasarkan visualisasi di atas, kita dapat menganalisis:

- **Precision**: Mengukur akurasi hasil yang relevan.
- **Recall**: Mengukur kemampuan menemukan semua dokumen relevan.
- **Average Precision (AP)**: Rata-rata precision pada setiap posisi dokumen relevan.
- **MAP@k**: Rata-rata AP untuk semua query.

Visualisasi ini membantu kita memahami kekuatan dan kelemahan masing-masing model untuk berbagai jenis query.

## 7. Kesimpulan

Ringkasan hasil eksperimen dan perbandingan model:

- Boolean Retrieval cocok untuk query yang tepat dan logis.
- VSM lebih fleksibel untuk query bahasa alami dan memberikan skor relevansi.

Pilih model berdasarkan kebutuhan aplikasi: Boolean untuk kontrol ketat, VSM untuk fleksibilitas.