# Βήμα 5: Αξιολόγηση Αποτελεσμάτων Αναζήτησης

Σε αυτό το βήμα, διαβάζουμε τα αποτελέσματα αναζήτησης από το Βήμα 4 και υπολογίζουμε τις μετρικές αξιολόγησης:
1. **Precision (Ακρίβεια)**: Ποσοστό των σχετικών άρθρων που ανακτήθηκαν.
2. **Recall (Ανάκληση)**: Ποσοστό των σχετικών άρθρων που εντοπίστηκαν.
3. **F1-Score**: Ο συνδυασμός Precision και Recall.

Τα αποτελέσματα αποθηκεύονται σε ένα αρχείο JSON για μελλοντική ανάλυση.


## Κελί 1: Φόρτωση Αρχείων
Σχόλιο:
Αυτή η συνάρτηση φορτώνει τα παρακάτω:

Τα άρθρα (processed_articles.json).
Τα αποτελέσματα αναζήτησης (search_results.json), που δημιουργήθηκαν στο Βήμα 

In [13]:
import json

# Φόρτωση επεξεργασμένων άρθρων
with open('processed_articles.json', 'r', encoding='utf-8') as f:
    articles = json.load(f)

# Φόρτωση αποτελεσμάτων από το Βήμα 4
with open('search_results.json', 'r', encoding='utf-8') as f:
    search_results = json.load(f)

# Εμφάνιση δεδομένων
print(f"Loaded {len(articles)} articles.")
print(f"Loaded search results for query: '{search_results['query']}' using algorithm: '{search_results['algorithm']}'.")


Loaded 100 articles.
Loaded search results for query: 'algebra' using algorithm: 'bm25'.


## Κελί 2: Υπολογισμός Μετρικών
Σχόλιο:
Υπολογίζουμε τις μετρικές Precision, Recall, και F1-Score με βάση:

Τα σχετικά άρθρα (relevant_docs).
Τα άρθρα που ανακτήθηκαν (retrieved_docs).

In [15]:
# Συνάρτηση υπολογισμού Precision, Recall, και F1-Score
def calculate_metrics(relevant_docs, retrieved_docs):
    """
    Υπολογίζει τις μετρικές Precision, Recall, και F1-Score.
    """
    relevant_set = set(relevant_docs)
    retrieved_set = set(retrieved_docs)

    true_positives = len(relevant_set & retrieved_set)
    false_positives = len(retrieved_set - relevant_set)
    false_negatives = len(relevant_set - retrieved_set)

    precision = true_positives / (true_positives + false_positives) if (true_positives + false_positives) > 0 else 0
    recall = true_positives / (true_positives + false_negatives) if (true_positives + false_negatives) > 0 else 0
    f1_score = (2 * precision * recall) / (precision + recall) if (precision + recall) > 0 else 0

    return {
        "precision": precision,
        "recall": recall,
        "f1_score": f1_score
    }

# Θεωρούμε ότι όλα τα άρθρα είναι σχετικά (για δοκιμή)
relevant_docs = list(range(len(articles)))

# Λήψη ανακτημένων άρθρων από τα αποτελέσματα
retrieved_docs = search_results['retrieved_ids']

# Υπολογισμός μετρικών
metrics = calculate_metrics(relevant_docs, retrieved_docs)

# Εμφάνιση μετρικών
print("\nEvaluation Metrics:")
print(f"Precision: {metrics['precision']:.2f}")
print(f"Recall: {metrics['recall']:.2f}")
print(f"F1-Score: {metrics['f1_score']:.2f}")



Evaluation Metrics:
Precision: 1.00
Recall: 0.54
F1-Score: 0.70


## TFIDF**

**Evaluation Metrics: **

**Precision: 1.00**

**Recall: 0.40** 

**F1-Score: 0.57**



## BM25**

**Evaluation Metrics: **

**Precision: 1.00**

**Recall: 0.54** 

**F1-Score: 0.70**



## Κελί 3: Αποθήκευση Μετρικών

Σχόλιο:
Οι μετρικές αποθηκεύονται σε ένα αρχείο evaluation_results.json για μελλοντική ανάλυση.

In [12]:
# Προετοιμασία δεδομένων για αποθήκευση
evaluation_data = {
    "query": search_results['query'],
    "algorithm": search_results['algorithm'],
    "metrics": metrics
}

# Αποθήκευση μετρικών σε αρχείο JSON
with open('evaluation_results.json', 'w', encoding='utf-8') as f:
    json.dump(evaluation_data, f, indent=4, ensure_ascii=False)

print("\nEvaluation metrics saved to 'evaluation_results.json'.")



Evaluation metrics saved to 'evaluation_results.json'.
