# Προβλήματα και Λύσεις Κατακερματισμού (Hashing)

Αυτό το notebook περιέχει τρία προβλήματα σχετικά με τον κατακερματισμό (hashing) και τις λύσεις τους. Τα προβλήματα καλύπτουν διαφορετικές πτυχές του κατακερματισμού που είναι σημαντικές στην επιστήμη υπολογιστών:

1. **Σύγκριση Μεθόδων Ανοιχτής Διευθυνσιοδότησης**
2. **Υλοποίηση Καθολικής Οικογένειας Κατακερματισμού**
3. **Υλοποίηση Κατακερματισμού Κούκου (Cuckoo Hashing)**

Αυτά τα προβλήματα σχετίζονται με την ύλη του μαθήματος "Εισαγωγή στον αντικειμενοστρεφή προγραμματισμό και τις δομές δεδομένων με C++".

## Θεωρητικό Υπόβαθρο

Ο **κατακερματισμός (hashing)** είναι μια τεχνική που χρησιμοποιείται στις δομές δεδομένων για την αποτελεσματική αποθήκευση και ανάκτηση δεδομένων σε σταθερό ή σχεδόν σταθερό χρόνο O(1). 

Βασικά στοιχεία του κατακερματισμού:

1. **Συνάρτηση κατακερματισμού (Hash function)**: Μετατρέπει το κλειδί σε μια αριθμητική τιμή κατακερματισμού.
2. **Πίνακας κατακερματισμού (Hash table)**: Ο πίνακας που αποθηκεύει τα δεδομένα.
3. **Συγκρούσεις (Collisions)**: Συμβαίνουν όταν δύο διαφορετικά κλειδιά παράγουν την ίδια τιμή κατακερματισμού.

### Τεχνικές επίλυσης συγκρούσεων:

1. **Ανοιχτή Διευθυνσιοδότηση (Open Addressing)**:
   - **Γραμμική Διερεύνηση (Linear Probing)**: Ψάχνουμε διαδοχικά τις επόμενες θέσεις.
   - **Τετραγωνική Διερεύνηση (Quadratic Probing)**: Χρησιμοποιούμε τετραγωνική συνάρτηση.
   - **Διπλός Κατακερματισμός (Double Hashing)**: Χρησιμοποιούμε δεύτερη συνάρτηση κατακερματισμού.

2. **Κλειστή Διευθυνσιοδότηση (Closed Addressing) ή Χωριστή Αλυσίδωση (Separate Chaining)**:
   - Κάθε θέση του πίνακα περιέχει μια λίστα από στοιχεία.

3. **Κατακερματισμός Κούκου (Cuckoo Hashing)**:
   - Χρησιμοποιεί δύο πίνακες και δύο συναρτήσεις κατακερματισμού.
   - Εγγυάται σταθερό χρόνο αναζήτησης (2 δοκιμές μόνο).

## Πρόβλημα 1: Σύγκριση Μεθόδων Ανοιχτής Διευθυνσιοδότησης

### Εκφώνηση:
Υλοποιήστε και συγκρίνετε τις τρεις μεθόδους ανοιχτής διευθυνσιοδότησης (γραμμική διερεύνηση, τετραγωνική διερεύνηση, και διπλό κατακερματισμό) σε έναν πίνακα κατακερματισμού μεγέθους m = 17. Εισάγετε τα κλειδιά 23, 38, 42, 59, 63, 71, 84, 92 στον πίνακα χρησιμοποιώντας τη συνάρτηση κατακερματισμού h(k) = k mod m. Για τον διπλό κατακερματισμό, χρησιμοποιήστε επιπλέον τη συνάρτηση h₂(k) = 1 + (k mod (m-1)). Συγκρίνετε τον αριθμό των συγκρούσεων και την τελική κατανομή των κλειδιών.

In [None]:
#include <iostream>
#include <iomanip>
#include <vector>
using namespace std;

// Υλοποίηση των τριών μεθόδων ανοιχτής διευθυνσιοδότησης
class HashTableOpenAddressing {
private:
    enum SlotStatus { EMPTY, OCCUPIED, DELETED };
    
    struct HashEntry {
        int key;
        SlotStatus status;
        
        HashEntry() : status(EMPTY) {}
    };
    
    vector<HashEntry> table;
    int size;      // Αριθμός στοιχείων
    int capacity;  // Μέγεθος πίνακα
    int collisions; // Μετρητής συγκρούσεων
    
    // Κύρια συνάρτηση κατακερματισμού
    int h1(int key) const {
        return key % capacity;
    }
    
    // Δευτερεύουσα συνάρτηση κατακερματισμού για διπλό κατακερματισμό
    int h2(int key) const {
        return 1 + (key % (capacity - 1));
    }
    
    // Συναρτήσεις διερεύνησης θέσης
    
    // Γραμμική διερεύνηση: h(k, i) = (h1(k) + i) % m
    int linearProbing(int key, int i) const {
        return (h1(key) + i) % capacity;
    }
    
    // Τετραγωνική διερεύνηση: h(k, i) = (h1(k) + i + i*i) % m
    int quadraticProbing(int key, int i) const {
        return (h1(key) + i + i*i) % capacity;
    }
    
    // Διπλός κατακερματισμός: h(k, i) = (h1(k) + i*h2(k)) % m
    int doubleHashing(int key, int i) const {
        return (h1(key) + i * h2(key)) % capacity;
    }
    
public:
    enum ProbingMethod { LINEAR, QUADRATIC, DOUBLE };
    
    // Κατασκευαστής
    HashTableOpenAddressing(int m) : capacity(m), size(0), collisions(0) {
        table.resize(capacity);
    }
    
    // Εισαγωγή στοιχείου με την επιλεγμένη μέθοδο διερεύνησης
    void insert(int key, ProbingMethod method) {
        if (size >= capacity) {
            cout << "Ο πίνακας είναι πλήρης!" << endl;
            return;
        }
        
        int i = 0;
        int index;
        
        do {
            // Επιλογή μεθόδου διερεύνησης
            switch(method) {
                case LINEAR:
                    index = linearProbing(key, i);
                    break;
                case QUADRATIC:
                    index = quadraticProbing(key, i);
                    break;
                case DOUBLE:
                    index = doubleHashing(key, i);
                    break;
            }
            
            // Αν βρούμε κενή θέση ή διαγραμμένη, εισάγουμε το κλειδί
            if (table[index].status == EMPTY || table[index].status == DELETED) {
                table[index].key = key;
                table[index].status = OCCUPIED;
                size++;
                return;
            }
            
            // Αν υπάρχει σύγκρουση, αυξάνουμε τον μετρητή συγκρούσεων
            if (i == 0) {
                collisions++;
            }
            
            i++;
        } while (i < capacity);
        
        // Αν φτάσουμε εδώ, ο πίνακας είναι γεμάτος ή δεν βρέθηκε θέση
        cout << "Δεν ήταν δυνατή η εισαγωγή του κλειδιού " << key << endl;
    }
    
    // Εμφάνιση του πίνακα
    void display() const {
        cout << "Πίνακας κατακερματισμού (μέγεθος: " << capacity << ", στοιχεία: " << size << "):" << endl;
        for (int i = 0; i < capacity; i++) {
            cout << setw(2) << i << ": ";
            if (table[i].status == OCCUPIED) {
                cout << table[i].key;
            } else if (table[i].status == DELETED) {
                cout << "<διαγραμμένο>";
            } else {
                cout << "<κενό>";
            }
            cout << endl;
        }
        cout << "Συγκρούσεις: " << collisions << endl;
    }
    
    // Επαναφορά του πίνακα
    void clear() {
        for (int i = 0; i < capacity; i++) {
            table[i].status = EMPTY;
        }
        size = 0;
        collisions = 0;
    }
    
    // Επιστροφή του αριθμού συγκρούσεων
    int getCollisions() const {
        return collisions;
    }
};

// Συνάρτηση για την εκτέλεση του πειράματος με την επιλεγμένη μέθοδο
void runExperiment(const vector<int>& keys, HashTableOpenAddressing::ProbingMethod method) {
    string methodName;
    switch(method) {
        case HashTableOpenAddressing::LINEAR:
            methodName = "Γραμμική Διερεύνηση";
            break;
        case HashTableOpenAddressing::QUADRATIC:
            methodName = "Τετραγωνική Διερεύνηση";
            break;
        case HashTableOpenAddressing::DOUBLE:
            methodName = "Διπλός Κατακερματισμός";
            break;
    }
    
    cout << "\n=== " << methodName << " ===" << endl;
    HashTableOpenAddressing hashTable(17);
    
    // Εισαγωγή των κλειδιών
    for (int key : keys) {
        hashTable.insert(key, method);
    }
    
    // Εμφάνιση του τελικού πίνακα
    hashTable.display();
    
    // Αποθήκευση των αποτελεσμάτων για σύγκριση
    cout << "Μέθοδος: " << methodName << ", Συγκρούσεις: " << hashTable.getCollisions() << endl;
}

int main() {
    // Τα κλειδιά που θα εισαχθούν
    vector<int> keys = {23, 38, 42, 59, 63, 71, 84, 92};
    
    cout << "Σύγκριση μεθόδων ανοιχτής διευθυνσιοδότησης" << endl;
    cout << "Κλειδιά: ";
    for (int key : keys) {
        cout << key << " ";
    }
    cout << endl;
    
    // Εκτέλεση του πειράματος για κάθε μέθοδο
    runExperiment(keys, HashTableOpenAddressing::LINEAR);
    runExperiment(keys, HashTableOpenAddressing::QUADRATIC);
    runExperiment(keys, HashTableOpenAddressing::DOUBLE);
    
    return 0;
}

### Ανάλυση αποτελεσμάτων Προβλήματος 1:

Εκτελώντας το παραπάνω πρόγραμμα, παρατηρούμε ότι:

1. **Γραμμική Διερεύνηση:** Είχαμε 1 σύγκρουση. Το κλειδί 59 έπρεπε να μπει στη θέση 8 (59 mod 17 = 8), αλλά επειδή ήταν κατειλημμένη από το 42, τοποθετήθηκε στην επόμενη διαθέσιμη θέση 9.

2. **Τετραγωνική Διερεύνηση:** Είχαμε επίσης 1 σύγκρουση, αλλά το κλειδί 59 τοποθετήθηκε στη θέση 10 αντί για τη θέση 9, καθώς η τετραγωνική διερεύνηση χρησιμοποιεί το i + i² για τον υπολογισμό της απόστασης.

3. **Διπλός Κατακερματισμός:** Είχαμε 2 συγκρούσεις και διαφορετική κατανομή στοιχείων. Αυτό συμβαίνει επειδή η δεύτερη συνάρτηση κατακερματισμού προσφέρει διαφορετικό βήμα διερεύνησης για κάθε κλειδί.

Στο συγκεκριμένο παράδειγμα, η γραμμική και η τετραγωνική διερεύνηση είχαν παρόμοια απόδοση, ενώ ο διπλός κατακερματισμός είχε περισσότερες συγκρούσεις. Αυτό είναι ένα μικρό δείγμα και σε μεγαλύτερους πίνακες με περισσότερα δεδομένα, ο διπλός κατακερματισμός συνήθως επιτυγχάνει καλύτερη κατανομή και λιγότερες συγκρούσεις μακροπρόθεσμα.

## Πρόβλημα 2: Υλοποίηση Καθολικής Οικογένειας Κατακερματισμού

### Εκφώνηση:
Υλοποιήστε μια καθολική οικογένεια συναρτήσεων κατακερματισμού όπως περιγράφεται στις σημειώσεις. Συγκεκριμένα, χρησιμοποιήστε την οικογένεια h(k) = ((a·k + b) mod p) mod m, όπου p είναι ένας πρώτος αριθμός μεγαλύτερος από το μέγιστο κλειδί, a ∈ [1, p-1] και b ∈ [0, p-1]. Δημιουργήστε ένα πρόγραμμα που θα επιλέγει τυχαία μια συνάρτηση από αυτή την οικογένεια και θα την χρησιμοποιεί για την εισαγωγή κλειδιών σε έναν πίνακα κατακερματισμού με αλυσίδωση. Δοκιμάστε την με 20 τυχαία κλειδιά στο διάστημα [1, 100] και υπολογίστε το μέσο μήκος αλυσίδας.

In [None]:
#include <iostream>
#include <vector>
#include <list>
#include <random>
#include <ctime>
#include <iomanip>
using namespace std;

// Κλάση που υλοποιεί την καθολική οικογένεια συναρτήσεων κατακερματισμού
class UniversalHashFunction {
private:
    int a;      // Συντελεστής a (1 <= a < p)
    int b;      // Συντελεστής b (0 <= b < p)
    int p;      // Πρώτος αριθμός > max_key
    int m;      // Μέγεθος πίνακα
    
public:
    // Κατασκευαστής που επιλέγει τυχαία τους συντελεστές
    UniversalHashFunction(int max_key, int table_size) : m(table_size) {
        // Επιλέγουμε ένα πρώτο αριθμό μεγαλύτερο από το μέγιστο κλειδί
        p = findNextPrime(max_key);
        
        // Τυχαία επιλογή των συντελεστών a και b
        random_device rd;
        mt19937 gen(rd());
        uniform_int_distribution<int> dist_a(1, p - 1);
        uniform_int_distribution<int> dist_b(0, p - 1);
        
        a = dist_a(gen);
        b = dist_b(gen);
    }
    
    // Συνάρτηση κατακερματισμού h(k) = ((a*k + b) mod p) mod m
    int hash(int key) const {
        // Χρησιμοποιούμε long long για να αποφύγουμε υπερχείλιση
        long long result = (static_cast<long long>(a) * key + b) % p;
        return static_cast<int>(result % m);
    }
    
    // Εμφάνιση των παραμέτρων της συνάρτησης
    void displayParams() const {
        cout << "Παράμετροι συνάρτησης κατακερματισμού:" << endl;
        cout << "a = " << a << ", b = " << b << ", p = " << p << ", m = " << m << endl;
        cout << "h(k) = ((a*k + b) mod p) mod m = ((" << a << "*k + " << b << ") mod " << p << ") mod " << m << endl;
    }
    
private:
    // Έλεγχος αν ένας αριθμός είναι πρώτος
    bool isPrime(int n) {
        if (n <= 1) return false;
        if (n <= 3) return true;
        if (n % 2 == 0 || n % 3 == 0) return false;
        
        for (int i = 5; i * i <= n; i += 6) {
            if (n % i == 0 || n % (i + 2) == 0) {
                return false;
            }
        }
        return true;
    }
    
    // Εύρεση του επόμενου πρώτου αριθμού >= n
    int findNextPrime(int n) {
        while (!isPrime(n)) {
            n++;
        }
        return n;
    }
};

// Κλάση που υλοποιεί πίνακα κατακερματισμού με αλυσίδωση
class HashTableChaining {
private:
    vector<list<int>> table;
    int size;      // Αριθμός στοιχείων
    int capacity;  // Μέγεθος πίνακα
    UniversalHashFunction hash_function;
    
public:
    // Κατασκευαστής
    HashTableChaining(int max_key, int m) 
        : capacity(m), size(0), hash_function(max_key, m) {
        table.resize(capacity);
    }
    
    // Εισαγωγή στοιχείου
    void insert(int key) {
        int index = hash_function.hash(key);
        
        // Έλεγχος αν το κλειδί υπάρχει ήδη
        for (int value : table[index]) {
            if (value == key) {
                return; // Το κλειδί υπάρχει ήδη
            }
        }
        
        // Εισαγωγή του κλειδιού στη λίστα
        table[index].push_back(key);
        size++;
    }
    
    // Εμφάνιση του πίνακα
    void display() const {
        cout << "Πίνακας κατακερματισμού με αλυσίδωση (μέγεθος: " << capacity << ", στοιχεία: " << size << "):" << endl;
        for (int i = 0; i < capacity; i++) {
            cout << setw(2) << i << ": ";
            if (table[i].empty()) {
                cout << "<κενό>";
            } else {
                for (int key : table[i]) {
                    cout << key << " -> ";
                }
                cout << "null";
            }
            cout << endl;
        }
    }
    
    // Εμφάνιση των παραμέτρων της συνάρτησης κατακερματισμού
    void displayHashFunction() const {
        hash_function.displayParams();
    }
    
    // Υπολογισμός του μέσου μήκους αλυσίδας
    double getAverageChainLength() const {
        if (size == 0) return 0.0;
        
        int non_empty_buckets = 0;
        for (const auto& chain : table) {
            if (!chain.empty()) {
                non_empty_buckets++;
            }
        }
        
        if (non_empty_buckets == 0) return 0.0;
        return static_cast<double>(size) / non_empty_buckets;
    }
    
    // Υπολογισμός του μέγιστου μήκους αλυσίδας
    int getMaxChainLength() const {
        int max_length = 0;
        for (const auto& chain : table) {
            int length = chain.size();
            if (length > max_length) {
                max_length = length;
            }
        }
        return max_length;
    }
    
    // Υπολογισμός της τυπικής απόκλισης του μήκους αλυσίδας
    double getChainLengthStdDev() const {
        if (size == 0) return 0.0;
        
        double mean = getAverageChainLength();
        double sum_squared_diff = 0.0;
        int non_empty_buckets = 0;
        
        for (const auto& chain : table) {
            if (!chain.empty()) {
                non_empty_buckets++;
                double diff = chain.size() - mean;
                sum_squared_diff += diff * diff;
            }
        }
        
        if (non_empty_buckets <= 1) return 0.0;
        return sqrt(sum_squared_diff / non_empty_buckets);
    }
};

int main() {
    const int TABLE_SIZE = 13;
    const int MAX_KEY = 100;
    const int NUM_KEYS = 20;
    
    // Αρχικοποίηση της γεννήτριας τυχαίων αριθμών
    random_device rd;
    mt19937 gen(rd());
    uniform_int_distribution<int> dist(1, MAX_KEY);
    
    // Δημιουργία του πίνακα κατακερματισμού
    HashTableChaining hashTable(MAX_KEY, TABLE_SIZE);
    
    // Εμφάνιση των παραμέτρων της συνάρτησης κατακερματισμού
    hashTable.displayHashFunction();
    
    // Δημιουργία και εισαγωγή τυχαίων κλειδιών
    vector<int> keys;
    cout << "\nΔημιουργία " << NUM_KEYS << " τυχαίων κλειδιών:" << endl;
    for (int i = 0; i < NUM_KEYS; i++) {
        int key = dist(gen);
        keys.push_back(key);
        cout << key << " ";
        hashTable.insert(key);
    }
    cout << endl;
    
    // Εμφάνιση του πίνακα κατακερματισμού
    cout << endl;
    hashTable.display();
    
    // Υπολογισμός και εμφάνιση στατιστικών
    cout << "\nΣτατιστικά πίνακα:" << endl;
    cout << "Μέσο μήκος αλυσίδας: " << fixed << setprecision(2) << hashTable.getAverageChainLength() << endl;
    cout << "Μέγιστο μήκος αλυσίδας: " << hashTable.getMaxChainLength() << endl;
    cout << "Τυπική απόκλιση μήκους αλυσίδας: " << fixed << setprecision(2) << hashTable.getChainLengthStdDev() << endl;
    
    return 0;
}

### Ανάλυση αποτελεσμάτων Προβλήματος 2:

Σε αυτό το παράδειγμα, υλοποιήσαμε μια καθολική οικογένεια συναρτήσεων κατακερματισμού και την εφαρμόσαμε σε έναν πίνακα κατακερματισμού με αλυσίδωση. Τα αποτελέσματα από μια δοκιμαστική εκτέλεση έδειξαν:

1. Η συνάρτηση κατακερματισμού που επιλέχθηκε τυχαία είχε παραμέτρους a, b, p και m, με τη μορφή h(k) = ((a·k + b) mod p) mod m.

2. Εισάγαμε 20 τυχαία κλειδιά στο διάστημα [1, 100], αλλά επειδή κάποια κλειδιά μπορεί να εμφανίστηκαν περισσότερες από μία φορές, ο πίνακας περιέχει λιγότερα μοναδικά στοιχεία.

3. Το μέσο μήκος αλυσίδας ήταν κοντά στην αναμενόμενη τιμή για έναν πίνακα με παράγοντα φόρτωσης α = n/m, όπου n είναι ο αριθμός των μοναδικών στοιχείων και m είναι το μέγεθος του πίνακα.

4. Η τυπική απόκλιση του μήκους αλυσίδας ήταν μικρή, που δείχνει ότι η κατανομή ήταν σχετικά ομοιόμορφη.

Αυτά τα αποτελέσματα επιβεβαιώνουν την αποτελεσματικότητα της καθολικής οικογένειας συναρτήσεων κατακερματισμού στην επίτευξη καλής κατανομής των στοιχείων και στη μείωση των συγκρούσεων.

Η καθολική οικογένεια κατακερματισμού έχει την ιδιότητα ότι για δύο οποιαδήποτε διαφορετικά κλειδιά, η πιθανότητα σύγκρουσης είναι ≤ 1/m, που είναι η βέλτιστη δυνατή.

## Πρόβλημα 3: Υλοποίηση Κατακερματισμού Κούκου (Cuckoo Hashing)

### Εκφώνηση:
Υλοποιήστε τον αλγόριθμο κατακερματισμού κούκου (cuckoo hashing) όπως περιγράφεται στις σημειώσεις. Χρησιμοποιήστε δύο πίνακες μεγέθους m = 11 και δύο συναρτήσεις κατακερματισμού h₁(k) = k mod m και h₂(k) = (k/m) mod m. Εισάγετε τα κλειδιά 23, 45, 67, 89, 11, 33, 55, 77, 99 και μετά την εισαγωγή δοκιμάστε να αναζητήσετε τα κλειδιά 45, 78 και 99. Μετρήστε τον αριθμό των βημάτων ανακατατάξεων (relocations) κατά την εισαγωγή και τον αριθμό των αναζητήσεων για κάθε αναζήτηση.

In [None]:
#include <iostream>
#include <vector>
#include <iomanip>
#include <optional>
using namespace std;

// Κλάση που υλοποιεί τον αλγόριθμο κατακερματισμού κούκου
class CuckooHashTable {
private:
    vector<optional<int>> table1;
    vector<optional<int>> table2;
    int size;      // Αριθμός στοιχείων
    int capacity;  // Μέγεθος πίνακα
    int max_relocations; // Μέγιστος αριθμός ανακατατάξεων πριν το rehashing
    
    // Συναρτήσεις κατακερματισμού
    int h1(int key) const {
        return key % capacity;
    }
    
    int h2(int key) const {
        return (key / capacity) % capacity;
    }
    
    // Ανακατακερματισμός (rehashing) - εδώ απλά θα εμφανίσουμε μήνυμα
    // καθώς η πλήρης υλοποίηση θα απαιτούσε νέες συναρτήσεις κατακερματισμού
    void rehash() {
        cout << "Ανακατακερματισμός (rehashing) απαιτείται!" << endl;
        cout << "Σε μια πλήρη υλοποίηση, θα επιλέγαμε νέες συναρτήσεις κατακερματισμού." << endl;
    }
    
public:
    // Κατασκευαστής
    CuckooHashTable(int m) : capacity(m), size(0), max_relocations(2 * m) {
        table1.resize(capacity);
        table2.resize(capacity);
    }
    
    // Εισαγωγή στοιχείου
    bool insert(int key, bool is_rehashing = false) {
        // Έλεγχος αν το κλειδί υπάρχει ήδη
        if (contains(key)) {
            return true;
        }
        
        // Αποθήκευση του αρχικού κλειδιού για ανίχνευση κύκλων
        int original_key = key;
        
        // Μετρητής ανακατατάξεων
        int relocations = 0;
        int relocations_count = 0; // Για στατιστικά
        
        // Προσπάθεια εισαγωγής με πιθανές ανακατατάξεις
        while (relocations < max_relocations) {
            // Προσπάθεια εισαγωγής στον πρώτο πίνακα
            int pos1 = h1(key);
            if (!table1[pos1].has_value()) {
                table1[pos1] = key;
                size++;
                cout << "Εισαγωγή κλειδιού " << key << " στον πίνακα 1, θέση " << pos1;
                if (relocations_count > 0) {
                    cout << " (μετά από " << relocations_count << " ανακατατάξεις)";
                }
                cout << endl;
                return true;
            }
            
            // Ανταλλαγή με το στοιχείο στον πρώτο πίνακα
            int temp = table1[pos1].value();
            table1[pos1] = key;
            key = temp;
            relocations++;
            relocations_count++;
            
            cout << "Ανακατάταξη: το κλειδί " << key << " εκτοπίζεται από τον πίνακα 1, θέση " << pos1 << endl;
            
            // Έλεγχος για κύκλο (επιστροφή στο αρχικό κλειδί)
            if (key == original_key && !is_rehashing) {
                // Σε περίπτωση κύκλου, κάνουμε rehashing
                cout << "Ανιχνεύθηκε κύκλος - το κλειδί " << key << " επέστρεψε στην αρχική του θέση." << endl;
                rehash();
                return false;
            }
            
            // Προσπάθεια εισαγωγής στον δεύτερο πίνακα
            int pos2 = h2(key);
            if (!table2[pos2].has_value()) {
                table2[pos2] = key;
                size++;
                cout << "Εισαγωγή κλειδιού " << key << " στον πίνακα 2, θέση " << pos2;
                if (relocations_count > 0) {
                    cout << " (μετά από " << relocations_count << " ανακατατάξεις)";
                }
                cout << endl;
                return true;
            }
            
            // Ανταλλαγή με το στοιχείο στον δεύτερο πίνακα
            temp = table2[pos2].value();
            table2[pos2] = key;
            key = temp;
            relocations++;
            relocations_count++;
            
            cout << "Ανακατάταξη: το κλειδί " << key << " εκτοπίζεται από τον πίνακα 2, θέση " << pos2 << endl;
            
            // Έλεγχος για κύκλο (επιστροφή στο αρχικό κλειδί)
            if (key == original_key && !is_rehashing) {
                // Σε περίπτωση κύκλου, κάνουμε rehashing
                cout << "Ανιχνεύθηκε κύκλος - το κλειδί " << key << " επέστρεψε στην αρχική του θέση." << endl;
                rehash();
                return false;
            }
        }
        
        // Αν φτάσουμε εδώ, έχουμε υπερβεί το μέγιστο αριθμό ανακατατάξεων
        if (!is_rehashing) {
            cout << "Υπέρβαση μέγιστου αριθμού ανακατατάξεων για το κλειδί " << key << "." << endl;
            rehash();
        }
        return false;
    }
    
    // Αναζήτηση στοιχείου
    bool contains(int key) const {
        int lookups = 0;
        
        // Έλεγχος στον πρώτο πίνακα
        int pos1 = h1(key);
        lookups++;
        if (table1[pos1].has_value() && table1[pos1].value() == key) {
            cout << "Το κλειδί " << key << " βρέθηκε στον πίνακα 1, θέση " << pos1 << " (αναζητήσεις: " << lookups << ")" << endl;
            return true;
        }
        
        // Έλεγχος στον δεύτερο πίνακα
        int pos2 = h2(key);
        lookups++;
        if (table2[pos2].has_value() && table2[pos2].value() == key) {
            cout << "Το κλειδί " << key << " βρέθηκε στον πίνακα 2, θέση " << pos2 << " (αναζητήσεις: " << lookups << ")" << endl;
            return true;
        }
        
        // Το κλειδί δεν βρέθηκε
        cout << "Το κλειδί " << key << " δεν βρέθηκε (αναζητήσεις: " << lookups << ")" << endl;
        return false;
    }
    
    // Εμφάνιση των πινάκων
    void display() const {
        cout << "\nΠίνακες κατακερματισμού κούκου (μέγεθος: " << capacity << ", στοιχεία: " << size << "):" << endl;
        
        // Επικεφαλίδα
        cout << setw(5) << "Θέση" << " | " << setw(7) << "Πίνακας 1" << " | " << setw(7) << "Πίνακας 2" << endl;
        cout << string(23, '-') << endl;
        
        // Περιεχόμενα των πινάκων
        for (int i = 0; i < capacity; i++) {
            cout << setw(5) << i << " | ";
            
            if (table1[i].has_value()) {
                cout << setw(7) << table1[i].value();
            } else {
                cout << setw(7) << "<κενό>";
            }
            
            cout << " | ";
            
            if (table2[i].has_value()) {
                cout << setw(7) << table2[i].value();
            } else {
                cout << setw(7) << "<κενό>";
            }
            
            cout << endl;
        }
    }
};

int main() {
    const int TABLE_SIZE = 11;
    
    // Δημιουργία πίνακα κατακερματισμού κούκου
    CuckooHashTable hashTable(TABLE_SIZE);
    
    // Κλειδιά προς εισαγωγή
    vector<int> keys = {23, 45, 67, 89, 11, 33, 55, 77, 99};
    
    cout << "=== Εισαγωγή κλειδιών ===" << endl;
    for (int key : keys) {
        hashTable.insert(key);
    }
    
    // Εμφάνιση των πινάκων
    hashTable.display();
    
    cout << "\n=== Αναζήτηση κλειδιών ===" << endl;
    hashTable.contains(45);  // Υπάρχει
    hashTable.contains(78);  // Δεν υπάρχει
    hashTable.contains(99);  // Υπάρχει
    
    return 0;
}

### Ανάλυση αποτελεσμάτων Προβλήματος 3:

Σε αυτό το παράδειγμα, υλοποιήσαμε τον αλγόριθμο κατακερματισμού κούκου με δύο πίνακες και δύο συναρτήσεις κατακερματισμού. Τα αποτελέσματα δείχνουν:

1. **Εισαγωγή:** Οι περισσότερες εισαγωγές απαίτησαν μία ή περισσότερες ανακατατάξεις (το κλειδί που εκτόπισε το προηγούμενο κλειδί από τη θέση του στον πρώτο ή δεύτερο πίνακα). Το πρώτο κλειδί τοποθετήθηκε αρχικά στον πρώτο πίνακα και μετά εκτοπίστηκε από τα επόμενα κλειδιά.

2. **Αναζήτηση:** Όπως αναμενόταν, ο αλγόριθμος κατακερματισμού κούκου απαιτεί το πολύ 2 αναζητήσεις για να βρει ένα κλειδί ή να επιβεβαιώσει ότι δεν υπάρχει. 
   - Για το κλειδί 45, χρειάστηκαν 2 αναζητήσεις
   - Για το κλειδί 78, χρειάστηκαν 2 αναζητήσεις για να επιβεβαιωθεί η απουσία του
   - Για το κλειδί 99, χρειάστηκε μόνο 1 αναζήτηση καθώς βρέθηκε στον πρώτο πίνακα

3. **Κατανομή:** Στο τέλος, τα κλειδιά κατανεμήθηκαν μεταξύ των δύο πινάκων, με κάποια στον πρώτο πίνακα και άλλα στον δεύτερο. Αυτό οφείλεται στη συγκεκριμένη ακολουθία εισαγωγών και στις συναρτήσεις κατακερματισμού που χρησιμοποιήθηκαν.

Ο κατακερματισμός κούκου προσφέρει εγγυημένα σταθερό χρόνο αναζήτησης (O(1)) με το κόστος πιο περίπλοκης διαδικασίας εισαγωγής και πιθανής ανάγκης για ανακατακερματισμό όταν προκύπτουν κύκλοι. Αυτή η μέθοδος είναι ιδιαίτερα χρήσιμη σε εφαρμογές όπου ο χρόνος αναζήτησης είναι κρίσιμος.

## Συμπεράσματα

Σε αυτά τα τρία προβλήματα, εξετάσαμε διαφορετικές τεχνικές κατακερματισμού που καλύπτουν τις βασικές έννοιες του αντικειμένου:

1. **Ανοιχτή διευθυνσιοδότηση**: Συγκρίναμε τρεις μεθόδους διερεύνησης (γραμμική, τετραγωνική, διπλό κατακερματισμό) και είδαμε πώς επηρεάζουν την κατανομή των κλειδιών και τον αριθμό των συγκρούσεων.

2. **Καθολικός κατακερματισμός**: Υλοποιήσαμε μια καθολική οικογένεια συναρτήσεων κατακερματισμού και αναλύσαμε την αποτελεσματικότητά της στην επίτευξη ομοιόμορφης κατανομής.

3. **Κατακερματισμός κούκου**: Εξετάσαμε μια πιο προηγμένη τεχνική που εγγυάται σταθερό χρόνο αναζήτησης, με το κόστος πιο περίπλοκης διαδικασίας εισαγωγής.

Κάθε μέθοδος έχει τα πλεονεκτήματα και τις αδυναμίες της:

- Η **ανοιχτή διευθυνσιοδότηση** είναι απλή στην υλοποίηση αλλά μπορεί να οδηγήσει σε συσσώρευση (clustering).
- Ο **καθολικός κατακερματισμός** παρέχει θεωρητικές εγγυήσεις για την κατανομή των κλειδιών αλλά απαιτεί επιπλέον υπολογισμούς.
- Ο **κατακερματισμός κούκου** προσφέρει σταθερό χρόνο αναζήτησης αλλά έχει πιο περίπλοκη διαδικασία εισαγωγής.

Η επιλογή της κατάλληλης μεθόδου κατακερματισμού εξαρτάται από τις συγκεκριμένες απαιτήσεις της εφαρμογής, όπως τη συχνότητα των λειτουργιών αναζήτησης, εισαγωγής και διαγραφής, καθώς και τους περιορισμούς μνήμης και το μέγεθος των δεδομένων.

## Βιβλιογραφία

1. Thomas Cormen, Charles Leiserson, Ronald Rivest, and Cliff Stein, "Introduction to Algorithms", 3rd edition, MIT Press, 2009.

2. Donald E. Knuth, "The Art of Computer Programming: Volume 3: Sorting and Searching", 2nd edition, Addison-Wesley, 1998.

3. Pagh, R., Rodler, F.F.: Cuckoo hashing. J. Algorithms 51, pp. 122-–144 (2004).

4. Larry Carter and Mark N. Wegman: Universal Classes of Hash Functions, J. Comput. Syst. Sci. 18(2), pp. 143–154, (1979).

5. Σημειώσεις μαθήματος "Εισαγωγή στον αντικειμενοστρεφή προγραμματισμό και τις δομές δεδομένων με C++", Στάθης Ζάχος, Άρης Παγουρτζής, ΕΜΠ, 2024.