In [1]:
import sys
import os

In [2]:
module_path = os.path.abspath(os.path.join('..'))
if module_path not in sys.path:
    sys.path.append(module_path)

from src.eclat import Eclat

# --- Wczytanie danych (kopiujemy kod z notatnika EDA) ---
data_path = '../data/retail.dat'
transactions = []
with open(data_path, 'r') as f:
    for line in f:
        transactions.append(line.strip().split())

# --- Testowanie naszej implementacji ---
# Ustawmy min_support na 1%
min_support_value = 0.01

# Tworzymy instancję naszej klasy
eclat_classic = Eclat(min_support=min_support_value, use_negation=False)

# Uruchamiamy metodę fit, która na razie powinna tylko zbudować TID-listy
eclat_classic.fit(transactions)

# Sprawdźmy, co jest w środku (do celów deweloperskich)
print("\n--- Próbka TID-list ---")
# Wyświetlmy 5 pierwszych par (item, tid_list_length)
for i, (item, tids) in enumerate(eclat_classic.tid_lists.items()):
    if i >= 5:
        break
    print(f"Item: {item}, Liczba transakcji: {len(tids)}")

print("\n--- Próbka częstych zbiorów (pojedynczych) ---")
print(dict(list(eclat_classic.frequent_itemsets.items())[:5]))

Zbudowano początkowe TID-listy. Liczba częstych pojedynczych itemów: 70
Algorytm Eclat zakończył działanie.

--- Próbka TID-list ---
Item: 9, Liczba transakcji: 1372
Item: 19, Liczba transakcji: 1005
Item: 31, Liczba transakcji: 920
Item: 32, Liczba transakcji: 15167
Item: 36, Liczba transakcji: 2936

--- Próbka częstych zbiorów (pojedynczych) ---
{frozenset({'9'}): 1372, frozenset({'19'}): 1005, frozenset({'31'}): 920, frozenset({'32'}): 15167, frozenset({'36'}): 2936}


In [4]:
# --- Testowanie pełnej implementacji ---
min_support_value = 0.05 # 5%

eclat_classic = Eclat(min_support=min_support_value, use_negation=False)
eclat_classic.fit(transactions)

# Sprawdźmy, ile wszystkich częstych zbiorów znaleziono
all_frequent = eclat_classic.transform()
print(f"\nZnaleziono łącznie {len(all_frequent)} częstych zbiorów.")

# Wyświetlmy kilka przykładowych zbiorów o rozmiarze > 1
frequent_larger_than_1 = {
    itemset: count 
    for itemset, count in all_frequent.items() 
    if len(itemset) > 1
}

print("\n--- Próbka częstych zbiorów o rozmiarze > 1 ---")
print(dict(list(frequent_larger_than_1.items())[:10]))

Zbudowano początkowe TID-listy. Liczba częstych pojedynczych itemów: 6
Algorytm Eclat zakończył działanie.

Znaleziono łącznie 16 częstych zbiorów.

--- Próbka częstych zbiorów o rozmiarze > 1 ---
{frozenset({'39', '32'}): 8455, frozenset({'48', '32'}): 8034, frozenset({'38', '39'}): 10345, frozenset({'38', '48'}): 7944, frozenset({'39', '41'}): 11414, frozenset({'39', '48'}): 29142, frozenset({'48', '41'}): 9018, frozenset({'39', '48', '32'}): 5402, frozenset({'38', '39', '48'}): 6102, frozenset({'39', '48', '41'}): 7366}
