In [1]:
import sys
import os
import time


try:
    # Якщо __file__ існує (запуск з файлу)
    lib_path = os.path.abspath(os.path.join(os.path.dirname(__file__), '..', 'lib'))
except NameError:
    # Якщо __file__ немає (наприклад, Jupyter)
    lib_path = os.path.abspath(os.path.join(os.getcwd(), '..', 'lib'))

sys.path.insert(0, lib_path)

from Apriori import AprioriAlgorithm
from FPGrowth import FPGrowthAlgorithm
from RuleGenerator import RulesGenerator

In [2]:
def create_sample_data():
    """Створює приклад даних для тестування"""
    transactions = [
        ['хліб', 'молоко'],
        ['хліб', 'підгузники', 'пиво', 'яйця'],
        ['молоко', 'підгузники', 'пиво', 'кола'],
        ['хліб', 'молоко', 'підгузники', 'пиво'],
        ['хліб', 'молоко', 'підгузники', 'кола'],
        ['молоко', 'підгузники', 'пиво'],
        ['хліб', 'молоко'],
        ['хліб', 'підгузники', 'пиво'],
        ['хліб', 'молоко', 'кола'],
        ['молоко', 'підгузники', 'кола']
    ]
    return transactions

In [3]:
def demo_apriori():
    """Демонстрація роботи алгоритму Apriori"""
    print("=" * 60)
    print("ДЕМОНСТРАЦІЯ АЛГОРИТМУ APRIORI")
    print("=" * 60)
    
    # Створюємо дані
    transactions = create_sample_data()
    print(f"Кількість транзакцій: {len(transactions)}")
    print("Приклад транзакцій:")
    for i, transaction in enumerate(transactions[:3]):
        print(f"  {i+1}: {transaction}")
    print("  ...")
    print()
    
    # Застосовуємо алгоритм Apriori
    apriori = AprioriAlgorithm(min_support=0.3)
    frequent_itemsets = apriori.fit(transactions)
    
    print("ЧАСТІ НАБОРИ ЕЛЕМЕНТІВ:")
    for k, itemsets in frequent_itemsets.items():
        print(f"\n{k}-елементні набори:")
        for itemset, count in itemsets.items():
            support = count / len(transactions)
            items_str = ', '.join(sorted(itemset))
            print(f"  {{{items_str}}}: підтримка = {support:.3f} (кількість = {count})")
    
    # Генеруємо правила
    print("\n" + "=" * 60)
    print("АСОЦІАТИВНІ ПРАВИЛА (APRIORI)")
    print("=" * 60)
    
    rules_gen = RulesGenerator(min_confidence=0.6)
    rules = rules_gen.generate_rules(apriori)
    
    if rules:
        rules_gen.print_rules(top_n=10)
    else:
        print("Не знайдено правил з заданими параметрами")
    
    return apriori, rules

In [4]:
def demo_fp_growth():
    """Демонстрація роботи алгоритму FP-Growth"""
    print("\n" + "=" * 60)
    print("ДЕМОНСТРАЦІЯ АЛГОРИТМУ FP-GROWTH")
    print("=" * 60)
    
    # Створюємо дані
    transactions = create_sample_data()
    
    # Застосовуємо алгоритм FP-Growth
    fp_growth = FPGrowthAlgorithm(min_support=0.3)
    frequent_itemsets = fp_growth.fit(transactions)
    
    print("ЧАСТІ НАБОРИ ЕЛЕМЕНТІВ:")
    for k, itemsets in frequent_itemsets.items():
        print(f"\n{k}-елементні набори:")
        for itemset, count in itemsets.items():
            support = count / len(transactions)
            items_str = ', '.join(sorted(itemset))
            print(f"  {{{items_str}}}: підтримка = {support:.3f} (кількість = {count})")
    
    # Генеруємо правила
    print("\n" + "=" * 60)
    print("АСОЦІАТИВНІ ПРАВИЛА (FP-GROWTH)")
    print("=" * 60)
    
    rules_gen = RulesGenerator(min_confidence=0.6)
    rules = rules_gen.generate_rules(fp_growth)
    
    if rules:
        rules_gen.print_rules(top_n=10)
    else:
        print("Не знайдено правил з заданими параметрами")
    
    return fp_growth, rules

In [5]:
def compare_algorithms():
    """Порівняння результатів двох алгоритмів"""
    print("\n" + "=" * 60)
    print("ПОРІВНЯННЯ АЛГОРИТМІВ")
    print("=" * 60)
    
    transactions = create_sample_data()
    
    # Apriori
    apriori = AprioriAlgorithm(min_support=0.3)
    apriori_itemsets = apriori.fit(transactions)
    
    # FP-Growth
    fp_growth = FPGrowthAlgorithm(min_support=0.3)
    fp_growth_itemsets = fp_growth.fit(transactions)
    
    print("Кількість знайдених частих наборів:")
    
    for k in range(1, max(max(apriori_itemsets.keys()), max(fp_growth_itemsets.keys())) + 1):
        apriori_count = len(apriori_itemsets.get(k, {}))
        fp_growth_count = len(fp_growth_itemsets.get(k, {}))
        print(f"  {k}-елементні: Apriori = {apriori_count}, FP-Growth = {fp_growth_count}")
    
    # Перевіряємо, чи результати однакові
    all_apriori = set()
    for itemsets in apriori_itemsets.values():
        all_apriori.update(itemsets.keys())
    
    all_fp_growth = set()
    for itemsets in fp_growth_itemsets.values():
        all_fp_growth.update(itemsets.keys())
    
    if all_apriori == all_fp_growth:
        print("\n✓ Результати обох алгоритмів однакові!")
    else:
        print("\n✗ Результати алгоритмів відрізняються")
        print(f"Тільки в Apriori: {all_apriori - all_fp_growth}")
        print(f"Тільки в FP-Growth: {all_fp_growth - all_apriori}")

In [6]:
demo_apriori()

ДЕМОНСТРАЦІЯ АЛГОРИТМУ APRIORI
Кількість транзакцій: 10
Приклад транзакцій:
  1: ['хліб', 'молоко']
  2: ['хліб', 'підгузники', 'пиво', 'яйця']
  3: ['молоко', 'підгузники', 'пиво', 'кола']
  ...

ЧАСТІ НАБОРИ ЕЛЕМЕНТІВ:

1-елементні набори:
  {хліб}: підтримка = 0.700 (кількість = 7)
  {молоко}: підтримка = 0.800 (кількість = 8)
  {пиво}: підтримка = 0.500 (кількість = 5)
  {підгузники}: підтримка = 0.700 (кількість = 7)
  {кола}: підтримка = 0.400 (кількість = 4)

2-елементні набори:
  {пиво, підгузники}: підтримка = 0.500 (кількість = 5)
  {пиво, хліб}: підтримка = 0.300 (кількість = 3)
  {кола, молоко}: підтримка = 0.400 (кількість = 4)
  {молоко, підгузники}: підтримка = 0.500 (кількість = 5)
  {молоко, пиво}: підтримка = 0.300 (кількість = 3)
  {підгузники, хліб}: підтримка = 0.400 (кількість = 4)
  {кола, підгузники}: підтримка = 0.300 (кількість = 3)
  {молоко, хліб}: підтримка = 0.500 (кількість = 5)

3-елементні набори:
  {молоко, пиво, підгузники}: підтримка = 0.300 (кількіс

(<Apriori.AprioriAlgorithm at 0x29f2fbc81a0>,
 [{пиво} => {підгузники},
  {кола} => {молоко},
  {молоко, пиво} => {підгузники},
  {кола, підгузники} => {молоко},
  {пиво, хліб} => {підгузники},
  {кола} => {підгузники},
  {кола} => {молоко, підгузники},
  {кола, молоко} => {підгузники},
  {підгузники, хліб} => {пиво},
  {підгузники} => {пиво},
  {підгузники} => {молоко},
  {хліб} => {молоко},
  {молоко} => {підгузники},
  {молоко} => {хліб},
  {пиво} => {хліб},
  {пиво} => {молоко},
  {пиво} => {молоко, підгузники},
  {пиво, підгузники} => {молоко},
  {молоко, підгузники} => {пиво},
  {молоко, підгузники} => {кола},
  {пиво} => {підгузники, хліб},
  {пиво, підгузники} => {хліб}])

In [7]:
demo_fp_growth()


ДЕМОНСТРАЦІЯ АЛГОРИТМУ FP-GROWTH
ЧАСТІ НАБОРИ ЕЛЕМЕНТІВ:

1-елементні набори:
  {кола}: підтримка = 0.400 (кількість = 4)
  {пиво}: підтримка = 0.500 (кількість = 5)
  {хліб}: підтримка = 0.700 (кількість = 7)
  {підгузники}: підтримка = 0.700 (кількість = 7)
  {молоко}: підтримка = 0.800 (кількість = 8)

2-елементні набори:
  {кола, підгузники}: підтримка = 0.300 (кількість = 3)
  {кола, молоко}: підтримка = 0.400 (кількість = 4)
  {пиво, хліб}: підтримка = 0.300 (кількість = 3)
  {молоко, пиво}: підтримка = 0.300 (кількість = 3)
  {пиво, підгузники}: підтримка = 0.500 (кількість = 5)
  {молоко, хліб}: підтримка = 0.500 (кількість = 5)
  {підгузники, хліб}: підтримка = 0.400 (кількість = 4)
  {молоко, підгузники}: підтримка = 0.500 (кількість = 5)

3-елементні набори:
  {кола, молоко, підгузники}: підтримка = 0.300 (кількість = 3)
  {пиво, підгузники, хліб}: підтримка = 0.300 (кількість = 3)
  {молоко, пиво, підгузники}: підтримка = 0.300 (кількість = 3)

АСОЦІАТИВНІ ПРАВИЛА (FP-GROW

(<FPGrowth.FPGrowthAlgorithm at 0x29f2fd38ad0>,
 [{кола} => {молоко},
  {пиво} => {підгузники},
  {кола, підгузники} => {молоко},
  {пиво, хліб} => {підгузники},
  {молоко, пиво} => {підгузники},
  {кола} => {підгузники},
  {кола} => {молоко, підгузники},
  {кола, молоко} => {підгузники},
  {підгузники, хліб} => {пиво},
  {підгузники} => {пиво},
  {хліб} => {молоко},
  {підгузники} => {молоко},
  {молоко} => {хліб},
  {молоко} => {підгузники},
  {пиво} => {хліб},
  {пиво} => {молоко},
  {молоко, підгузники} => {кола},
  {пиво} => {підгузники, хліб},
  {пиво, підгузники} => {хліб},
  {пиво} => {молоко, підгузники},
  {пиво, підгузники} => {молоко},
  {молоко, підгузники} => {пиво}])

In [8]:
compare_algorithms()


ПОРІВНЯННЯ АЛГОРИТМІВ
Кількість знайдених частих наборів:
  1-елементні: Apriori = 5, FP-Growth = 5
  2-елементні: Apriori = 8, FP-Growth = 8
  3-елементні: Apriori = 3, FP-Growth = 3

✓ Результати обох алгоритмів однакові!


In [14]:
from mlxtend.frequent_patterns import apriori
import pandas as pd

transactions = []
with open(r'..\\res\groceries.csv', 'r', encoding='utf-8') as f:
    for line in f:
        transaction = line.strip().split(',')
        transactions.append(transaction)


min_support = 0.01

start = time.time()
# --- Запуск мого AprioriAlgorithm ---
apriori_custom = AprioriAlgorithm(min_support=min_support)
freq_itemsets_custom = apriori_custom.fit(transactions)

# Обчислимо підтримку (відносну) для кожного набору
n_trans = len(transactions)
custom_supports = {
    itemset: count / n_trans
    for k, itemsets in freq_itemsets_custom.items()
    for itemset, count in itemsets.items()
}
end = time.time()
print(f"Час виконання мого AprioriAlgorithm: {end - start:.4f} секунд")

# --- Підготовка даних для mlxtend ---
all_items = sorted({item for transaction in transactions for item in transaction})
encoded_vals = []
for transaction in transactions:
    encoded_vals.append({item: (item in transaction) for item in all_items})
df = pd.DataFrame(encoded_vals)

start = time.time()
# --- Запуск mlxtend apriori ---
freq_itemsets_mlxtend = apriori(df, min_support=min_support, use_colnames=True)
mlxtend_supports = {
    frozenset(row['itemsets']): row['support']
    for _, row in freq_itemsets_mlxtend.iterrows()
}
end = time.time()
print(f"Час виконання mlxtend apriori: {end - start:.4f} секунд")

# --- Порівняння результатів ---
print("Порівняння частих наборів і підтримки:\n")

all_itemsets = set(custom_supports.keys()) | set(mlxtend_supports.keys())

for itemset in sorted(all_itemsets, key=lambda x: (len(x), sorted(x))):
    support_custom = custom_supports.get(itemset, None)
    support_mlxtend = mlxtend_supports.get(itemset, None)
    
    if support_custom is None:
        print(f"{set(itemset)}: Відсутній у власному Apriori, mlxtend: {support_mlxtend:.2f}")
    elif support_mlxtend is None:
        print(f"{set(itemset)}: Є у моєму Apriori: {support_custom:.2f}, відсутній у mlxtend")
    else:
        diff = abs(support_custom - support_mlxtend)
        status = "OK" if diff < 1e-6 else f"Відмінність {diff:.4f}"
        print(f"{set(itemset)}: Твій: {support_custom:.2f}, mlxtend: {support_mlxtend:.2f} -> {status}")

Час виконання мого AprioriAlgorithm: 1.0169 секунд
Час виконання mlxtend apriori: 0.0624 секунд
Порівняння частих наборів і підтримки:

{'UHT-milk'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'baking powder'}: Твій: 0.02, mlxtend: 0.02 -> OK
{'beef'}: Твій: 0.05, mlxtend: 0.05 -> OK
{'berries'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'beverages'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'bottled beer'}: Твій: 0.08, mlxtend: 0.08 -> OK
{'bottled water'}: Твій: 0.11, mlxtend: 0.11 -> OK
{'brown bread'}: Твій: 0.06, mlxtend: 0.06 -> OK
{'butter'}: Твій: 0.06, mlxtend: 0.06 -> OK
{'butter milk'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'cake bar'}: Твій: 0.01, mlxtend: 0.01 -> OK
{'candy'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'canned beer'}: Твій: 0.08, mlxtend: 0.08 -> OK
{'canned fish'}: Твій: 0.02, mlxtend: 0.02 -> OK
{'canned vegetables'}: Твій: 0.01, mlxtend: 0.01 -> OK
{'cat food'}: Твій: 0.02, mlxtend: 0.02 -> OK
{'chewing gum'}: Твій: 0.02, mlxtend: 0.02 -> OK
{'chicken'}: Твій: 0.04, mlxtend: 0.04 -> OK
{'chocol

In [16]:
from mlxtend.frequent_patterns import fpgrowth
import pandas as pd

transactions = []
with open(r'..\\res\groceries.csv', 'r', encoding='utf-8') as f:
    for line in f:
        transaction = line.strip().split(',')
        transactions.append(transaction)


min_support = 0.01
n_trans = len(transactions)

start = time.time()
# --- Запуск моєї реалізації FP-Growth ---
fp_custom = FPGrowthAlgorithm(min_support=min_support)
freq_itemsets_custom = fp_custom.fit(transactions)

# Обчислимо підтримку (відносну) для кожного набору
custom_supports = {
    itemset: count / n_trans
    for k, itemsets in freq_itemsets_custom.items()
    for itemset, count in itemsets.items()
}
end = time.time()
print(f"Час виконання мого FP-Growth: {end - start:.4f} секунд")

# --- Підготовка даних для mlxtend ---
all_items = sorted({item for transaction in transactions for item in transaction})
encoded_vals = []
for transaction in transactions:
    encoded_vals.append({item: item in transaction for item in all_items})
df = pd.DataFrame(encoded_vals)

start = time.time()
# --- Запуск mlxtend fpgrowth ---
freq_itemsets_mlxtend = fpgrowth(df, min_support=min_support, use_colnames=True)
mlxtend_supports = {
    frozenset(row['itemsets']): row['support']
    for _, row in freq_itemsets_mlxtend.iterrows()
}
end = time.time()
print(f"Час виконання mlxtend fpgrowth: {end - start:.4f} секунд")

# --- Порівняння результатів ---
print("\nПорівняння частих наборів і підтримки:\n")

all_itemsets = set(custom_supports.keys()) | set(mlxtend_supports.keys())

for itemset in sorted(all_itemsets, key=lambda x: (len(x), sorted(x))):
    support_custom = custom_supports.get(itemset, None)
    support_mlxtend = mlxtend_supports.get(itemset, None)

    if support_custom is None:
        print(f"{set(itemset)}: Відсутній у моєї реалізації, mlxtend: {support_mlxtend:.2f}")
    elif support_mlxtend is None:
        print(f"{set(itemset)}: Є у моїй реалізації: {support_custom:.2f}, відсутній у mlxtend")
    else:
        diff = abs(support_custom - support_mlxtend)
        status = "OK" if diff < 1e-6 else f"Відмінність {diff:.4f}"
        print(f"{set(itemset)}: Твій: {support_custom:.2f}, mlxtend: {support_mlxtend:.2f} -> {status}")


Час виконання мого FP-Growth: 0.0966 секунд
Час виконання mlxtend fpgrowth: 2.4264 секунд

Порівняння частих наборів і підтримки:

{'UHT-milk'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'baking powder'}: Твій: 0.02, mlxtend: 0.02 -> OK
{'beef'}: Твій: 0.05, mlxtend: 0.05 -> OK
{'berries'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'beverages'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'bottled beer'}: Твій: 0.08, mlxtend: 0.08 -> OK
{'bottled water'}: Твій: 0.11, mlxtend: 0.11 -> OK
{'brown bread'}: Твій: 0.06, mlxtend: 0.06 -> OK
{'butter'}: Твій: 0.06, mlxtend: 0.06 -> OK
{'butter milk'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'cake bar'}: Твій: 0.01, mlxtend: 0.01 -> OK
{'candy'}: Твій: 0.03, mlxtend: 0.03 -> OK
{'canned beer'}: Твій: 0.08, mlxtend: 0.08 -> OK
{'canned fish'}: Твій: 0.02, mlxtend: 0.02 -> OK
{'canned vegetables'}: Твій: 0.01, mlxtend: 0.01 -> OK
{'cat food'}: Твій: 0.02, mlxtend: 0.02 -> OK
{'chewing gum'}: Твій: 0.02, mlxtend: 0.02 -> OK
{'chicken'}: Твій: 0.04, mlxtend: 0.04 -> OK
{'chocolate'}