<a href="https://colab.research.google.com/github/juhumkwon/Defense_Cloud/blob/main/6_2_fp_growth.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
from mlxtend.frequent_patterns import fpgrowth, association_rules
from mlxtend.preprocessing import TransactionEncoder
import pandas as pd

# 거래 데이터
transactions = [
    ['우유', '빵', '버터'],
    ['빵', '버터'],
    ['우유', '빵'],
    ['버터']
]

# 원-핫 인코딩
te = TransactionEncoder()
te_array = te.fit(transactions).transform(transactions)
df = pd.DataFrame(te_array, columns=te.columns_)

# FP-Growth 알고리즘으로 빈발 항목 집합 계산
frequent_itemsets = fpgrowth(df, min_support=0.5, use_colnames=True)

# 연관 규칙 생성
# The num_itemsets argument is added here, calculated as the length of the frequent_itemsets DataFrame
"""
Lift > 1: A와 B는 양의 상관관계 (함께 살 가능성이 높음)
Lift = 1: 독립
Lift < 1: 음의 상관관계 (A 사면 B를 덜 살 가능성)

min_threshold=1
Lift 값이 1 이상인 규칙만 가져오겠다는 뜻.
즉, 통계적으로 의미 있는 규칙들만 남김.
"""
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1, num_itemsets=len(frequent_itemsets))


# 결과 출력
"""
print("Frequent Itemsets:\n", frequent_itemsets)
print("\nAssociation Rules:\n", rules)
"""
print("One-Hot Encoded 거래 데이터:")
print(df)
print("\n빈발 항목 집합:")
print(frequent_itemsets)
print("\n연관 규칙:")
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']])



One-Hot Encoded 거래 데이터:
      버터      빵     우유
0   True   True   True
1   True   True  False
2  False   True   True
3   True  False  False

빈발 항목 집합:
   support itemsets
0     0.75      (빵)
1     0.75     (버터)
2     0.50     (우유)
3     0.50  (버터, 빵)
4     0.50  (빵, 우유)

연관 규칙:
  antecedents consequents  support  confidence      lift
0         (빵)        (우유)      0.5    0.666667  1.333333
1        (우유)         (빵)      0.5    1.000000  1.333333
