In [1]:
import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules

# Carregar os dados
df = pd.read_csv('creditcard.csv')

# Pré-processamento dos dados
# Vamos considerar apenas as transações com valores positivos e negativos
# (ou seja, vamos considerar apenas as transações que foram feitas e não as que foram rejeitadas)
# e vamos transformar o valor da coluna
# 'Amount' em binário (1 para valores positivos e 0 para valores negativos).
df['Amount'] = df['Amount'].apply(lambda x: 1 if x > 0 else 0)

# Vamos usar apenas uma pequena amostra de dados para simplificação, uma vez que o conjunto de dados é grande.
df_sample = df.sample(n=1000)

# Transformar os dados em binários
# Supondo que você queira considerar apenas algumas colunas para a análise de associação:
columns_of_interest = ['Amount', 'Class']
df_bin = df_sample[columns_of_interest]

# Transformar as colunas de interesse em dummies (se necessário)
df_bin = pd.get_dummies(df_bin, columns=columns_of_interest)

# Aplicar o algoritmo Apriori
frequent_itemsets = apriori(df_bin, min_support=0.1, use_colnames=True)

# Gerar as regras de associação
rules = association_rules(frequent_itemsets
                            , metric='confidence'
                            , min_threshold=0.7)

# Exibir as regras de associação
print(rules)

  antecedents consequents  antecedent support  consequent support  support  \
0   (Class_0)  (Amount_1)               0.999               0.992    0.991   
1  (Amount_1)   (Class_0)               0.992               0.999    0.991   

   confidence      lift  leverage  conviction  zhangs_metric  
0    0.991992  0.999992 -0.000008       0.999      -0.008008  
1    0.998992  0.999992 -0.000008       0.992      -0.001008  


Esse código utiliza o algoritmo Apriori para encontrar padrões de associação em um conjunto de dados de transações de cartão de crédito. Ele pré-processa os dados, transformando a coluna 'Amount' em binário (1 para valores positivos e 0 para valores negativos), seleciona uma amostra dos dados, e transforma as colunas de interesse em variáveis binárias. Em seguida, aplica o algoritmo Apriori para identificar conjuntos frequentes de itens e gera regras de associação com uma confiança mínima de 70%. As regras de associação identificadas são então exibidas. Essa análise pode ajudar a descobrir padrões de comportamento ou transações frequentes, úteis para detectar possíveis fraudes ou entender o comportamento dos clientes.

As regras de associação geradas indicam uma forte ligação entre dois aspectos das transações de cartão de crédito: a classe da transação e o valor da transação. Em particular, as regras mostram que transações rotuladas como comuns ('Class_0') têm uma alta probabilidade de estarem associadas a valores positivos ('Amount_1'). Isso sugere que transações típicas e não fraudulosas tendem a ter valores positivos. Essa associação é consistente com o comportamento esperado em transações regulares. Em resumo, os resultados destacam a relação entre a natureza da transação e o valor envolvido, oferecendo insights valiosos para a compreensão dos padrões de gastos e o potencial de identificação de transações fraudulentas.