### Problemática
Uma agência de viagens deseja entender melhor os padrões de compra dos seus clientes para oferecer pacotes mais personalizados e aumentar as vendas. Para isso, eles querem identificar associações frequentes entre diferentes tipos de serviços e produtos comprados juntos. Os principais serviços e produtos oferecidos pela agência incluem:

- Passagens aéreas
- Reservas de hotéis
- Aluguel de carros
- Passeios turísticos
- Seguros de viagem
- Pacotes de cruzeiros

Ao analisar os padrões de compra, a agência espera descobrir associações como a compra frequente de passagens aéreas com reservas de hotéis, ou passeios turísticos com seguros de viagem. Para realizar essa análise, a agência decide usar o algoritmo APRIORI para identificar as regras de associação mais significativas.

In [1]:
# Bibliotecas utilizadas 
#importando bibliotecas que serão utilizadas
from mlxtend.frequent_patterns import apriori, association_rules
import pandas as pd

In [5]:
# Leitura da Base de Dados
df = pd.read_csv('https://raw.githubusercontent.com/efrainmpp1/Aulas_I.A/main/datasets/transacoes_agencia_viagem.csv')
df.head()

Unnamed: 0,Aluguel de Carros,Pacotes de Cruzeiros,Passagens Aéreas,Passeios Turísticos,Reservas de Hotéis,Seguros de Viagem
0,False,True,True,True,True,False
1,False,False,False,True,True,False
2,True,False,True,True,False,False
3,True,True,False,False,False,False
4,True,True,True,False,True,True


### Aplicando o Algoritmo de Apriori

Parâmetros Utilizados:

- df: Este é o DataFrame de entrada que contém as transações. Cada coluna do DataFrame representa um item (serviço ou produto), e cada linha representa uma transação, com valores binários indicando a presença ou ausência de um item na transação.

- min_support=0.1: Este parâmetro define o suporte mínimo para um conjunto de itens ser considerado frequente. O suporte é a proporção de transações no DataFrame que contêm o conjunto de itens. Neste caso, min_support=0.1 significa que apenas os conjuntos de itens que aparecem em pelo menos 10% das transações serão considerados frequentes.
- use_colnames=True: Este parâmetro especifica que os nomes das colunas do DataFrame devem ser usados para os conjuntos de itens, em vez de usar os índices das colunas. Isso torna a saída mais legível e compreensível, pois os conjuntos de itens serão representados pelos nomes reais dos itens (serviços ou produtos).

In [6]:
# Aplicando o algoritmo APRIORI
frequent_itemsets = apriori(df, min_support=0.1, use_colnames=True)

# Extraindo as regras de associação
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.80)

# Selecionando apenas as colunas de suporte e confiança
rules_selected = rules[['antecedents', 'consequents', 'support', 'confidence']]

### Salvar regras em um arquivo .txt

In [7]:
# Salvando as regras de associação em um arquivo .txt com melhor formatação
with open('regras_de_associacao.txt', 'w') as f:
    for index, row in rules_selected.iterrows():
        f.write(f"Antecedents: {', '.join(list(row['antecedents']))}\n")
        f.write(f"Consequents: {', '.join(list(row['consequents']))}\n")
        f.write(f"Support: {row['support']:.2f}\n")
        f.write(f"Confidence: {row['confidence']:.2f}\n")
        f.write("\n")

print("Regras de associação salvas em 'regras_de_associacao.txt'")

Regras de associação salvas em 'regras_de_associacao.txt'


### Aplicação Prática
Para a agência de viagens, essas informações podem ser usadas de várias maneiras:

Promoções e Pacotes Combinados:

- A agência pode criar pacotes promocionais que incluam as combinações mencionadas, incentivando os clientes a comprar tudo junto.
Marketing Direcionado:

- A agência pode direcionar suas campanhas de marketing para clientes que já compraram alguns dos itens antecedentes, promovendo os itens consequentes como adicionais.
Recomendação de Produtos:

- Em plataformas online, a agência pode usar essas regras para recomendar itens consequentes para clientes que já têm itens antecedentes em seu carrinho de compras ou histórico de compras.
Essas regras fornecem insights valiosos sobre os padrões de compra dos clientes, permitindo que a agência de viagens tome decisões informadas para melhorar suas estratégias de vendas e marketing.