## 🧩 O que são regras de associação?

**Regras de associação** são uma técnica de **mineração de dados** utilizada para descobrir **relações significativas, frequentes e úteis entre conjuntos de itens** em grandes bases de dados transacionais.

Elas são especialmente úteis para **identificar padrões ocultos** que podem ajudar na **tomada de decisões** em várias áreas, como:

- Marketing  
- Varejo  
- Saúde  
- Finanças

---

Os algoritmos de regras de associação surgiram na **década de 1990**, no contexto da crescente necessidade de análise de grandes volumes de dados gerados por sistemas de transações comerciais.

Com o advento dos **sistemas de ponto de venda (POS)** e a **digitalização das transações**, o volume de dados disponíveis aumentou exponencialmente.

📈 Esse cenário criou uma demanda por técnicas que pudessem **extrair informações valiosas a partir desses dados massivos**.

## 🔗 Como são expressas as regras de associação?

As regras de associação são expressas na forma de **implicações**, onde:

> A **presença de um conjunto de itens em uma transação implica a presença de outro conjunto de itens**.

---

### 📐 Representação formal:

Uma regra de associação é representada como:

A → B


Onde:
- `A` e `B` são **conjuntos de itens**
- A regra indica que **as transações que contêm A tendem a também conter B**

---

### 🧾 Termos importantes:

- **Antecedente (A)**:  
  O conjunto de itens que aparece **antes da implicação**.  
  Também chamado de **premissa** ou **corpo da regra**.

- **Consequente (B)**:  
  O conjunto de itens que aparece **após a implicação**.  
  Também chamado de **conclusão** ou **cabeça da regra**.

## 📚 Fundamentos das Regras de Associação

### 🟦 **Item**
Um objeto ou entidade de interesse.  
*Exemplo:* em uma base de dados de supermercado, um item pode ser **“leite”** ou **“pão”**.

---

### 🟩 **Itemset**
Um **conjunto de itens**.  
*Exemplo:* `{leite, pão}` é um itemset.

---

### 🟨 **Transações**
Uma **transação** é uma coleção de itens **comprados ou ocorridos juntos**.  
Cada transação é representada por um itemset.  
*Exemplo:* Uma transação pode ser `{leite, pão, manteiga}`.

---

### 🟪 **Banco de Dados Transacional**
Uma coleção de transações.  
Cada linha na base de dados representa uma **transação**.

## 🎯 Principais Objetivos e Benefícios das Regras de Associação

### 🔍 Identificação de Relacionamentos Significativos
Descobrir **relações úteis entre itens** que podem **não ser evidentes à primeira vista**.  
Ajuda as empresas a **entender melhor os hábitos de compra** dos clientes e a desenvolver **estratégias mais eficazes**.

---

### 💰 Aumento das Vendas e Receita
Utilizar as associações descobertas para criar **promoções cruzadas** e **pacotes de produtos** que incentivem os clientes a **comprar mais itens juntos**, aumentando assim as **vendas e a receita**.

---

### 🛒 Otimização do Layout das Lojas
Analisar **padrões de compra** para otimizar a **disposição dos produtos nas lojas físicas**, facilitando a navegação dos clientes e **aumentando a probabilidade de compras impulsivas**.

---

### 🎯 Personalização de Ofertas e Campanhas
Segmentar os clientes com base nos **padrões de compra** e personalizar **ofertas e campanhas de marketing**, aumentando:
- A **taxa de conversão**
- A **satisfação do cliente**

---

### 🕵️‍♀️ Detecção de Fraudes
Identificar **padrões anômalos** que possam indicar **atividades fraudulentas**, ajudando instituições financeiras a:
- **Prevenir**
- **Mitigar fraudes**

---

### 📦 Melhoria na Gestão de Estoques
Prever a demanda por produtos com base nos padrões de compra, permitindo:
- Melhor **gestão de estoques**
- **Redução de custos** com armazenamento e desperdício

## 🧪 Casos de Uso das Regras de Associação

### 🛒 **Market Basket Analysis**
Utilizada em **supermercados e lojas de varejo** para descobrir **quais produtos são frequentemente comprados juntos**.  
📦 Exemplo: criar **promoções cruzadas**, como “compre 1 e leve outro com desconto”.

---

### 🤖 **Sistemas de Recomendação**
Plataformas de **e-commerce** usam regras de associação para recomendar produtos ou filmes com base nas **compras ou visualizações anteriores** dos clientes.

---

### 🕵️ **Detecção de Fraudes**
Instituições financeiras utilizam regras de associação para identificar **padrões anômalos de comportamento** que indiquem fraudes, como:
- Transações incomuns
- Atividades suspeitas em contas bancárias

---

### 🏥 **Análise de Dados Médicos**
Na saúde, as regras de associação ajudam a descobrir **padrões em dados de pacientes**, como:
- Identificação de **fatores de risco**
- Apoio a **diagnósticos e tratamentos**

---

### 📞 **Telecomunicações**
Empresas de telecom usam regras de associação para:
- Analisar o **comportamento dos clientes**
- Detectar **churn** (cancelamento de serviços)
- Criar **estratégias de retenção mais eficazes**


## 🤖 Um passeio pelos algoritmos de regras de associação

### 📌 Apriori
Identifica **itemsets frequentes** gerando candidatos e utilizando a **propriedade anti-monotônica**, que afirma:

> Se um itemset é frequente, **todos os seus subconjuntos também são frequentes**.

---

### 🌲 FP-Growth
Utiliza uma **estrutura de árvore (FP-tree)** para armazenar itemsets frequentes de forma **compacta**,  
evitando a geração de candidatos como no Apriori.

---

### 🔄 Eclat
Usa uma **abordagem de interseção de listas de transações** para identificar itemsets frequentes.  
É baseado na **decomposição da busca** de itemsets em **classes de equivalência**.

---

### 🧮 AIS
Foi um dos **primeiros algoritmos** de regras de associação.  
Gera itemsets frequentes de maneira **iterativa durante a leitura do banco de dados**.

## 📘 O que é o algoritmo Apriori?

O algoritmo **Apriori**, um dos primeiros e mais conhecidos algoritmos de regras de associação,  
foi introduzido por **Rakesh Agrawal** e **Ramakrishnan Srikant** em **1994**.

Eles apresentaram o algoritmo no artigo:
> *Fast Algorithms for Mining Association Rules*,  
> publicado na conferência internacional **Very Large Data Bases (VLDB)**.

---

### 🎯 Motivação

A criação do Apriori surgiu da **necessidade de encontrar padrões frequentes em bases de dados transacionais**.

O exemplo clássico que ilustra seu uso é a:

### 🛒 **Análise de cestas de compras (Market Basket Analysis)**  
O objetivo é descobrir **associações entre produtos comprados juntos pelos clientes**.


## ⚙️ Como funciona o algoritmo Apriori

### 1. 🗃️ Reunir Dados Iniciais
Imaginamos uma lista de compras de vários clientes.  
Cada lista de compras é chamada de **"transação"**.  
➡️ O primeiro passo é olhar para todos os itens únicos comprados.

---

### 2. ⭐ Encontrar Itens Populares
Contamos quantas vezes cada item individual aparece nas listas.  
📊 Exemplo: se **leite** aparece em 3 de 5 listas, sua frequência é de **60%**.

---

### 3. 🚫 Filtrar Itens Frequentes
Definimos um limite mínimo de popularidade, chamado **suporte mínimo**.  
➡️ Apenas os itens que atingem esse limite são mantidos.  
Exemplo: se o mínimo for 50%, e o item estiver em 60% das listas, ele continua.

---

### 4. 🔗 Criar Combinações de Itens
Geramos todas as **combinações de dois itens** a partir dos itens populares.  
📌 Exemplo: `leite e pão`, `leite e manteiga`, etc.

---

### 5. 📈 Contar Combinações Populares
Verificamos quantas vezes cada combinação aparece nas listas.  
✅ Se a frequência for alta o suficiente, a combinação é mantida.  
Exemplo: `leite e pão` aparece em 40% → mantida.

---

### 6. 🔁 Repetir com Combinações Maiores
Agora criamos combinações de **três ou mais itens** a partir das combinações populares anteriores.  
O processo continua até **não restarem mais combinações frequentes**.

---

### 7. 📋 Criar Regras de Associação
Com as combinações populares, criamos regras como:  
> "Se alguém compra leite, também compra pão"

⚠️ Calculamos a **confiança**, que mede a **frequência com que a regra é verdadeira**.  
Se sempre que alguém compra leite também compra pão, a confiança é alta.

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

![image-3.png](attachment:image-3.png)

![image-4.png](attachment:image-4.png)