# Aprendizado por Regra de Associação - Modelo a Apriori

## Instalando a biblioteca Apyori

In [2]:
!pip install apyori #Se X, então Y", indicando que quando um conjunto de itens X é encontrado em uma transação, é provável que o conjunto de itens Y também esteja presente.

Collecting apyori
  Downloading apyori-1.1.2.tar.gz (8.6 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: apyori
  Building wheel for apyori (setup.py) ... [?25l[?25hdone
  Created wheel for apyori: filename=apyori-1.1.2-py3-none-any.whl size=5956 sha256=18223abd0a9b959be87d82a5ff6fd64ea104714956e1c5385ced893df33eb915
  Stored in directory: /root/.cache/pip/wheels/c4/1a/79/20f55c470a50bb3702a8cb7c94d8ada15573538c7f4baebe2d
Successfully built apyori
Installing collected packages: apyori
Successfully installed apyori-1.1.2


## Importando as bibliotecas

In [3]:
import numpy as np
import pandas as pd
from apyori import apriori

## Preprocessamento dos dados

In [4]:
dataset = pd.read_csv('dados.csv', header = None)

#transformando o dataframe em array
transacoes = []
for i in range(dataset.shape[0]):
  transacoes.append([str(dataset.values[i,j]) for j in range(dataset.shape[1])])

In [5]:
dataset.shape

(241, 6)

In [6]:
transacoes

[['Janelas de alumínio',
  ' Vidros',
  ' Silicone',
  'argamassa',
  'cal',
  'cimento'],
 ['Tintas para parede',
  ' Pincéis e rolos de pintura',
  ' Espátulas',
  'nan',
  'nan',
  'nan'],
 ['Telhas de cerâmica', ' Cimento', ' Areia', 'nan', 'nan', 'nan'],
 ['Torneiras e registros', ' Tubos de PVC', 'nan', 'nan', 'nan', 'nan'],
 ['Tuminárias', ' Fios elétricos', ' Disjuntores', 'nan', 'nan', 'nan'],
 ['Tijolos', ' Argamassa', ' Serrote', 'nan', 'nan', 'nan'],
 ['Pisos laminados',
  ' Cola para pisos',
  ' Régua de medição',
  'nan',
  'nan',
  'nan'],
 ['Chuveiro elétrico',
  ' Cabos para instalação elétrica',
  ' Interruptores',
  'nan',
  'nan',
  'nan'],
 ['Ferramentasrramentas de jardinagem',
  ' Vasos de plantas',
  ' Substrato',
  'nan',
  'nan',
  'nan'],
 ['Pias de banheiro',
  ' Armários de banheiro',
  ' Torneiras',
  'nan',
  'nan',
  'nan'],
 ['Tinta para piso',
  ' Rolo de pintura para piso',
  ' Massa niveladora',
  'nan',
  'nan',
  'nan'],
 ['Pisos cerâmicos', ' Reju

## Treinando o modelo Apriori

In [7]:
regra = apriori (transactions = transacoes, min_support = 0.003, min_confidence = 0.2, min_lift = 2, min_length = 2, max_length = 2)

## Visualizando os resultados

### Resultados diretamente da saída do treinamento

In [8]:
resultado = list(regra)

In [9]:
resultado

[RelationRecord(items=frozenset({' Abraçadeira metálica', ' Chave de grifo'}), support=0.004149377593360996, ordered_statistics=[OrderedStatistic(items_base=frozenset({' Abraçadeira metálica'}), items_add=frozenset({' Chave de grifo'}), confidence=1.0, lift=120.5), OrderedStatistic(items_base=frozenset({' Chave de grifo'}), items_add=frozenset({' Abraçadeira metálica'}), confidence=0.5, lift=120.5)]),
 RelationRecord(items=frozenset({'Serra de fita', ' Abraçadeira metálica'}), support=0.004149377593360996, ordered_statistics=[OrderedStatistic(items_base=frozenset({' Abraçadeira metálica'}), items_add=frozenset({'Serra de fita'}), confidence=1.0, lift=241.0), OrderedStatistic(items_base=frozenset({'Serra de fita'}), items_add=frozenset({' Abraçadeira metálica'}), confidence=1.0, lift=241.0)]),
 RelationRecord(items=frozenset({' Adesivo para azulejo', ' Espátula'}), support=0.004149377593360996, ordered_statistics=[OrderedStatistic(items_base=frozenset({' Adesivo para azulejo'}), items_a

### Organizando os resultados em DataFrame

In [10]:
def inspect(resultado):
    lado_esquerdo         = [resultado[2][0][0] for resultado in resultado]
    lado_direito         = [resultado[2][0][1] for resultado in resultado]
    apoio   = [resultado[1] for resultado in resultado]
    confiaça = [resultado[2][0][2] for resultado in resultado]
    lifts       = [resultado[2][0][3] for resultado in resultado] #Um lift maior que 1 indica que a ocorrência do lhs aumenta a probabilidade de ocorrência do rhs, o que sugere uma associação positiva entre os itens. Um lift igual a 1 indica que a ocorrência do lhs e do rhs é independente. Um lift menor que 1 indica que a ocorrência do lhs diminui a probabilidade de ocorrência do rhs, o que sugere uma associação negativa entre os itens.
    return list(zip(lado_esquerdo, lado_direito, apoio, confiaça, lifts))
resultadoDataFrame = pd.DataFrame(inspect(resultado), columns = ['Lado esquerdo', 'Lado direito', 'Apoio', 'Confiança', 'Lift'])

### Mostrando os resultados sem ordenação

In [11]:
resultadoDataFrame

Unnamed: 0,Lado esquerdo,Lado direito,Apoio,Confiança,Lift
0,( Abraçadeira metálica),( Chave de grifo),0.004149,1.000000,120.500000
1,( Abraçadeira metálica),(Serra de fita),0.004149,1.000000,241.000000
2,( Adesivo para azulejo),( Espátula),0.004149,1.000000,80.333333
3,( Adesivo para azulejo),( Revestimentos),0.004149,1.000000,241.000000
4,( Adesivo para azulejo),(Pisos),0.004149,1.000000,241.000000
...,...,...,...,...,...
556,(Rolodeespuma),(Tintaspray),0.024896,0.750000,25.821429
557,(Serracircular),(Tintaspray),0.008299,0.285714,9.836735
558,(argamassa),(cal),0.004149,1.000000,241.000000
559,(argamassa),(cimento),0.004149,1.000000,241.000000


### Mostrando os resultados ordenados pelo lift

In [12]:
resultadoDataFrame.nlargest(n = 20, columns = 'Confiança')

Unnamed: 0,Lado esquerdo,Lado direito,Apoio,Confiança,Lift
0,( Abraçadeira metálica),( Chave de grifo),0.004149,1.0,120.5
1,( Abraçadeira metálica),(Serra de fita),0.004149,1.0,241.0
2,( Adesivo para azulejo),( Espátula),0.004149,1.0,80.333333
3,( Adesivo para azulejo),( Revestimentos),0.004149,1.0,241.0
4,( Adesivo para azulejo),(Pisos),0.004149,1.0,241.0
5,( Alicate),( Martelo),0.004149,1.0,24.1
6,( Alicate),( Trena),0.004149,1.0,80.333333
7,( Alicate),(Chave de fenda),0.004149,1.0,60.25
8,( Alicate amperímetro),( Saco de lixo),0.004149,1.0,241.0
9,( Alicate amperímetro),(Serra de arco),0.004149,1.0,241.0
