# Modelo "Apriori"
É um algoritimo com base no "Aprendizado por Regras de Associação" com a função de identificar associações entre diferentes variáveis em um banco de dados. Um dos mais populares exemplos desse tipo de aprendizado é a análise da cesta de supemercado. O problema analisa a associação entre vários itens com maior probabilidade de serem comprados juntos por um cliente.

In [None]:
!pip install apyori

In [1]:
# import numpy as np
import pandas as pd
from apyori import apriori

In [2]:
store_data = pd.read_csv('bases/store_data.csv', header=None)
store_data.head()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19
0,shrimp,almonds,avocado,vegetables mix,green grapes,whole weat flour,yams,cottage cheese,energy drink,tomato juice,low fat yogurt,green tea,honey,salad,mineral water,salmon,antioxydant juice,frozen smoothie,spinach,olive oil
1,burgers,meatballs,eggs,,,,,,,,,,,,,,,,,
2,chutney,,,,,,,,,,,,,,,,,,,
3,turkey,avocado,,,,,,,,,,,,,,,,,,
4,mineral water,milk,energy bar,whole wheat rice,green tea,,,,,,,,,,,,,,,


## Pré-processamento de Dados

A biblioteca Apriori exige que nosso conjunto de dados esteja na forma de uma lista de listas, onde todo o conjunto de dados é uma grande lista e cada transação no conjunto de dados é uma lista interna da grande lista externa.

In [9]:
records = []
for i in range(0, 7501):
    records.append([str(store_data.values[i,j]) for j in range(0, 20)])

In [10]:
regras = list(apriori(records, min_support=0.0045, min_confidence=0.2, min_lift=3, min_length=2))

In [11]:
print(len(regras))
print(regras[0])

48
RelationRecord(items=frozenset({'chicken', 'light cream'}), support=0.004532728969470737, ordered_statistics=[OrderedStatistic(items_base=frozenset({'light cream'}), items_add=frozenset({'chicken'}), confidence=0.29059829059829057, lift=4.84395061728395)])


## Este modelo trabalha com 3 variáveis:

* Suporte (support): O suporte do item I é definido como a razão entre o número de transações que contêm o item I pelo número total de transações.
* Confiança (confidence): Isso é medido pela proporção de transações com o item I1, nas quais o item I2 também aparece. A confiança entre dois itens I1 e I2, em uma transação, é definida como o número total de transações contendo os itens I1 e I2 dividido pelo número total de transações contendo I1.
* Lift: Aumento é a razão entre a confiança e o suporte.

In [13]:
mostrar = 0
for item in regras:
    items = [x for x in item[0]]
    print("Regra: " + items[0] + " -> " + items[1])
    print("Suporte: " + str(item[1]))
    print("Confiança: " + str(item[2][0][2]))
    print("Lift: " + str(item[2][0][3]))
    print("=====================================")
    mostrar += 1
    if (mostrar == 2):
        break

Regra: chicken -> light cream
Suporte: 0.004532728969470737
Confiança: 0.29059829059829057
Lift: 4.84395061728395
Regra: mushroom cream sauce -> escalope
Suporte: 0.005732568990801226
Confiança: 0.3006993006993007
Lift: 3.790832696715049


Entre o "Frango" e o "Creme Light". O valor de suporte é 0,0045 (este número é calculado dividindo o número de transações que contêm o primeiro produto dividido pelo número total de transações). A confiança de 0,2905 significa que de todas as transações que contêm "Creme Light", 29,05% também contêm "Frango". O Lift mostra que o "Creme Light" tem 4,84 vezes mais chances de ser comprado pelos clientes que compram "Frango", em comparação com a probabilidade de venda do "Creme Light".

Entre o "Molho de Creme de Cogumelos" e o "Escalope". O suporte é de 0,0057. A confiança de 0,3006 significa que de todas as transações que contêm o "Molho de Creme de Cogumelos" 30,06% também contêm "Escalope". O Lift mostra que o "Escalope" tem 3,79 mais chances de ser comprado pelos clientes que compram o "Molho de Creme de Cogumelos", em comparação com a probabilidade de venda do "Escalope".