![](http://infocontas.atricon.org.br/wp-content/uploads/2015/04/logosmall-1.png)

# Regras de Associação

### *Marcos F Silva*   
Novembro de 2017 - v0.1

## 1. O que são regras de associação?

Algoritmos de regras de associação buscam identificar dentro de um conjunto de itens, aqueles que frequentemente ocorrem juntos  em transações.

Para tornar as coisas um pouco mais claras, vamos a um exemplo prático. Vamos pensar no clássico exemplo dos carrinhos de compra. Podemos imaginar que cada conjunto de produtos que passe pela caixa registradora constitui uma transação (compra de um cliente) e que as mercadorias disponíveis no mercado constitui nosso conjunto de itens. Os itens que compõem a transação constituem um pequeno subconjunto do conjunto total de itens. 

O objetivo da regra de associação é identificar quais produtos do mercado são comprados juntos com frequência pelos clientes do supermercado. 

Uma maneira mais formal de expressar esse conceito é da seguinte forma: uma regra de associação é uma implicação da forma $X \to Y$ onde $X$ e $Y$ são conjuntos disjuntos, isto é $X \bigcap Y = \emptyset$. (TAN at all, 2006)

A força de uma regra de associação pode ser medida em termos de seu **suporte** e **confiança**. O suporte de uma regra determina o quão frequentemente uma regra é encontrada em um determinado conjunto de dados enquanto a confiança determina o quão frequentemente os itens em $Y$ ocorrem em transações que contenham $X$. Estas quantidades são definidas da seguinte forma:

$$Suporte: s(X \to Y) = \frac{\sigma(X \bigcup Y)}{N}$$ 

$$Confiança: c(X \to Y) = \frac{\sigma(X \bigcup Y)}{\sigma(X)}$$

</br>



## 2. Uma aplicação prática

Para ilustrar o uso prático das regras de associação vamos realizar uma aplicação na área de licitações públicas. Utilizaremos uma base de dados denominada `licit` que contém informações sobre as licitações realizadas.

Os pacotes necessários são os seguintes:

In [None]:
#options(warn = -1) 
suppressMessages(library(dplyr))
suppressMessages(library(arules))
suppressMessages(library(arulesViz))
suppressMessages(library(readxl))

In [10]:
setwd('C:\\Users\\Marcos\\Documents\\GitHub\\Usando-R-em-Auditoria\\dados\\regras-associacao')
load("licit_base_completa.RData")
head(licit, 3)

COD_LICITACAO,LICITACAO,RESUMO_OBJETO,DESC_MODALIDADE,STATUS_LICITACAO,DATA_ABERTURA_SESSAO,DESCR_UGR,ID_ITEM,CNPJ.CPF_FORNECEDORES,NOME_FORNECEDORES,TIPO_PESSOA,VALOR_FINAL,VENCEDOR,MICRO_PEQUENA_EMPRESA
4594,PE-009/12,Registro de Preço para mat. elétrico,Pregão Eletrônico,Homologado Total,26/04/2012 14:23:09,SECRETARIA DE ESTADO DE FAZENDA,16,04.960.002/0001-83,DIBOA COMERCIAL LTDA,Jurídica,76.5,S,N
4594,PE-009/12,Registro de Preço para mat. elétrico,Pregão Eletrônico,Homologado Total,26/04/2012 14:23:09,SECRETARIA DE ESTADO DE FAZENDA,16,07.946.118/0001-56,MACHFUSO COMERCIAL E SERVIÇOS LTDA,Jurídica,60.0,N,S
4594,PE-009/12,Registro de Preço para mat. elétrico,Pregão Eletrônico,Homologado Total,26/04/2012 14:23:09,SECRETARIA DE ESTADO DE FAZENDA,16,07.324.021/0001-01,ROS RIO MATERIAIS E COMÉRCIO LTDA-EPP (ANTIGA ROS RIO MATERIAIS E REPRESENTAÇÕES LTDA EPP),Jurídica,214.65,N,S


In [None]:
## REGRAS CONSIDERANDO APENAS OS FORNECEDORES - BASE COMPLETA...
licit_lista <- split(licit[, 'CNPJ.CPF_FORNECEDORES'], f=factor(licit$COD_LICITACAO))
licit_lista <- lapply(licit_lista, unique) 
transacoes_cnpj <- as(licit_lista, "transactions")
regras <- apriori(transacoes_cnpj, parameter=list(support=0.01, confidence=0.7))
#inspect(regras) ## ok aperfeiçoar...


In [None]:
## Visualização com arules
plot(regras, control=list(cex=1.2))
plot(regras, 'graph', control=list(cex = 0.6))
plot(regras, 'grouped')
suppressMessages(plot(regras, 'paracoord'))

## 3. Referências bibliográficas

* **_Introduction to Data Mining_**. Pang-Ning Tan, Michael Steinbach, Vipin Kumar   
* **_Introdução à Mineração de Dados com Aplicações em R_**. Leandro Augusto da Silva, Sarajane Marques Peres e Clodis Boscarioli   
* **_R and Data Mining: Examples and Case Studies_**. Yanchang Zhao  

