# Intro to Machine Learning

### Exemplo de classificação binária

Neste exemplo temos como **objetivo** inferir se uma dada pessoa é um **político** ou não

Para tanto, utilizaremos 5 atributos (características ou variáveis independentes), os quais serão baseados nas seguintes perguntas:
* salario acima de 20 mil **(A1)**?
* recebe mais de 10 auxílios referente ao emprego **(A2)**?
* tem foro privilegiado **(A3)**?
* responde ou já respondeu processo judicial **(A4)**?
* o cargo ocupado requer curso superior **(A5)**?

## Dados de treinamento

* Usaremos 10 indivíduos para realizar o treinamento do algoritmo de aprendizagem de máquina. 
* Observe que as colunas representam os atributos $A1...A5$ e as linhas representam os indivíduos (instâncias).
* A propósito, os dados são fictícios e não necessariamente representam a verdade sobre os indivíduos mencionados.

In [13]:
X_train = [
    [1, 1, 1, 1, 1],  #juiz Sérgio Moro
    [0, 0, 0, 0, 1],  #professor Filipe
    [1, 1, 1, 1, 0],  #senador Romero Jucá
    [0, 1, 1, 0, 0],  #prefeito do município de Normandia
    [1, 1, 1, 0, 0],  #deputado federal Messias de Jesus
    [0, 0, 0, 1, 0],  #Seu João (pedreiro)
    [1, 0, 0, 1, 0],  #Silvio Santos (empresário)
    [1, 1, 1, 0, 0],  #General Marechal (militar)
    [1, 0, 0, 0, 1],  #Fulano (médico)
    [1, 1, 1, 1, 0]   #Deputado Jair Bolsonaro (militar e deputado)
]

## Classes dos dados de treinamento

* Em aprendizagem de máquina supervisionada, as classes (também conhecida como variávies dependentes, variáveis preditivas, target ou rótulos) são conhecidas. 
* Em outras palavras, as respostas já são conhecidas. 
* No problema em destaque aqui, para cada um dos indivíduos listados acima, nós já sabemos se eles são políticos ou não. 
* Iremos representar como $0$ as pessoas que não são políticos e com $1$ os políticos. 
* Observe que a primeira linha do vetor $y\_train$ (abaixo) representa a classe da primeira instância da matriz $X\_train$ acima. 
    * Esse lógica segue para as demais instâncias.

In [14]:
y_train = [
     0, #juiz Sérgio Moro
     0, #professor Filipe
     1, #senador Romero Jucá
     1, #prefeito do município de Normandia
     1, #deputado federal Messias de Jesus
     0, #Seu João (pedreiro)
     0, #Silvio Santos (empresário)
     0, #General Marechal (militar)
     0, #Fulano (médico)
     1  #Deputado Jair Bolsonaro (militar e deputado)
]

## Dados de teste

* Agora vamos usar alguns dados para testar o modelo preditivo que vamos construir. 
* Os dados de teste devem possuir o mesmo número de colunas e o mesmo tipo de dados nas colunas que os dados de treinamento.

In [15]:
X_test = [
    [1, 1, 1, 1, 0], #Temer
    [0, 0, 0, 0, 1], #Leandro Galvão
    [1, 0, 0, 1, 1], #Wesley Safadão
    [1, 1, 1, 1, 1], #Ministro Gilmar Mendes
    [1, 1, 1, 0, 1], #Politico honesto
]

## Classe dos dados de teste

In [16]:
y_test = [
    1, #Temer
    0, #Leandro Galvão
    0, #Wesley Safadão
    0, #Ministro Gilmar Mendes
    1  #Politico honesto
]

## Treinamento do modelo

* Para treinar o modelo, iremos utilizar um algoritmo bem simples: Naive Bayes. 
* Como nossos dados são dicotômicos, iremos usar a distribuição de Bernolli que é empregada em distribuições binomiais.

In [17]:
from sklearn.naive_bayes import BernoulliNB

clf = BernoulliNB()
clf.fit(X_train, y_train)

BernoulliNB(alpha=1.0, binarize=0.0, class_prior=None, fit_prior=True)

## Teste do modelo

* Faremos o teste do modelo com os dados de teste, isto é, dados não conhecidos pelo modelo
* Depois iremos apresentar os resultados inferidos.

In [18]:
resp = clf.predict(X_test)
resp

array([1, 0, 0, 1, 1])

## Analisando as respostas do modelo preditivo

* Um forma de verificar se o modelo acertou é calculando a diferença entre o valor estimado pelo modelo preditivo e o valor real. 
    * Caso a diferença seja $0$, então o modelo acerto, do contrário o modelo errou.
* Para ilustrar, imagine que o modelo estimou que o Temer é um político (resultado estimado é $1$). 
    * Note que o temer é um político logo sua classe é $1$. 
    * Assim a diferença entre o valor estimado e o valor real é zero ($1-1 = 0$).
* Observe que no caso abaixo, houve apenas um erro referente a variável 'Ministro Gilmar Mendes'. 
    * Ou seja, o algoritmo estimou erradamente que o ministro é um político.

In [19]:
diferencas = resp - y_test
diferencas

array([0, 0, 0, 1, 0])

## Calculando a acurácia do modelo preditivo

* Agora vamos percorrer a lista 'diferencas' para verificar a quantidade de $0s$. 
* Depois, divideremos essa quantidade pelo total de casos de teste. 
    * Dessa forma, iremos obter a acurácia do modelo preditivo.

In [20]:
acertos = [a for a in diferencas if a==0]

total_acertos = len(acertos)
total_teste = len(y_test)

acuracia = total_acertos/total_teste
acuracia

0.8

## Analisando as probabilidades das estimativas

* Abaixo iremos analisar a confiança da estimativa ao declarar que um indivíduo é político ou não.
* Na primeira coluna temos a probabilidade da classe ser $0$ e na segunda coluna da classe ser $1$.
* Observe que na instância em que o modelo errou, foi um caso onde o modelo estava 'menos confiante' se o indivíduo era um político.

In [21]:
resp_prob = clf.predict_proba(X_test)
resp_prob

array([[ 0.14592647,  0.85407353],
       [ 0.98614794,  0.01385206],
       [ 0.98342345,  0.01657655],
       [ 0.46071203,  0.53928797],
       [ 0.46071203,  0.53928797]])

In [25]:
clf.predict(X_test)

array([1, 0, 0, 1, 1])

## <font color=red> Exercício em Sala </font>

1. Aumente o número de atributos (novas perguntas) e instâncias (novas pessoas) da base de treino e teste. Treine novamente o modelo e calcule a acurácia.

## Materiais para estudo:

* [Hands-On Machine Learning with Scikit-Learn and TensorFlow - O'Reilly] (http://shop.oreilly.com/product/0636920052289.do)
    * [Notebooks do livro no github](https://github.com/amitanalyste/aurelienGeron)
* [Intro to Machine Learning - Udacity](https://br.udacity.com/course/intro-to-machine-learning--ud120)
* [Documentação scikit-learn](http://scikit-learn.org/)
* [Machine Learning - Coursera](https://pt.coursera.org/learn/machine-learning)
* Livro [An Introduction to Statistical Learning](http://www-bcf.usc.edu/~gareth/ISL/)