# Mãos a Obra
## Definindo, Classificando, Aprendendo, Predizendo e Analisando Resultados

<p>Machine Learning é uma técnica de Inteligência Artificial que permite que a máquina aprenda através de exemplos, exatamente como os seres humanos.</p>

* Os emails do Gmail já são classificados automaticamente como <strong>Spam</strong> ou <strong>Não Spam</strong>.<br>
* O Facebook já é capaz de identificar o rosto de cada um dos seus amigos e marcá-los automaticamente nas fotos do rolê do final de semana.<br>
* Quando você faz uma compra online e recebe sugestões de produtos que foram selecionados por uma máquina que se baseia nas suas escolhas anteriores.

# Definição do problema

* o que queremos classificar?
* quais características diferenciam o conjunto?
* falsos positivos e falsos negativos
* eliminação de objetos (se não é um gato, então é um cachorro)

### Pergunta: você sabe identificar o que é um gato ou um cachorro?

<p>Vamos tomar o <strong>gato</strong> como referência!!!</p>
<p> A <strong><em>Priori</strong></em> vamos selecionar três gatos para descrever nosso conjunto e tabular três características:</p>

<table>
    <tr>
        <td colspan="4"  align="center">GATOS</td>
    </tr>
    <tr>
        <td>Animal</td>
        <td>É fofinho?</td>
        <td>Tem orelha pequena?</td>
        <td>Faz miau?</td>
    </tr>
    <tr>
        <td>Gato 1</td>
        <td align="center">1</td>
        <td align="center">1</td>
        <td align="center">1</td>
    </tr>
    <tr>
        <td>Gato 2</td>
        <td align="center">1</td>
        <td align="center">0</td>
        <td align="center">1</td>
    </tr>
    <tr>
        <td>Gato 3</td>
        <td align="center">0</td>
        <td align="center">1</td>
        <td align="center">1</td>
    </tr>
</table>

<p>Vamos definir agora nosso cachorros.</p>
<table>
    <tr>
        <td colspan="4"  align="center">CACHORROS</td>
    </tr>
    <tr>
        <td>Animal</td>
        <td>É fofinho?</td>
        <td>Tem orelha pequena?</td>
        <td>Faz miau?</td>
    </tr>
    <tr>
        <td>Cachorro 1</td>
        <td align="center">1</td>
        <td align="center">1</td>
        <td align="center">0</td>
    </tr>
    <tr>
        <td>Cachorro 2</td>
        <td align="center">0</td>
        <td align="center">1</td>
        <td align="center">0</td>
    </tr>
    <tr>
        <td>Cachorro 3</td>
        <td align="center">0</td>
        <td align="center">1</td>
        <td align="center">0</td>
    </tr>
</table>

In [13]:
# Função para mostrar os resultados "humanos" (-1 e 1)
def legenda(lista):
  retorno = []
  lista_animais = [ [1, 'Gato'], [-1, 'Cachorro'] ]
  for l in lista:
    if l == 1:
      retorno.append(lista_animais[0][1]) # Gato
    else:
      retorno.append(lista_animais[1][1]) # Cachorro
  return retorno

#Montando o Problema

In [14]:
# Transformar a informação em uma estrutura processável
# gatos
animal1	= [1,	1, 1]
animal2	= [1, 0, 1]
animal3	= [0, 1, 1]

#cachorros
animal4 =	[1, 1, 0]
animal5 = [0, 1, 0]
animal6 = [0, 1, 0]

# Definição do Conjunto de Dados

In [15]:
animais = [animal1, animal2, animal3, animal4, animal5,animal6]

#Informando para o Algoritmo quem é gato e quem é cachorro

In [16]:
# 1 é gato
# -1 é cachorro
convencao_animais = [1, 1, 1, -1, -1, -1]

# Aplicando os Modelos Machine Learning
Diferentes abordagens: SVM, Árvores de decisão, K-Nearest Neighbors, Naive Bayes, entre outros.

In [17]:
from sklearn.naive_bayes import MultinomialNB
import numpy as np

In [18]:
# treinamento para aprendizagem
modelo_mnb = MultinomialNB() # definição do modelo de aprendizagem

# realizando a aprendizagem (.fit(value_1, value_2))
modelo_mnb.fit(animais, convencao_animais)

MultinomialNB()

In [19]:
# verificando os coeficientes de aprendizagem
modelo_mnb.coef_



array([[-1.2039728 , -1.2039728 , -0.91629073]])

# Realizando Predições

Agora que o algoritmo já __aprendeu__ o que é um gato e o que é um cachorro, vamos predizer três animais que __não__ pertencem ao conjunto de dados original.

<table>
    <tr>
        <td colspan="4"  align="center">ANIMAIS</td>
    </tr>
    <tr>
        <td>Animal</td>
        <td>É fofinho?</td>
        <td>Tem orelha pequena?</td>
        <td>Faz miau?</td>
    </tr>
    <tr>
        <td>teste_1</td>
        <td align="center">1</td>
        <td align="center">1</td>
        <td align="center">1</td>
    </tr>
    <tr>
        <td>teste_2</td>
        <td align="center">1</td>
        <td align="center">0</td>
        <td align="center">0</td>
    </tr>
    <tr>
        <td>teste_3</td>
        <td align="center">0</td>
        <td align="center">0</td>
        <td align="center">1</td>
    </tr>
</table>

In [20]:
# criando o conjunto de dados para realizar a predição
teste_1 = [1, 1, 1]
teste_2 = [1, 0, 0]
teste_3 = [0, 0, 1]
dados_teste = [teste_1, teste_2, teste_3]

In [21]:
# realizando a predição (.predict(value))
modelo_mnb.predict(dados_teste)

array([1, 1, 1])

In [22]:
# Nesta prtedição, o algoritmo NB tem um sucesso de 66% de acerto.
legenda(modelo_mnb.predict(dados_teste))

['Gato', 'Gato', 'Gato']

# Análise dos resultados

* De antemão já sabíamos que deveria ser _Gato_, _Cachorro_ e _Gato_, mas a resposta foi: _Gato_, _Gato_ e _Gato_.
Portanto, a acurácia do algoritmo é de 66%, ou seja, acertou dois em três, o que é considerado bom.

In [23]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.naive_bayes import GaussianNB
from sklearn.tree import DecisionTreeClassifier

# Definindo os novos modelos

In [12]:
from sklearn import neighbors
tree = DecisionTreeClassifier(max_depth=10) #árvore de decisão
knn= KNeighborsClassifier(n_neighbors=5) # vizinho mais próximo
logreg = LogisticRegression() # regressão logística
gnb = GaussianNB() #gaussiana

In [None]:
# Atividade
# Treinar os modelos acima e fazer a predição para cada um deles
# Qual modelo de ML (Machine Learning) teve melhor desempenho?

In [24]:
# Regressão Logística
logreg.fit(animais, convencao_animais)
legenda(logreg.predict(dados_teste))
#logreg.coef_

['Gato', 'Cachorro', 'Gato']

In [25]:
# Árvore de Decisão
tree.fit(animais, convencao_animais)
legenda(tree.predict(dados_teste))
tree.score

<bound method ClassifierMixin.score of DecisionTreeClassifier(max_depth=10)>

In [26]:
# Vizinho Próximo
knn.fit(animais, convencao_animais)
legenda(knn.predict(dados_teste))

['Gato', 'Cachorro', 'Gato']

In [27]:
# Gaussian
gnb.fit(animais, convencao_animais)
legenda(gnb.predict(dados_teste))

['Gato', 'Cachorro', 'Gato']