# Mãos a Obra


## Definindo, Classificando, Aprendendo, Predizendo e Analisando Resultados

<p>Machine Learning é uma técnica de Inteligência Artificial (IA) que permite que a máquina aprenda através de exemplos, exatamente como os seres humanos.</p>

* Os emails do Gmail já são classificados automaticamente como <strong>Spam</strong> ou <strong>Não Spam</strong>.<br>
* O Facebook já é capaz de identificar o rosto de cada um dos seus amigos e marcá-los automaticamente nas fotos do rolê do final de semana.<br>
* Quando você faz uma compra online e recebe sugestões de produtos que foram selecionados por uma máquina que se baseia nas suas escolhas anteriores.



# Definição do problema

* O que queremos classificar?
* Quais características diferenciam o conjunto?
* Falsos positivos e falsos negativos
* Eliminação de objetos (se não é um gato, então é um cachorro)


### Pergunta: você sabe identificar o que é um gato ou um cachorro?

<p>Vamos tomar o <strong>gato</strong> como referência!!!</p>
<p> A <strong><em>Priori</strong></em> vamos selecionar três gatos para descrever nosso conjunto e tabular três características:</p>

<table>
    <tr>
        <td colspan="4"  align="center">GATOS</td>
    </tr>
    <tr>
        <td>Animal</td>
        <td>É fofinho?</td>
        <td>Tem orelha pequena?</td>
        <td>Faz miau?</td>
    </tr>
    <tr>
        <td>Gato 1</td>
        <td align="center">1</td>
        <td align="center">1</td>
        <td align="center">1</td>
    </tr>
    <tr>
        <td>Gato 2</td>
        <td align="center">1</td>
        <td align="center">0</td>
        <td align="center">1</td>
    </tr>
    <tr>
        <td>Gato 3</td>
        <td align="center">0</td>
        <td align="center">1</td>
        <td align="center">1</td>
    </tr>
</table>

<p>Vamos definir agora nosso cachorros.</p>
<table>
    <tr>
        <td colspan="4"  align="center">CACHORROS</td>
    </tr>
    <tr>
        <td>Animal</td>
        <td>É fofinho?</td>
        <td>Tem orelha pequena?</td>
        <td>Faz miau?</td>
    </tr>
    <tr>
        <td>Cachorro 1</td>
        <td align="center">1</td>
        <td align="center">1</td>
        <td align="center">0</td>
    </tr>
    <tr>
        <td>Cachorro 2</td>
        <td align="center">0</td>
        <td align="center">1</td>
        <td align="center">0</td>
    </tr>
    <tr>
        <td>Cachorro 3</td>
        <td align="center">0</td>
        <td align="center">1</td>
        <td align="center">0</td>
    </tr>
</table>

# Criando uma função
Normalmente para modelos de Machine learning é definido (0 e 1), nesse casso irei definir (-1 e 1), sendo: 

*__-1 para Cachorro__*

*__1 para Gato__*

In [1]:
# Criando uma função para lista
def legenda(lista):
    retorno = []   # Lista vazia
    lista_animais = [[1, 'Gato'], [-1, 'Cachorro']]   # Lista para determinar a posição [0] e [1]
    
    for l in lista:
        if l == 1:
            retorno.append(lista_animais[0][1])   # Se identificar '1' irá adicionar
        else:
            retorno.append(lista_animais[1][1])
    return retorno

In [2]:
# Mostrando resultado
legenda([1, -1, -1])

['Gato', 'Cachorro', 'Cachorro']

# Montando o problema
Transformar a informação em uma estrutura processável.

In [3]:
# Gatos
animal1 = [1, 1, 1]   # Fofinho, tem orelha pequena e faz miau
animal2 = [1, 0, 1]   # Fofinho, não tem orelha pequena e faz miau
animal3 = [0, 1, 1]   # Não é fofinho, tem orelha pequena e faz miau

# Cachorros
animal4 = [1, 1, 0]   # Fofinho, tem orelha pequena e não faz miau
animal5 = [0, 1, 0]   # Não é fofinho, tem orelha pequena e não faz miau
animal6 = [1, 0, 0]   # Fofinho, não tem orelha pequena e não faz miau

# Definindo os conjuntos de dados

In [4]:
# Criando uma lista para colocar todos as variáveis de animais
animais = [animal1, animal2, animal3, animal4, animal5, animal6]

In [5]:
# Mostrando a lista dos animais
animais

[[1, 1, 1], [1, 0, 1], [0, 1, 1], [1, 1, 0], [0, 1, 0], [1, 0, 0]]

# Informando o algorítmo
Quem é Gato e quem é Cachorro na lista

__*Gato = 1*__

__*Cachorro = -1*__

In [6]:
 convencao_animais = [1, 1, 1, -1, -1, -1]

# Aplicando os Modelos de Machine Learning
Abosdagens: SVM, Árvore de Decisão, K-Nearest Neighbors, Naive Bayes, entre outros.

In [7]:
# Importando bibliotecas
import numpy as np
from sklearn.naive_bayes import MultinomialNB   # Vai tentar aprender e identificar os animais

In [8]:
# Treinando modelo de aprendizagem
modelo_mnb = MultinomialNB()   # Modelo definido

modelo_mnb.fit(animais, convencao_animais)   
# '.fit(value1, value2)' --> Adiciona a lista de 'animais' no (value1)
# e adiciona 'convencao_animais' no (value2)

MultinomialNB()

In [9]:
# Verificando o coeficiente de aprendizagem
modelo_mnb.coef_



array([[-1.2039728 , -1.2039728 , -0.91629073]])

# Realizando Predições
Agora que o algoritmo já **APRENDEU** o que é um Gato e o que é um Cachorro, vamos predizer três animais que **NÃO** pertencem ao conjunto de dados originais.

Agora o modelo que já foi criado irá tentar identificar quais são esses animais que colocamos abaixo.

<table>
    <tr>
        <td colspan="4"  align="center">ANIMAIS</td>
    </tr>
    <tr>
        <td>Animal</td>
        <td>É fofinho?</td>
        <td>Tem orelha pequena?</td>
        <td>Faz miau?</td>
    </tr>
    <tr>
        <td>test_1</td>
        <td align="center">1</td>
        <td align="center">1</td>
        <td align="center">1</td>
    </tr>
    <tr>
        <td>teste_2</td>
        <td align="center">1</td>
        <td align="center">0</td>
        <td align="center">0</td>
    </tr>
    <tr>
        <td>teste_3</td>
        <td align="center">0</td>
        <td align="center">0</td>
        <td align="center">1</td>
    </tr>
</table>

In [10]:
# Criando o conjunto de animais para que o modelo tente identificar
teste1 = [1, 1, 1]   # Fofinho, tem orelha pequena e faz miau
teste2 = [1, 0, 0]   # Fofinho, não tem orelha pequena e não faz miau
teste3 = [0, 0, 1]   # Não é fofinho, Não tem orelha pequena e faz miau

# Com base nessas informações acima temos: Gato, Cachorro e Gato
# Vamos ver se o modelo consegue acertar os animais

In [11]:
# Colocando os animais de teste em uma lista
dados_teste = [teste1, teste2, teste3]
dados_teste

[[1, 1, 1], [1, 0, 0], [0, 0, 1]]

In [12]:
# REALIZANDO O TESTE - PREDIÇÃO

# '.predict(values)' --> Realiza a predição no modelo
modelo_mnb.predict(dados_teste)

# Nessa saída ele idetificou: Gato, Cachorro e Gato
# Acertou a predição

array([ 1, -1,  1])

In [13]:
# Verificando esse resultado com o nome
legenda(modelo_mnb.predict(dados_teste))

['Gato', 'Cachorro', 'Gato']

# Análise dos resultados


In [15]:
# Importando outros modelos de teste para ver se eles irão acertar
from sklearn.neighbors import KNeighborsClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.naive_bayes import GaussianNB   
from sklearn.tree import DecisionTreeClassifier  

# Definindo os novos modelos

In [17]:
tree = DecisionTreeClassifier(max_depth=10)   # Árvore de Decisão
knn = KNeighborsClassifier(n_neighbors=5)   # Vizinho mais próximo
logreg = LogisticRegression()   # Regressão Logística
gnb = GaussianNB()   # Gaussiana

In [19]:
# Vamos colocar os mesmos dados anteriores para ver se esse outros modelos também vão acertar
teste1 = [1, 1, 1]   # Fofinho, tem orelha pequena e faz miau
teste2 = [1, 0, 0]   # Fofinho, não tem orelha pequena e não faz miau
teste3 = [0, 0, 1]   # Não é fofinho, Não tem orelha pequena e faz miau

# Com base nessas informações acima temos: Gato, Cachorro e Gato

In [25]:
# Colocando os em uma lista
dados_teste = [teste1, teste2, teste3]
dados_teste

[[1, 1, 1], [1, 0, 0], [0, 0, 1]]

# 1° Teste - tree

In [28]:
# Atribuindo a lista animais e o que cada um é
# Depois atribuimos a lista de dados que queremos que ele tente acertar
tree.fit(animais, convencao_animais)
print('Predição: ', tree.predict(dados_teste))
print('Predição com legenda: ', legenda(tree.predict(dados_teste)))

# Podemos ver que esse modelo também acertou

Predição:  [ 1 -1  1]
Predição com legenda:  ['Gato', 'Cachorro', 'Gato']


# 2° Teste - knn

In [31]:
knn.fit(animais, convencao_animais)
print('Predição: ', knn.predict(dados_teste))
print('Predição com legenda: ', legenda(knn.predict(dados_teste)))

# Podemos ver que esse modelo também acertou

Predição:  [ 1 -1  1]
Predição com legenda:  ['Gato', 'Cachorro', 'Gato']


# 3° Teste - logreg

In [32]:
logreg.fit(animais, convencao_animais)
print('Predição: ', logreg.predict(dados_teste))
print('Predição com legenda: ', legenda(logreg.predict(dados_teste)))

# Podemos ver que esse modelo também acertou

Predição:  [ 1 -1  1]
Predição com legenda:  ['Gato', 'Cachorro', 'Gato']


# 4° Teste - gnb

In [34]:
gnb.fit(animais, convencao_animais)
print('Predição: ', gnb.predict(dados_teste))
print('Predição com legenda: ', legenda(gnb.predict(dados_teste)))

# Podemos ver que esse modelo também acertou

Predição:  [ 1 -1  1]
Predição com legenda:  ['Gato', 'Cachorro', 'Gato']
