# **REGRESSÃO LOGÍSTICA**

Esse algoritmo faz primeiramente uma regressão linear, para assim poder gerar uma função sigmoide que estabeleça a melhor divisão entre as classes. Ou seja, esse algoritmo testa qual a melhor função sigmoide que irá gerar uma classificação "perfeita".

Novamente, como esse algoritmo faz cálculos com os atributos, é necessário que haja a conversão dos valores de categóricos para numéricos.

O resultado desse algoritmo é em porcentagem, ou seja, se entramos com `A` ele vai dizer que `A` tem 25% de chance de ser classificado como `X`. Existem algoritmos que permitem definir a porcentagem mínima que é necessário atingir para que algo seja enquadrado numa dada classe. Ou seja, `A` só será classificado como `X` se a probabilidade for maior que um valor `Y`.

![](https://www.machinelearningplus.com/wp-content/uploads/2017/09/linear_vs_logistic_regression-1024x454.jpg)

Fonte: https://www.machinelearningplus.com/machine-learning/logistic-regression-tutorial-examples-r/

---
- Links para aprender mais:
    - [Intro to Logistic Regression - Cognitive Class](https://youtu.be/i_Tyr-U-eYE)
    - [Logistic Regression vs Linear Regression - Cognitive Class](https://youtu.be/tDL4HcJ4vTc)
    - [Logistic Regression - Training - Cognitive Class](https://youtu.be/gGiOc592_ho)
    - [Logistic Regression – A Complete Tutorial With Examples in R - Machine Learning Plus](https://www.machinelearningplus.com/machine-learning/logistic-regression-tutorial-examples-r/)
    - [Wikipedia](https://pt.wikipedia.org/wiki/Fun%C3%A7%C3%A3o_sigm%C3%B3ide)
---

# **IMPLEMENTAÇÃO**
Para a implementação do algoritmo foi utilizada a biblioteca Sklearn, veja a [Documentação](https://scikit-learn.org/stable/modules/classes.html#)

## BASE DE DADOS
A base de dados que será utilizada será a MNIST que já pode ser encontrada na base de dados do keras.
Porém para trabalhar com o algoritmo em questão ela deve modificada em sua dimensão.

In [1]:
from keras.datasets import mnist

# Importando base de dados
(x_train, y_train),(x_test, y_test) = mnist.load_data()

# Normalizando os valores
x_train, x_test = x_train/255, x_test/255

# Ajustando formato
x_train = x_train.reshape(x_train.shape[0], x_train.shape[1]*x_train.shape[2])
x_test = x_test.reshape(x_test.shape[0], x_test.shape[1]*x_test.shape[2])

Using TensorFlow backend.


Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz


In [2]:
#-------------------------------Bibliotecas-----------------------------------#
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, accuracy_score

#----------------------------Criando classificador----------------------------# 
classificador = LogisticRegression(random_state = 0, solver = 'lbfgs')
classificador.fit(x_train, y_train)

#----Passando os dados de teste pelo algoritmo e armazenando as previsões-----#
previsoes = classificador.predict(x_test)

#----------------Exibindo a precisão e a matriz de confusão-------------------#
precisao = accuracy_score(y_test, previsoes)
matriz = confusion_matrix(y_test, previsoes)
print('precisao: {}'.format(precisao),'\n','matriz de confusão: \n{}' .format(matriz))



precisao: 0.9198 
 matriz de confusão: 
[[ 959    0    1    2    1    5    6    4    1    1]
 [   0 1111    3    2    0    1    5    1   12    0]
 [   9    9  919   20   11    4   10   10   37    3]
 [   4    0   17  922    2   20    4   12   20    9]
 [   1    2    5    3  914    0   10    2    6   39]
 [  10    2    0   42   10  769   17    7   28    7]
 [   9    3    7    2    6   20  907    1    3    0]
 [   2    8   23    5    8    1    1  949    4   27]
 [  10   14    6   22   13   27    8   10  852   12]
 [   9    8    2   13   32   13    0   24   12  896]]


