# Regressão Logística com Python
### Aplicando o algoritmo de classificação usando o método de regressão logística para uma base de dados de risco de crédito.

#### Pré-processamento da base de dados

In [1]:
# importando a biblioteca pandas do python
import pandas as pd

# importando todos os registros da base de dados no objeto "dataframe"
dataframe = pd.read_csv('Risco_credito.csv', encoding = 'utf-8', sep = ',')

# separando os atributos previsores das classes
previsores = dataframe.iloc[:, 0:4].values
classe = dataframe.iloc[:, 4].values

# importando a biblioteca sklearn do python
from sklearn.preprocessing import LabelEncoder

# criando o objeto 'labelencoder' para realizar a transformação dos atributos categóricos em numéricos
labelencoder = LabelEncoder()

# transformando as variáveis categóricas em numéricas usando o objeto 'LabelEncoder'
previsores[:, 0] = labelencoder.fit_transform(previsores[:, 0])
previsores[:, 1] = labelencoder.fit_transform(previsores[:, 1])
previsores[:, 2] = labelencoder.fit_transform(previsores[:, 2])
previsores[:, 3] = labelencoder.fit_transform(previsores[:, 3])

#### Regressão Linear com Python

In [9]:
# importando a biblioteca sklearn do Python
from sklearn.linear_model import LogisticRegression
# a função 'LogisticRegression' é a responsável por aplicar o método de regressão linear no algoritmo

In [10]:
# criando o objeto 'classificador' para conseguir encontrar a melhor curva sigmoidal possível com a base de 
# dados em questão
classificador = LogisticRegression()

In [11]:
# aplicando o treinamento com a base de dados armazenadas no objete 'dataframe'
classificador.fit(previsores, classe)

LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
                   intercept_scaling=1, l1_ratio=None, max_iter=100,
                   multi_class='auto', n_jobs=None, penalty='l2',
                   random_state=None, solver='lbfgs', tol=0.0001, verbose=0,
                   warm_start=False)

In [7]:
# visualizando o parâmetro b0
print(classificador.intercept_)

[-0.52358972]


In [8]:
# visualizando os parâmetros obtidos para cada um dos campos de dados 
print(classificador.coef_)

[[-0.65034407  0.25428474 -0.45375558  1.17384764]]


#### Testando a capacidade de predição do algoritmo

In [12]:
# obtendo a predição utilizando o algoritmo feito, com as seguintes entradas:

# historia boa, divida alta, garantias nenhuma, renda > 35
# história ruim, dívida adequada, garantias adequada, renda < 15
resultado = classificador.predict([[0, 0, 1, 2], [3, 0, 0, 0]])

In [13]:
# visualizando a predição para os dois casos informados acima
print(resultado)

['baixo' 'alto']


Dessa forma, para o cliente que possui em seu histórico um **historia boa, divida alta, garantias nenhuma e renda > 35**, o algoritmo previu o risco de realizar um empréstimo para esse cliente é baixo. Em contrapartida, para o usuário com os registros de **história ruim, dívida adequada, garantias adequada e renda < 15**, o algoritmo previu um risco de empréstimo alto.

#### Alguma dúvida? Entre em contato comigo:

- [Me envie um e-mail](mailto:alyssonmachado388@gmail.com);