In [None]:
from sklearn.datasets import load_breast_cancer
import pandas as pd

# Para visualizar todas as colunas
pd.set_option('display.max_columns', 30)

# Carrega o dataset
dados = load_breast_cancer()

# Dividindo entre variáveis preditoras e variável alvo
x = pd.DataFrame(dados.data, columns=[dados.feature_names])     # Variáveis preditoras
y = pd.Series(dados.target)                                     # Variável alvo

In [None]:
# Visualizando as 5 primeiras linhas das variáveis preditoras
x.head()

In [None]:
# Visualizando as 5 primeiras linhas da variável alvo
y.head()

In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

# Separando os dados entre treino e teste
x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3, random_state=9)

# Criação do modelo
modelo = LogisticRegression(C=95, penalty='l1', solver='liblinear')

# Treinamento do modelo
modelo.fit(x_treino, y_treino)

# Obtem a acurácia do modelo
resultado = modelo.score(x_teste, y_teste)

# Exibe a acurácia do modelo
print(f'Acurácia: {resultado}')

In [None]:
# Probabilidades de cada classe
# Usa o método predict_proba() para obter as probabilidades de cada classe, uma vez que o método predict() retorna apenas a classe com maior probabilidade baseada no threshold padrão de 0.5
predicoes = modelo.predict_proba(x_teste)

In [None]:
# Probabilidades de cada classe
predicoes

In [None]:
# Probabilidade de ser 1
probs = predicoes[:, 1]
print(probs)

In [None]:
from sklearn.metrics import roc_curve

# Obtem os valores de fpr, tpr e thresholds do modelo
fpr, tpr, thresholds = roc_curve(y_teste, probs)

In [None]:
print(f'TPR: {tpr}')
print(f'FPR: {fpr}')
print(f'Thresholds: {thresholds}')

In [None]:
import matplotlib.pyplot as plt

# Plota o gráfico
plt.scatter(fpr, tpr)

# Exibe o gráfico
plt.show()

In [None]:
from sklearn.metrics import roc_auc_score

# Exibe o valor do AUC
print(roc_auc_score(y_teste, probs))

In [None]:
# Referências
# https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curve.html