# Regressão Logística
# A Regressão Logística é um método estatístico utilizado para prever a probabilidade de ocorrência de um evento, modelando a relação entre uma variável dependente binária (com duas possíveis categorias) e uma ou mais variáveis independentes. É uma técnica amplamente utilizada em problemas de classificação.

## Como funciona
    Modelo: Em sua forma mais básica, a regressão logística modela a probabilidade P(Y=1) como uma função logística dos preditores:
    P(Y=1)=1 / (1+e^−(β0+β1X1+β2X2+⋯+βkXk)
    onde β0,β1,⋯ ,βkβ0​,β1​,⋯,βk​ são os coeficientes do modelo e X1,X2,⋯ ,XkX1​,X2​,⋯,Xk​ são as variáveis independentes.

    Estimativa dos Coeficientes: Os coeficientes são geralmente estimados usando o método de Máxima Verossimilhança.

### Vantagens
* Probabilidade de Previsão: Fornece resultados na forma de probabilidades, oferecendo não apenas a classificação, mas também a incerteza associada à previsão.
* Flexível: Pode ser estendida para lidar com múltiplas classes (Regressão Logística Multinomial) e pode incluir interações e transformações não lineares dos preditores.
* Eficiente: É eficiente computacionalmente e não exige muitos recursos computacionais.

### Desvantagens
* Modelo Linear: Assume uma relação linear entre as variáveis independentes e o logit da variável dependente, o que pode ser uma simplificação excessiva em alguns casos.
* Problema de Separação: Pode enfrentar problemas em datasets pequenos ou se os dados estiverem separados perfeitamente.
* Sensível a Outliers: Como outros métodos de regressão, a regressão logística pode ser sensível a outliers.

#### Exemplo de Código com Regressão Logística

In [7]:
from sklearn.datasets import load_breast_cancer
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report

In [8]:
cancer_data = load_breast_cancer()
X = cancer_data.data
y = cancer_data.target


In [9]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [10]:
model = LogisticRegression(max_iter=10000)
model.fit(X_train, y_train)

In [11]:
y_pred = model.predict(X_test)
conf_matrix = confusion_matrix(y_test, y_pred)
report = classification_report(y_test, y_pred)

In [12]:
print("Matriz de Confusão:")
print(conf_matrix)
print("\nRelatório de Classificação:")
print(report)

Matriz de Confusão:
[[39  4]
 [ 1 70]]

Relatório de Classificação:
              precision    recall  f1-score   support

           0       0.97      0.91      0.94        43
           1       0.95      0.99      0.97        71

    accuracy                           0.96       114
   macro avg       0.96      0.95      0.95       114
weighted avg       0.96      0.96      0.96       114

