# Regresion Logistica

## 1.Importacion de modulos

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import confusion_matrix, classification_report, accuracy_score
from sklearn.tree import plot_tree

## 2. Lectura del dataset

In [2]:
data = pd.read_csv('Anexo4-Dataset_Red_Wine_Quality/winequality-red.csv')

## 3. Seleccionar las variables dependiente e independiente

In [3]:
X = data.drop('quality', axis=1)  # Var Independiente
y = data['quality']  # Var Dependiente


## 4. Dividir el dataset en conjunto de entrenamiento y de pruebas

In [4]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


## 5. Crear y entrenar el modelo de Regresion Lineal

In [None]:
# Crear el modelo de árbol de decisión
model = DecisionTreeClassifier(random_state=42)

# Entrenar el modelo
model.fit(X_train, y_train)

## 6. Hacer Predicciones

In [6]:
y_pred = model.predict(X_test)

## 7. Evaluacion del Modelo

In [None]:
# Calcular la matriz de confusión
cm = confusion_matrix(y_test, y_pred)

# Visualizar la matriz de confusión
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=np.unique(y), yticklabels=np.unique(y))
plt.title('Matriz de Confusión')
plt.xlabel('Predicción')
plt.ylabel('Realidad')
plt.show()

# Reporte de clasificación
report = classification_report(y_test, y_pred)
print(report)

# Calcular la precisión
accuracy = accuracy_score(y_test, y_pred)
print(f'Precisión del modelo: {accuracy:.2f}')

### Arbol de decisiones

In [None]:
plt.figure(figsize=(20,10))
plot_tree(model, filled=True, feature_names=X.columns, class_names=np.unique(y.astype(str)))
plt.title('Árbol de Decisión')
plt.show()

## Prediccion con un nuevo registro

In [9]:
nuevo_registro = pd.DataFrame({
    'fixed acidity': [7.4],
    'volatile acidity': [0.7],
    'citric acid': [0.0],
    'residual sugar': [1.9],
    'chlorides': [0.076],
    'free sulfur dioxide': [11.0],
    'total sulfur dioxide': [34.0],
    'density': [0.9978],
    'pH': [3.51],
    'sulphates': [0.56],
    'alcohol': [9.4]
})

In [10]:
prediccion = model.predict(nuevo_registro)

In [None]:
print(f'La calidad predicha del vino es: {prediccion[0]}')

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(data=data, x='alcohol', y='quality', alpha=0.6)
plt.scatter(nuevo_registro['alcohol'], prediccion[0], color='red', s=100, label='Predicción')
plt.title('Relación entre Alcohol y Calidad del Vino')
plt.xlabel('Alcohol')
plt.ylabel('Calidad')
plt.legend()
plt.show()
