# Ejercicios de Machine Learning: Regresión Lineal, No Lineal y Logística

Este notebook contiene tres ejercicios prácticos para comprender y aplicar los conceptos de regresión lineal, regresión no lineal y regresión logística usando `scikit-learn` y `matplotlib`.

---

## Ejercicio 1: Regresión Lineal

**Objetivo**: Predecir el precio de una vivienda según sus metros cuadrados.

**Datos de entrada**:
- `superficie_m2`: Área del inmueble.
- `precio_miles_usd`: Precio de la vivienda (en miles de USD).

Usaremos un modelo de regresión lineal para encontrar la relación entre estas dos variables y realizar predicciones.


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Datos
X = np.array([50, 60, 80, 100, 120, 150]).reshape(-1, 1)
y = np.array([100, 120, 160, 200, 240, 300])

# Modelo
modelo_lineal = LinearRegression()
modelo_lineal.fit(X, y)
y_pred = modelo_lineal.predict(X)

# Visualización
plt.scatter(X, y, color='blue', label='Datos reales')
plt.plot(X, y_pred, color='orange', label='Modelo lineal')
plt.title("Regresión Lineal: Precio vs Metros cuadrados")
plt.xlabel("Superficie (m2)")
plt.ylabel("Precio (miles USD)")
plt.legend()
plt.grid(True)
plt.show()

# Métricas
print("MSE:", mean_squared_error(y, y_pred))
print("R²:", r2_score(y, y_pred))


## Ejercicio 2: Regresión No Lineal

**Objetivo**: Estimar la velocidad de una reacción química en función de la temperatura. Este fenómeno tiene una relación no lineal (en forma de parábola).

**Datos de entrada**:
- `temperatura`: Temperatura en grados Celsius.
- `velocidad_reaccion`: Velocidad de la reacción medida experimentalmente.


In [None]:
from sklearn.preprocessing import PolynomialFeatures

# Datos
X = np.array([10, 20, 30, 40, 50, 60]).reshape(-1, 1)
y = np.array([1, 4, 7, 9, 8, 5])

# Transformación polinómica
poly = PolynomialFeatures(degree=2)
X_poly = poly.fit_transform(X)

modelo_poly = LinearRegression()
modelo_poly.fit(X_poly, y)
y_pred = modelo_poly.predict(X_poly)

# Visualización
plt.scatter(X, y, color='blue', label='Datos reales')
plt.plot(X, y_pred, color='orange', label='Modelo polinómico')
plt.title("Regresión No Lineal: Velocidad vs Temperatura")
plt.xlabel("Temperatura (°C)")
plt.ylabel("Velocidad de reacción")
plt.legend()
plt.grid(True)
plt.show()


## Ejercicio 3: Regresión Logística

**Objetivo**: Predecir si un estudiante aprobará un curso en función de las horas de estudio.

**Datos de entrada**:
- `horas_estudio`: Número de horas dedicadas al estudio.
- `aprueba`: 1 si aprueba, 0 si no aprueba.

Se usará regresión logística para modelar la probabilidad de aprobar.


In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report, confusion_matrix
from scipy.special import expit

# Datos
X = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9]).reshape(-1, 1)
y = np.array([0, 0, 0, 0, 1, 1, 1, 1, 1])

modelo_log = LogisticRegression()
modelo_log.fit(X, y)
y_prob = modelo_log.predict_proba(X)[:, 1]

# Visualización curva sigmoide
plt.scatter(X, y, color='blue', label='Datos reales')
plt.plot(X, y_prob, color='orange', label='Curva sigmoide')
plt.title("Regresión Logística: Aprobación vs Horas de estudio")
plt.xlabel("Horas de estudio")
plt.ylabel("Probabilidad de aprobación")
plt.grid(True)
plt.legend()
plt.show()

# Predicción específica
nuevas_horas = np.array([[4.5]])
print("Probabilidad de aprobar con 4.5 horas:", modelo_log.predict_proba(nuevas_horas)[0][1])

# Métricas
y_pred = modelo_log.predict(X)
print(confusion_matrix(y, y_pred))
print(classification_report(y, y_pred))
