In [None]:

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, f1_score
import numpy as np
import matplotlib.pyplot as plt

# Cargar datos
data = load_iris()
X, y = data.data[:, :2], data.target  # Tomamos solo dos características para poder graficar en 2D

# Dividir datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Entrenar modelo KNN
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Predicción
y_pred = knn.predict(X_test)

# Evaluar modelo
print("Precisión:", accuracy_score(y_test, y_pred))
print("Puntuación F1:", f1_score(y_test, y_pred, average='weighted'))

# Crear malla para regiones de decisión
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.1),
                     np.arange(y_min, y_max, 0.1))

# Predecir sobre la malla
Z = knn.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

# Gráfico de las regiones de decisión
plt.contourf(xx, yy, Z, alpha=0.3, cmap='viridis')
plt.scatter(X[:, 0], X[:, 1], c=y, edgecolor='k', cmap='viridis')
plt.title("Región de Decisión - KNN Clasificador")
plt.xlabel(data.feature_names[0])
plt.ylabel(data.feature_names[1])
plt.show()


In [None]:

from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt

# Cargar datos
data = fetch_california_housing()
X, y = data.data, data.target

# Dividir datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Entrenar modelo de Bosques Aleatorios
rf = RandomForestRegressor(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)

# Predicción
y_pred = rf.predict(X_test)

# Evaluar modelo
print("Error Cuadrático Medio:", mean_squared_error(y_test, y_pred))
print("Coeficiente de Determinación R²:", r2_score(y_test, y_pred))

# Gráfico de Predicción vs Real
plt.scatter(y_test, y_pred, alpha=0.5, color='b')
plt.plot([y.min(), y.max()], [y.min(), y.max()], 'k--', lw=3)
plt.xlabel("Valores Reales")
plt.ylabel("Predicciones")
plt.title("Predicciones vs Valores Reales - Regresión con Bosques Aleatorios")
plt.show()


In [None]:

from sklearn.ensemble import IsolationForest
from sklearn.datasets import make_blobs
import numpy as np
import matplotlib.pyplot as plt

# Crear datos sintéticos con anomalías
X, _ = make_blobs(n_samples=300, centers=1, cluster_std=0.5, random_state=42)
X = np.vstack([X, np.random.uniform(low=-6, high=6, size=(20, 2))])  # Añadir anomalías

# Modelo Isolation Forest
iso_forest = IsolationForest(contamination=0.1, random_state=42)
y_pred = iso_forest.fit_predict(X)

# Visualización de anomalías
plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='coolwarm', edgecolor='k')
plt.title("Detección de Anomalías con Isolation Forest")
plt.xlabel("Eje X")
plt.ylabel("Eje Y")
plt.show()


In [None]:

from sklearn.datasets import load_digits
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt

# Cargar datos
digits = load_digits()
X, y = digits.data, digits.target

# Reducir dimensionalidad a 2 componentes principales
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X)

# Visualización
plt.figure(figsize=(8, 6))
scatter = plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y, cmap='viridis', edgecolor='k')
plt.colorbar(scatter)
plt.title("Reducción de Dimensionalidad con PCA")
plt.xlabel("Componente Principal 1")
plt.ylabel("Componente Principal 2")
plt.show()
