### Logistic Regression (Regresión Logística)

In [8]:
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV, RandomizedSearchCV
from sklearn.preprocessing import StandardScaler
from scipy.stats import uniform
from sklearn.metrics import accuracy_score

# Cargar el conjunto de datos Iris
data = load_iris()
X = data.data
y = data.target

# Dividir los datos en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalar las características
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Parámetros para GridSearchCV
param_grid = {
    'C': [0.1, 1, 10],
    'penalty': ['l2'],  # Eliminar 'none', ya que no es válido
    'solver': ['lbfgs', 'liblinear'],
    'max_iter': [100, 200]  # Agregar max_iter para controlar la convergencia
}

# Parámetros para RandomizedSearchCV
param_dist = {
    'C': uniform(0.1, 10),
    'penalty': ['l2'],  # Eliminar 'none'
    'solver': ['lbfgs', 'liblinear'],
    'max_iter': [100, 200]  # Agregar max_iter
}

# Crear el clasificador LogisticRegression
log_reg = LogisticRegression()

# Grid Search
grid_search = GridSearchCV(log_reg, param_grid, cv=5, n_jobs=-1)  # n_jobs=-1 para usar todos los núcleos disponibles
grid_search.fit(X_train_scaled, y_train)
print("Mejores parámetros con GridSearchCV:", grid_search.best_params_)

# Evaluación sobre el conjunto de prueba
grid_pred = grid_search.predict(X_test_scaled)
print("Precisión de GridSearchCV:", accuracy_score(y_test, grid_pred))

# Random Search
random_search = RandomizedSearchCV(log_reg, param_distributions=param_dist, n_iter=100, cv=5, n_jobs=-1)
random_search.fit(X_train_scaled, y_train)
print("Mejores parámetros con RandomizedSearchCV:", random_search.best_params_)

# Evaluación sobre el conjunto de prueba
random_pred = random_search.predict(X_test_scaled)
print("Precisión de RandomizedSearchCV:", accuracy_score(y_test, random_pred))


Mejores parámetros con GridSearchCV: {'C': 1, 'max_iter': 100, 'penalty': 'l2', 'solver': 'lbfgs'}
Precisión de GridSearchCV: 1.0
Mejores parámetros con RandomizedSearchCV: {'C': np.float64(9.967183759458713), 'max_iter': 100, 'penalty': 'l2', 'solver': 'lbfgs'}
Precisión de RandomizedSearchCV: 1.0


### Support Vector Machine (SVM)


In [4]:
from sklearn.svm import SVC
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV, RandomizedSearchCV
from scipy.stats import uniform

# Cargar el conjunto de datos Iris
data = load_iris()
X = data.data
y = data.target

# Dividir los datos en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Parámetros para GridSearchCV
param_grid = {
    'C': [0.1, 1, 10],
    'kernel': ['linear', 'rbf'],
    'gamma': ['scale', 'auto']
}

# Parámetros para RandomizedSearchCV
param_dist = {
    'C': uniform(0.1, 10),
    'kernel': ['linear', 'rbf'],
    'gamma': ['scale', 'auto']
}

# Crear el clasificador SVC
svc = SVC()

# Grid Search
grid_search = GridSearchCV(svc, param_grid, cv=5)
grid_search.fit(X_train, y_train)
print("Mejores parámetros con GridSearchCV:", grid_search.best_params_)

# Random Search
random_search = RandomizedSearchCV(svc, param_distributions=param_dist, n_iter=100, cv=5)
random_search.fit(X_train, y_train)
print("Mejores parámetros con RandomizedSearchCV:", random_search.best_params_)


Mejores parámetros con GridSearchCV: {'C': 1, 'gamma': 'scale', 'kernel': 'linear'}
Mejores parámetros con RandomizedSearchCV: {'C': np.float64(5.025793692495713), 'gamma': 'scale', 'kernel': 'linear'}


### Random Forest (Clasificación y Regresión)

In [10]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV, RandomizedSearchCV
from scipy.stats import randint

# Cargar el conjunto de datos Iris
data = load_iris()
X = data.data
y = data.target

# Dividir los datos en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Parámetros para GridSearchCV
param_grid = {
    'n_estimators': [50, 100, 150],
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': [2, 5, 10],
    'min_samples_leaf': [1, 2, 4],
    'max_features': ['sqrt', 'log2', None]  # Eliminado 'auto', ahora solo se usan valores válidos
}

# Parámetros para RandomizedSearchCV
param_dist = {
    'n_estimators': randint(50, 200),
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': randint(2, 10),
    'min_samples_leaf': randint(1, 10),
    'max_features': ['sqrt', 'log2', None]  # Asegúrate de usar solo valores válidos
}

# Crear el clasificador RandomForest
rf = RandomForestClassifier(random_state=42)  # Agregado random_state para reproducibilidad

# Grid Search
grid_search = GridSearchCV(rf, param_grid, cv=5, n_jobs=-1, verbose=1)
grid_search.fit(X_train, y_train)
print("Mejores parámetros con GridSearchCV:", grid_search.best_params_)
print("Mejor precisión con GridSearchCV:", grid_search.best_score_)

# Random Search
random_search = RandomizedSearchCV(rf, param_distributions=param_dist, n_iter=100, cv=5, n_jobs=-1, verbose=1, random_state=42)
random_search.fit(X_train, y_train)
print("Mejores parámetros con RandomizedSearchCV:", random_search.best_params_)
print("Mejor precisión con RandomizedSearchCV:", random_search.best_score_)

# Evaluación en el conjunto de test
print("Precisión en el conjunto de prueba con GridSearchCV:", grid_search.score(X_test, y_test))
print("Precisión en el conjunto de prueba con RandomizedSearchCV:", random_search.score(X_test, y_test))


Fitting 5 folds for each of 324 candidates, totalling 1620 fits
Mejores parámetros con GridSearchCV: {'max_depth': None, 'max_features': 'sqrt', 'min_samples_leaf': 2, 'min_samples_split': 2, 'n_estimators': 150}
Mejor precisión con GridSearchCV: 0.9583333333333334
Fitting 5 folds for each of 100 candidates, totalling 500 fits
Mejores parámetros con RandomizedSearchCV: {'max_depth': 10, 'max_features': 'sqrt', 'min_samples_leaf': 3, 'min_samples_split': 2, 'n_estimators': 142}
Mejor precisión con RandomizedSearchCV: 0.9583333333333334
Precisión en el conjunto de prueba con GridSearchCV: 1.0
Precisión en el conjunto de prueba con RandomizedSearchCV: 1.0
