# Scikit-learn - Fundamentos Básicos

Este notebook cubre los conceptos básicos de scikit-learn: importación, datasets integrados y estructura básica de trabajo con modelos.

## Importar Scikit-learn


In [None]:
import sklearn
from sklearn import datasets
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt


## Datasets Integrados


In [None]:
# Datasets de clasificación
iris = datasets.load_iris()          # Clasificación multiclase (3 clases)
wine = datasets.load_wine()          # Clasificación multiclase
digits = datasets.load_digits()      # Clasificación multiclase (imágenes)

# Datasets de regresión
boston = datasets.fetch_california_housing()  # Regresión (precio de casas)
diabetes = datasets.load_diabetes()  # Regresión (progresión de diabetes)

# Datasets sintéticos
X, y = datasets.make_classification(n_samples=100, n_features=20, n_informative=2, n_redundant=2, random_state=42)
X_reg, y_reg = datasets.make_regression(n_samples=100, n_features=1, noise=10, random_state=42)

# Estructura de un dataset
print("Características (X):", iris.data.shape)
print("Etiquetas (y):", iris.target.shape)
print("Nombres de características:", iris.feature_names)
print("Nombres de clases:", iris.target_names)


## Estructura Básica de Trabajo


In [None]:
# 1. Importar el modelo
from sklearn.linear_model import LogisticRegression

# 2. Cargar/preparar datos
X, y = datasets.load_iris(return_X_y=True)

# 3. Dividir datos (train/test split)
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 4. Crear y entrenar el modelo
model = LogisticRegression(random_state=42)
model.fit(X_train, y_train)

# 5. Hacer predicciones
y_pred = model.predict(X_test)

# 6. Evaluar el modelo
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, y_pred)
print(f"Precisión: {accuracy:.4f}")


## Versión de Scikit-learn


In [None]:
print(f"Versión de scikit-learn: {sklearn.__version__}")
