🔍 Análisis y exploración de datos
| Herramienta                           | Uso                                                                                  |
| ------------------------------------- | ------------------------------------------------------------------------------------ |
| `df.describe()`                       | Estadísticas básicas de columnas numéricas                                           |
| `df.info()`                           | Tipos de datos, valores nulos y estructura general del DataFrame                     |
| `df.head()`                           | Muestra las primeras filas del DataFrame                                             |
| `bt.pinta_distribucion_categoricas()` | Visualiza la frecuencia de valores categóricos                                       |
| `df.hist()` / `plt.hist()`            | Histogramas de variables numéricas                                                   |
| `sns.regplot()`                       | Dispersión con línea de regresión (puede incluir regresión polinómica con `order=n`) |
                 |

📈 Visualización avanzada
| Herramienta                    | Uso                                                        |
| ------------------------------ | ---------------------------------------------------------- |
| `plt.scatter(X, y)`            | Muestra puntos en 2D (ideal para análisis visual de datos) |
| `plt.plot(X, y_pred)`          | Representa una línea de predicción o tendencia             |
| `plot_svc_decision_function()` | Muestra la frontera y márgenes en modelos SVM              |
| `ConfusionMatrixDisplay()`     | Visualiza matriz de confusión de clasificación             |

🧹 Preprocesamiento de datos
| Herramienta                         | Uso                                                     |
| ----------------------------------- | ------------------------------------------------------- |
| `MinMaxScaler()`                    | Escala numéricas a rango \[0, 1] (recomendado en KNN)   |
| `StandardScaler()`                  | Escalado estándar (media = 0, std = 1), útil para SVM   |
| `.drop("col", axis=1)`              | Elimina columnas irrelevantes o con muchos nulos        |
| `.apply(lambda x: ...)`             | Transformación personalizada de columnas                |
| `LabelEncoder()`                    | Codifica categorías en valores numéricos (solo para 1D) |
| `OneHotEncoder()`                   | Codificación para variables con múltiples categorías    |
| `.fit_transform()` / `.transform()` | Aplicación del escalado o codificación                  |

📦 Modelado con Scikit-learn
| Herramienta               | Uso                                                        |
| ------------------------- | ---------------------------------------------------------- |
| `train_test_split()`      | Divide el dataset en conjuntos de entrenamiento y test     |
| `KNeighborsClassifier()`  | Modelo KNN para clasificación                              |
| `LinearRegression()`      | Regresión lineal                                           |
| `PolynomialFeatures()`    | Genera features polinómicas                                |
| `SVC()`                   | Modelo SVM para clasificación                              |
| `SVR()`                   | SVM para regresión                                         |
| `.fit(X, y)`              | Entrena el modelo con los datos                            |
| `.predict(X)`             | Realiza predicciones                                       |
| `.score(X, y)`            | Evaluación básica (por defecto, accuracy en clasificación) |
| `classification_report()` | Muestra métricas como precisión, recall y F1-score         |

🧪 Validación y optimización de modelos
| Herramienta                      | Uso                                                              |
| -------------------------------- | ---------------------------------------------------------------- |
| `cross_val_score()`              | Validación cruzada para estabilidad del modelo                   |
| `GridSearchCV()`                 | Búsqueda de hiperparámetros óptimos                              |
| `param_grid = {...}`             | Diccionario con combinaciones de hiperparámetros para GridSearch |
| `.best_params_` / `.best_score_` | Extrae los mejores parámetros y su rendimiento del GridSearch    |

🧪 Generación de datos sintéticos (testing visual o enseñanza)
| Herramienta      | Uso                                                       |
| ---------------- | --------------------------------------------------------- |
| `make_blobs()`   | Genera clústeres de datos separables (ideal para SVM/KNN) |
| `make_circles()` | Genera datos no linealmente separables (kernel RBF, SVM)  |

🛠 Herramientas útiles para balanceo
| Herramienta               | Tipo           | Uso                                                   |
| ------------------------- | -------------- | ----------------------------------------------------- |
| `SMOTE()`                 | Over-sampling  | Genera datos sintéticos de clase minoritaria          |
| `RandomOverSampler()`     | Over-sampling  | Duplica ejemplos minoritarios aleatoriamente          |
| `ADASYN()`                | Over-sampling  | Como SMOTE, pero adaptativo (dificultad = + muestras) |
| `resample()`              | Under-sampling | Reduce número de muestras de la clase mayoritaria     |
| `class_weight='balanced'` | Ponderación    | Penaliza más errores en la clase minoritaria          |
