# Funciones Más Utilizadas en NumPy y scikit-learn para Machine Learning

## **NumPy**

1. **`np.array()`** - Crea un array N-dimensional.
2. **`np.zeros()`** - Genera un array de ceros.
3. **`np.ones()`** - Genera un array de unos.
4. **`np.reshape()`** - Cambia la forma de un array sin alterar sus datos.
5. **`np.linspace()`** - Genera un array de valores equiespaciados en un rango dado.
6. **`np.arange()`** - Crea un array con un rango y un paso definidos.
7. **`np.random.rand()`** - Genera un array de valores aleatorios entre 0 y 1.
8. **`np.random.randn()`** - Genera un array de valores aleatorios siguiendo una distribución normal.
9. **`np.dot()`** - Calcula el producto punto de dos arrays.
10. **`np.matmul()`** - Realiza la multiplicación de matrices.
11. **`np.transpose()`** - Transpone un array.
12. **`np.sum()`** - Calcula la suma de elementos de un array.
13. **`np.mean()`** - Calcula el promedio de los elementos de un array.
14. **`np.std()`** - Calcula la desviación estándar de un array.
15. **`np.argmax()`** - Encuentra el índice del valor máximo en un array.
16. **`np.argmin()`** - Encuentra el índice del valor mínimo en un array.
17. **`np.concatenate()`** - Une dos o más arrays.
18. **`np.vstack()`** - Apila arrays verticalmente.
19. **`np.hstack()`** - Apila arrays horizontalmente.
20. **`np.linalg.inv()`** - Calcula la inversa de una matriz.
21. **`np.linalg.eig()`** - Calcula los valores y vectores propios de una matriz.
22. **`np.linalg.det()`** - Calcula el determinante de una matriz.

## **scikit-learn**

1. **`train_test_split()`** - (`sklearn.model_selection`)  
   Divide los datos en conjuntos de entrenamiento y prueba.

2. **`StandardScaler()`** - (`sklearn.preprocessing`)  
   Normaliza características restando la media y dividiendo por la desviación estándar.

3. **`MinMaxScaler()`** - (`sklearn.preprocessing`)  
   Escala las características a un rango específico, generalmente [0, 1].

4. **`PCA()`** - (`sklearn.decomposition`)  
   Reduce la dimensionalidad de los datos usando Análisis de Componentes Principales.

5. **`KMeans()`** - (`sklearn.cluster`)  
   Algoritmo de agrupamiento para dividir datos en grupos (clusters).

6. **`LinearRegression()`** - (`sklearn.linear_model`)  
   Implementa regresión lineal.

7. **`LogisticRegression()`** - (`sklearn.linear_model`)  
   Implementa regresión logística para clasificación.

8. **`DecisionTreeClassifier()`** - (`sklearn.tree`)  
   Algoritmo de clasificación basado en árboles de decisión.

9. **`RandomForestClassifier()`** - (`sklearn.ensemble`)  
   Algoritmo de clasificación basado en múltiples árboles de decisión (bosque aleatorio).

10. **`SVC()`** - (`sklearn.svm`)  
    Implementa un clasificador de soporte vectorial (Support Vector Classifier).

11. **`KNeighborsClassifier()`** - (`sklearn.neighbors`)  
    Clasificador basado en vecinos más cercanos.

12. **`cross_val_score()`** - (`sklearn.model_selection`)  
    Calcula la puntuación de validación cruzada.

13. **`GridSearchCV()`** - (`sklearn.model_selection`)  
    Busca los mejores hiperparámetros usando búsqueda en cuadrícula.

14. **`Pipeline()`** - (`sklearn.pipeline`)  
    Encadena transformaciones y modelos en una secuencia de pasos.

15. **`fit()`** - (`sklearn.base`)  
    Ajusta el modelo a los datos de entrenamiento (común en todos los modelos).

16. **`predict()`** - (`sklearn.base`)  
    Realiza predicciones con el modelo ajustado (común en todos los modelos).

17. **`score()`** - (`sklearn.base`)  
    Calcula la precisión del modelo (común en todos los modelos).

18. **`confusion_matrix()`** - (`sklearn.metrics`)  
    Genera la matriz de confusión para evaluar modelos de clasificación.

19. **`classification_report()`** - (`sklearn.metrics`)  
    Muestra un informe con métricas como precisión, recall y F1.

20. **`accuracy_score()`** - (`sklearn.metrics`)  
    Calcula la precisión de un modelo comparando predicciones y valores reales.


In [1]:
# Importar NumPy
import numpy as np

# Importar módulos específicos de scikit-learn
from sklearn.model_selection import train_test_split, cross_val_score, GridSearchCV
from sklearn.preprocessing import StandardScaler, MinMaxScaler
from sklearn.decomposition import PCA
from sklearn.cluster import KMeans
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.pipeline import Pipeline
from sklearn.metrics import confusion_matrix, classification_report, accuracy_score


# Plantilla para crear modelo compatible con scikit-learn

In [2]:
import numpy as np
from sklearn.base import BaseEstimator, ClassifierMixin
from sklearn.metrics import accuracy_score

class MiModelo(BaseEstimator, ClassifierMixin):
    def __init__(self, parametro1=1.0, parametro2=0.01):
        """
        Inicializa el modelo con hiperparámetros específicos.
        """
        self.parametro1 = parametro1
        self.parametro2 = parametro2
        self.entrenado = False

    def fit(self, X, y):
        """
        Ajusta el modelo a los datos de entrenamiento.
        :param X: np.array, matriz de características.
        :param y: np.array, vector de etiquetas.
        :return: self
        """
        # Aquí se incluye el código para entrenar el modelo usando los parámetros.
        # Por ejemplo, podríamos calcular coeficientes basados en X y y.
        self.coeficientes_ = np.dot(np.linalg.pinv(X), y)
        self.entrenado = True
        return self

    def predict(self, X):
        """
        Realiza predicciones usando el modelo entrenado.
        :param X: np.array, matriz de características para predicciones.
        :return: np.array, vector de predicciones.
        """
        if not self.entrenado:
            raise ValueError("El modelo no ha sido entrenado. Usa fit() primero.")
        # Aquí se realiza la predicción con los coeficientes calculados en fit()
        return np.dot(X, self.coeficientes_)

    def evaluate(self, X, y):
        """
        Evalúa el modelo usando precisión como métrica.
        :param X: np.array, matriz de características.
        :param y: np.array, vector de etiquetas reales.
        :return: float, precisión del modelo.
        """
        y_pred = self.predict(X)
        # Convertimos las predicciones a enteros (esto es solo un ejemplo)
        y_pred_rounded = np.round(y_pred)
        return accuracy_score(y, y_pred_rounded)

    def get_params(self, deep=True):
        """
        Retorna los parámetros del modelo. Necesario para usar GridSearchCV.
        """
        return {"parametro1": self.parametro1, "parametro2": self.parametro2}

    def set_params(self, **params):
        """
        Establece los parámetros del modelo. Necesario para usar GridSearchCV.
        """
        for key, value in params.items():
            setattr(self, key, value)
        return self
