# üß† NumPy + Pandas desde la POO

En esta notebook vamos a construir una clase para modelar datos usando NumPy internamente y exponerlos con Pandas.

## üîß Importar librer√≠as

In [None]:
import numpy as np
import pandas as pd

## üë©‚Äçüíª Definimos una clase base que use NumPy internamente

In [None]:
class Dataset:
    """
    Clase que encapsula matrices de caracter√≠sticas y etiquetas usando NumPy.
    """
    def __init__(self, features: np.ndarray, labels: np.ndarray):
        assert features.shape[0] == labels.shape[0], "Mismatched rows entre X y y"
        self._X = features  # atributo protegido
        self._y = labels

    def shape(self):
        """Devuelve las dimensiones del dataset como tupla"""
        return self._X.shape, self._y.shape

    def to_pandas(self, feature_names=None, label_name="label") -> pd.DataFrame:
        """
        Interoperabilidad con Pandas: retorna un DataFrame con columnas nombradas.
        """
        # nombres de columnas para caracter√≠sticas
        n_features = self._X.shape[1]
        if feature_names is None:
            feature_names = [f"f{i}" for i in range(n_features)]
        # construimos el DataFrame
        df = pd.DataFrame(self._X, columns=feature_names)
        df[label_name] = self._y
        return df

## üß™ Crear datos sint√©ticos con NumPy

In [None]:
# par√°metros
n = 10
np.random.seed(0)

# matriz de caracter√≠sticas (10 filas x 3 columnas)
X = np.random.randn(n, 3)
# etiquetas binarias aleatorias
y = np.random.randint(0, 2, size=n)

print("X:", X.shape)
print("y:", y.shape)

## ‚ú® Instanciar la clase

In [None]:
ds = Dataset(X, y)
print(ds.shape())

## üìä Convertir a Pandas DataFrame

In [None]:
df = ds.to_pandas(feature_names=["altura", "peso", "edad"], label_name="clase")
df

## üßæ Ejemplo de operaciones con Pandas

Una vez tenemos el DataFrame podemos usar todo el poder de Pandas:

In [None]:
# filtrar por clase == 1
df_clase1 = df[df["clase"] == 1]
df_clase1

## üõ† Extender con m√°s m√©todos (POO)

Podemos a√±adir m√©todos a nuestra clase para calcular estad√≠sticas.

In [None]:
class Dataset:
    def __init__(self, features: np.ndarray, labels: np.ndarray):
        assert features.shape[0] == labels.shape[0]
        self._X = features
        self._y = labels

    def shape(self):
        return self._X.shape, self._y.shape

    def to_pandas(self, feature_names=None, label_name="label"):
        n_features = self._X.shape[1]
        if feature_names is None:
            feature_names = [f"f{i}" for i in range(n_features)]
        df = pd.DataFrame(self._X, columns=feature_names)
        df[label_name] = self._y
        return df

    def mean_per_feature(self) -> np.ndarray:
        """Devuelve el promedio de cada caracter√≠stica usando NumPy"""
        return self._X.mean(axis=0)

    def class_counts(self) -> dict:
        """Cuenta cu√°ntas muestras hay de cada etiqueta"""
        unique, counts = np.unique(self._y, return_counts=True)
        return dict(zip(unique, counts))

Ejemplo de uso de los nuevos m√©todos:

In [None]:
ds = Dataset(X, y)
print("Medias por feature:", ds.mean_per_feature())
print("Conteo por clase:", ds.class_counts())

## ‚úÖ Conclusi√≥n
Hemos mostrado c√≥mo:
- Dise√±ar una clase que encapsula estructuras de NumPy.
- Proveer interoperabilidad con Pandas (convertir a DataFrame).
- Extender la clase con m√©todos POO para estad√≠sticas.
- Luego reutilizar Pandas para filtrado, an√°lisis, etc.

üìå Esto enfatiza c√≥mo POO te permite construir abstracciones limpias que combinan **eficiencia** (NumPy) con **comodidad de an√°lisis** (Pandas).