# Módulo 0: Fundamentos de POO aplicados a Pandas

## 🎯 Objetivos de Aprendizaje

En este módulo aprenderás:
- Comprender Pandas como una biblioteca orientada a objetos
- Identificar las clases principales de Pandas
- Entender la jerarquía de herencia en Pandas
- Reconocer atributos y métodos en objetos de Pandas
- Explorar la composición de objetos en Pandas

---

## 📚 Introducción

**Pandas** no es solo una herramienta para análisis de datos; es un excelente ejemplo de diseño de software orientado a objetos. Cada estructura de datos en Pandas (Series, DataFrame, Index) es una **clase** con:

- **Atributos**: propiedades que describen el objeto
- **Métodos**: funcionalidades que el objeto puede ejecutar
- **Herencia**: relaciones entre clases
- **Encapsulamiento**: control de acceso a datos internos


In [2]:
# Importar bibliotecas necesarias
import pandas as pd
import numpy as np

# Importar funciones auxiliares del módulo
from modulo_0_fundamentos_poo import (
    explorar_objeto, 
    mostrar_atributos_publicos,
    mostrar_metodos_especiales
)

print(f"Pandas versión: {pd.__version__}")


Pandas versión: 2.3.3


## 1. Todo en Pandas es un Objeto

En Python, **todo es un objeto**. Cuando creamos una Serie o un DataFrame, estamos **instanciando** una clase.


In [4]:
# Crear una Series - esto es INSTANCIAR la clase Series
mi_serie = pd.Series([10, 20, 30, 40, 50], name='ventas')

# Verificar que es un objeto de la clase Series
print(f"Tipo: {type(mi_serie)}")
print(f"Clase: {mi_serie.__class__.__name__}")
print(f"Es una instancia de Series: {isinstance(mi_serie, pd.Series)}")

print("\nContenido:")
print(mi_serie)


Tipo: <class 'pandas.core.series.Series'>
Clase: Series
Es una instancia de Series: True

Contenido:
0    10
1    20
2    30
3    40
4    50
Name: ventas, dtype: int64


## 2. Explorando la Jerarquía de Herencia

En POO, las clases pueden **heredar** de otras clases. Pandas usa herencia para compartir funcionalidad entre sus estructuras de datos.


In [5]:
# Explorar la jerarquía de herencia (MRO - Method Resolution Order)
print("Jerarquía de herencia de Series:")
print("-" * 50)
for i, clase in enumerate(pd.Series.__mro__):
    print(f"{i}. {clase}")


Jerarquía de herencia de Series:
--------------------------------------------------
0. <class 'pandas.core.series.Series'>
1. <class 'pandas.core.base.IndexOpsMixin'>
2. <class 'pandas.core.arraylike.OpsMixin'>
3. <class 'pandas.core.generic.NDFrame'>
4. <class 'pandas.core.base.PandasObject'>
5. <class 'pandas.core.accessor.DirNamesMixin'>
6. <class 'pandas.core.indexing.IndexingMixin'>
7. <class 'object'>


### 💡 Concepto Clave: NDFrame

**NDFrame** es la clase base de la que heredan tanto `Series` como `DataFrame`. Proporciona métodos compartidos como:
- `head()`, `tail()`
- `describe()`
- `sum()`, `mean()`, `std()`
- `copy()`
- `info()`

Esto es un ejemplo de **herencia** y **reutilización de código**.


In [7]:
# Verificar herencia de NDFrame
print(f"Series hereda de NDFrame: {isinstance(mi_serie, pd.core.generic.NDFrame)}")

# Crear un DataFrame
mi_df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(f"DataFrame hereda de NDFrame: {isinstance(mi_df, pd.core.generic.NDFrame)}")
print(f"DataFrame hereda de Series: {isinstance(mi_df, pd.Series)}")

# Ambos comparten métodos de NDFrame
print("\nMétodos compartidos (heredados de NDFrame):")
print("mi_serie.head():", type(mi_serie.head()))
print("mi_df.head():", type(mi_df.head()))


Series hereda de NDFrame: True
DataFrame hereda de NDFrame: True
DataFrame hereda de Series: False

Métodos compartidos (heredados de NDFrame):
mi_serie.head(): <class 'pandas.core.series.Series'>
mi_df.head(): <class 'pandas.core.frame.DataFrame'>


## 3. Atributos de Objetos

Los **atributos** son propiedades que describen el estado de un objeto. En Pandas, cada estructura tiene atributos específicos.


In [8]:
# Atributos de una Series
print("Atributos importantes de Series:")
print("-" * 50)
print(f"values: {mi_serie.values}")  # Array de valores
print(f"index: {mi_serie.index}")    # Índice
print(f"dtype: {mi_serie.dtype}")    # Tipo de datos
print(f"name: {mi_serie.name}")      # Nombre de la serie
print(f"shape: {mi_serie.shape}")    # Forma (dimensiones)
print(f"size: {mi_serie.size}")      # Número de elementos
print(f"ndim: {mi_serie.ndim}")      # Número de dimensiones


Atributos importantes de Series:
--------------------------------------------------
values: [10 20 30 40 50]
index: RangeIndex(start=0, stop=5, step=1)
dtype: int64
name: ventas
shape: (5,)
size: 5
ndim: 1


In [9]:
# Atributos de un DataFrame
print("\nAtributos importantes de DataFrame:")
print("-" * 50)
print(f"values:\n{mi_df.values}")      # Array 2D de valores
print(f"\nindex: {mi_df.index}")       # Índice de filas
print(f"columns: {mi_df.columns}")     # Nombres de columnas
print(f"dtypes:\n{mi_df.dtypes}")      # Tipos de cada columna
print(f"\nshape: {mi_df.shape}")       # (filas, columnas)
print(f"size: {mi_df.size}")           # Total de elementos
print(f"ndim: {mi_df.ndim}")           # Número de dimensiones



Atributos importantes de DataFrame:
--------------------------------------------------
values:
[[1 4]
 [2 5]
 [3 6]]

index: RangeIndex(start=0, stop=3, step=1)
columns: Index(['A', 'B'], dtype='object')
dtypes:
A    int64
B    int64
dtype: object

shape: (3, 2)
size: 6
ndim: 2


## 4. Métodos de Objetos

Los **métodos** son funciones que pertenecen a un objeto y pueden realizar operaciones sobre él.


In [10]:
# Métodos de Series
print("Ejemplos de métodos de Series:")
print("-" * 50)

# Métodos estadísticos
print(f"Suma: {mi_serie.sum()}")
print(f"Media: {mi_serie.mean()}")
print(f"Máximo: {mi_serie.max()}")
print(f"Mínimo: {mi_serie.min()}")

# Métodos de transformación
print(f"\nMultiplicar por 2:\n{mi_serie.mul(2)}")

# Métodos de información
print(f"\nDescripción estadística:\n{mi_serie.describe()}")


Ejemplos de métodos de Series:
--------------------------------------------------
Suma: 150
Media: 30.0
Máximo: 50
Mínimo: 10

Multiplicar por 2:
0     20
1     40
2     60
3     80
4    100
Name: ventas, dtype: int64

Descripción estadística:
count     5.000000
mean     30.000000
std      15.811388
min      10.000000
25%      20.000000
50%      30.000000
75%      40.000000
max      50.000000
Name: ventas, dtype: float64


### 💡 Concepto Clave: Métodos de Instancia

Los métodos que hemos usado (`sum()`, `mean()`, `describe()`) son **métodos de instancia**: operan sobre una instancia específica del objeto.

```python
mi_serie.sum()  # suma los valores de ESTA instancia de Serie
```


## 5. Composición: DataFrame como colección de Series

Un concepto importante de POO es la **composición**: un objeto que contiene otros objetos.

En Pandas:
- Un **DataFrame** está compuesto por múltiples **Series**
- Cada columna de un DataFrame es una Serie independiente


In [11]:
# Crear un DataFrame
df = pd.DataFrame({
    'nombre': ['Ana', 'Luis', 'María', 'Carlos'],
    'edad': [25, 30, 28, 35],
    'salario': [30000, 45000, 38000, 52000]
})

print("DataFrame completo:")
print(df)
print(f"\nTipo del DataFrame: {type(df)}")


DataFrame completo:
   nombre  edad  salario
0     Ana    25    30000
1    Luis    30    45000
2   María    28    38000
3  Carlos    35    52000

Tipo del DataFrame: <class 'pandas.core.frame.DataFrame'>


In [12]:
# Acceder a una columna - esto retorna una Series
columna_edad = df['edad']

print("Columna 'edad':")
print(columna_edad)
print(f"\nTipo de la columna: {type(columna_edad)}")
print(f"Es una Series: {isinstance(columna_edad, pd.Series)}")

# La columna tiene todos los atributos y métodos de Series
print(f"\nMedia de edad: {columna_edad.mean()}")
print(f"Nombre de la serie: {columna_edad.name}")


Columna 'edad':
0    25
1    30
2    28
3    35
Name: edad, dtype: int64

Tipo de la columna: <class 'pandas.core.series.Series'>
Es una Series: True

Media de edad: 29.5
Nombre de la serie: edad


In [13]:
# Iterar por las columnas (cada una es una Serie)
print("\nIterando por columnas del DataFrame:")
print("-" * 50)
for nombre_columna in df.columns:
    columna = df[nombre_columna]
    print(f"{nombre_columna}:")
    print(f"  Tipo: {type(columna).__name__}")
    print(f"  dtype: {columna.dtype}")
    print(f"  shape: {columna.shape}")



Iterando por columnas del DataFrame:
--------------------------------------------------
nombre:
  Tipo: Series
  dtype: object
  shape: (4,)
edad:
  Tipo: Series
  dtype: int64
  shape: (4,)
salario:
  Tipo: Series
  dtype: int64
  shape: (4,)


## 6. Explorando con dir() y help()

Python proporciona funciones útiles para explorar objetos:


In [14]:
# dir() lista todos los atributos y métodos
atributos = dir(mi_serie)
print(f"Total de atributos y métodos: {len(atributos)}")
print(f"\nPrimeros 10: {atributos[:10]}")

# Filtrar solo métodos públicos (sin _)
publicos = [attr for attr in atributos if not attr.startswith('_')]
print(f"\nMétodos públicos: {len(publicos)}")
print(f"Algunos ejemplos: {publicos[:15]}")


Total de atributos y métodos: 421

Primeros 10: ['T', '_AXIS_LEN', '_AXIS_ORDERS', '_AXIS_TO_AXIS_NUMBER', '_HANDLED_TYPES', '__abs__', '__add__', '__and__', '__annotations__', '__array__']

Métodos públicos: 205
Algunos ejemplos: ['T', 'abs', 'add', 'add_prefix', 'add_suffix', 'agg', 'aggregate', 'align', 'all', 'any', 'apply', 'argmax', 'argmin', 'argsort', 'array']


In [15]:
# help() muestra la documentación (comentar para no saturar la salida)
# Descomentar para ver la documentación completa
# help(mi_serie.sum)

# Alternativa: ver solo la firma del método
import inspect
print("Firma del método sum():")
print(inspect.signature(mi_serie.sum))


Firma del método sum():
(axis: 'Axis | None' = None, skipna: 'bool' = True, numeric_only: 'bool' = False, min_count: 'int' = 0, **kwargs)


## 📚 Resumen del Módulo 0

### Conceptos clave aprendidos:

1. **Pandas es POO**: Cada estructura (Series, DataFrame, Index) es una clase
2. **Herencia**: Series y DataFrame heredan de `NDFrame`
3. **Atributos**: Propiedades que describen el estado (`values`, `index`, `dtype`, etc.)
4. **Métodos**: Funciones que operan sobre el objeto (`sum()`, `mean()`, etc.)
5. **Composición**: DataFrame está compuesto por Series
6. **Exploración**: Usar `type()`, `isinstance()`, `dir()`, `help()` para entender objetos

### Tabla de correspondencia POO ↔ Pandas:

| Concepto POO | En Pandas |
|--------------|-----------|
| Clase | `pd.Series`, `pd.DataFrame`, `pd.Index` |
| Instancia | `mi_serie = pd.Series([1,2,3])` |
| Atributo | `mi_serie.values`, `mi_serie.dtype` |
| Método | `mi_serie.sum()`, `mi_serie.mean()` |
| Herencia | `Series` y `DataFrame` heredan de `NDFrame` |
| Composición | `DataFrame` contiene múltiples `Series` |

---

**Próximo módulo**: Profundizaremos en la clase **Series** como objeto fundamental de Pandas.
