
# Curso Completo de `pandas` en Python

Este notebook ha sido diseñado como un ejercicio introductorio a `pandas`, cubriendo paso a paso sus funcionalidades.

**Autor:** Nelson Zepeda
**Fecha:** 12/05/2025


## Carga de librerías y dataset de ejemplo

In [1]:
import pandas as pd
import numpy as np

# Creamos un DataFrame de ejemplo
df = pd.DataFrame({
    "Producto": ["Manzana", "Banano", "Peras", "Uvas", "Piña", "Sandía", "Melón"],
    "Precio": [0.5, 0.3, 0.7, 1.0, 1.2, 0.8, 0.9],
    "Cantidad": [100, 150, 80, 60, 40, 90, 50],
    "Categoría": ["Fruta", "Fruta", "Fruta", "Fruta", "Fruta Tropical", "Fruta Tropical", "Fruta Tropical"],
    "Fecha": pd.date_range(start="2023-01-01", periods=7, freq="D")
})
df.loc[2, "Precio"] = np.nan  # insertar un valor faltante
df


ModuleNotFoundError: No module named 'pandas'

## 1. Inspección de un DataFrame


Las siguientes funciones permiten examinar rápidamente la estructura y contenido de un DataFrame:

- `.head(n)`: muestra las primeras `n` filas.
- `.tail(n)`: muestra las últimas `n` filas.
- `.shape`: devuelve el número de filas y columnas.
- `.dtypes`: tipos de datos por columna.
- `.info()`: resumen general.
- `.describe()`: estadísticas resumen para columnas numéricas.


In [None]:

print(df.head())
print(df.tail(3))
print(df.shape)
print(df.dtypes)
df.info()
df.describe()


## 2. Partes de un DataFrame


Puedes acceder a diferentes partes de un DataFrame de varias maneras:

- Columnas: `df['columna']`
- Filas: `df.iloc[i]` o `df.loc[i]`
- Subconjuntos: combinando `iloc`, `loc`, o listas de columnas


In [None]:

# Acceder a una columna
df['Producto']

# Acceder a una fila
df.iloc[1]

# Subconjunto de columnas
df[['Producto', 'Precio']]


## 3. Ordenar y Subsetear

In [None]:

# Ordenar por precio
df.sort_values(by='Precio')

# Filtrar por condición
df[df['Cantidad'] > 80]


## 4. Subsetting por columnas, filas y variables categóricas

In [None]:

# Filtrar por categoría
df[df['Categoría'] == 'Fruta Tropical']

# Subconjunto de columnas específicas
df.loc[:, ['Producto', 'Precio']]

# Subconjunto de filas con condiciones múltiples
df[(df['Cantidad'] > 60) & (df['Precio'] < 1)]


## 5. Crear nuevas columnas

In [None]:

# Crear columna de valor total
df['Valor_Total'] = df['Precio'] * df['Cantidad']
df.head()


## 6. Estadísticas resumen

In [None]:

df['Precio'].mean()
df['Precio'].median()
df['Cantidad'].sum()
df['Cantidad'].min(), df['Cantidad'].max()


## 7. Agrupamientos con groupby

In [None]:

df.groupby("Categoría")["Valor_Total"].sum()
df.groupby("Categoría")[["Precio", "Cantidad"]].mean()


## 8. Manejo de Índices

In [None]:

df_indexed = df.set_index("Producto")
df_indexed.loc["Manzana"]
df_indexed.reset_index().head()


## 9. Manejo de valores faltantes

In [None]:

# Detectar
df.isnull().sum()

# Rellenar
df['Precio'] = df['Precio'].fillna(df['Precio'].mean())

# Eliminar filas con valores faltantes
df.dropna().head()


## 10. Exportación de resultados a CSV

In [None]:

# Exportar el DataFrame limpio
df.to_csv("datos_procesados.csv", index=False)
