## 1. Importaci√≥n de librer√≠as y cargado de datos

In [None]:
import pandas as pd
import numpy as np

print(F"Importaci√≥n ok. Versi√≥n de Pandas instalada = {pd.__version__}")
print(F"Importaci√≥n ok. Versi√≥n de NumPy instalada = {np.__version__}")

In [None]:
df = pd.read_csv("datos_ejemplo.csv")
df

In [None]:
print("üìä DATOS ORIGINALES")
print(df.head())
print(f"\nShape: {df.shape}")

## 2. Indexaci√≥n Jer√°rquica

In [None]:
# Crear √≠ndice jer√°rquico con Regi√≥n y Producto
df_jerarquico = df.set_index(['Regi√≥n', 'Producto']).sort_index()  # ‚úÖ Ordenar el √≠ndice
print("DataFrame con √≠ndice jer√°rquico (Regi√≥n, Producto):")
df_jerarquico.head(8)

In [None]:
# Acceso a datos espec√≠ficos
print("\nüìç Acceso a datos del Centro:")
df_jerarquico.loc['Centro']

In [None]:
print("\nüìç Acceso espec√≠fico - Centro, Producto A:")
df_jerarquico.loc[('Centro', 'A')]

## 3. Agrupamiento de datos con groupby()

In [None]:
# Agrupamiento b√°sico por regi√≥n
print("üí∞ Ventas totales por regi√≥n:")
ventas_region = df.groupby('Regi√≥n')['Ventas'].sum()
print(ventas_region)

In [None]:
print("\nüì¶ Estad√≠sticas de unidades por producto:")
stats_producto = df.groupby('Producto')['Unidades'].agg(['mean', 'sum', 'count', 'min', 'max'])
print(stats_producto)

In [None]:
print("\nüìÖ Ventas promedio por mes:")
    ventas_mes = df.groupby('Mes')['Ventas'].mean().round(2)
print(ventas_mes)

In [None]:
# Aplicar m√∫ltiples funciones a la vez
print("üìä An√°lisis completo por regi√≥n:")
analisis_region = df.groupby('Regi√≥n').agg({
    'Ventas': ['sum', 'mean', 'count'],
    'Unidades': ['sum', 'max', 'min']
}).round(2)
print(analisis_region)

In [None]:
print("\nüìà Resumen por producto:")
resumen_producto = df.groupby('Producto').agg({
    'Ventas': ['sum', 'mean'],
    'Unidades': 'sum'
}).round(2)
print(resumen_producto)

## 4. Pivoteo de datos

In [None]:
# Crear tabla pivote: Regiones vs Productos (suma de ventas)
print("üîÑ Tabla pivote - Ventas por Regi√≥n y Producto:")
pivot_ventas = df.groupby(['Regi√≥n', 'Producto'])['Ventas'].sum().unstack(fill_value=0)
print(pivot_ventas)

In [None]:
print("\nüîÑ Tabla pivote - Unidades por Mes y Regi√≥n:")
pivot_unidades = df.groupby(['Mes', 'Regi√≥n'])['Unidades'].sum().unstack(fill_value=0)
print(pivot_unidades)

## 5. Despivoteo de datos

In [None]:
# Despivotear la tabla anterior
print("üîÑ Despivoteo de la tabla de ventas:")
df_melted = pivot_ventas.reset_index().melt(
    id_vars=['Regi√≥n'],
    var_name='Producto',
    value_name='Ventas_Total'
)
print(df_melted[df_melted['Ventas_Total'] > 0])  # Solo mostrar valores > 0

In [None]:
print("\nüîÑ Despivoteo completo del DataFrame original:")
df_melt_completo = df.melt(
    id_vars=['Regi√≥n', 'Producto', 'Mes'],
    value_vars=['Ventas', 'Unidades'],
    var_name='M√©trica',
    value_name='Valor'
)
print(df_melt_completo.head(8))

## 6. Combinaci√≥n de datos

In [None]:
# Crear DataFrames adicionales para demostrar combinaciones
df1 = df[df['Regi√≥n'] == 'Centro'][['Regi√≥n', 'Producto', 'Ventas']].head(3)
df2 = df[df['Regi√≥n'] == 'Norte'][['Regi√≥n', 'Producto', 'Ventas']].head(3)

print("DataFrame 1 (Centro):")
print(df1)
print("\nDataFrame 2 (Norte):")
print(df2)

In [None]:
# CONCATENACI√ìN
print("\nCONCATENACI√ìN con concat():")
df_concat = pd.concat([df1, df2], ignore_index=True)
print(df_concat)

In [None]:
# Crear DataFrame de informaci√≥n adicional para merge
info_productos = pd.DataFrame({
    'Producto': ['A', 'B', 'C'],
    'Categor√≠a': ['Electr√≥nicos', 'Ropa', 'Hogar'],
    'Precio_Unitario': [25.50, 80.00, 45.75]
})

print("DataFrame de informaci√≥n de productos:")
print(info_productos)

In [None]:
# MERGE - diferentes tipos de uniones
print("\nMERGE - Uni√≥n INNER:")
df_inner = df.merge(info_productos, on='Producto', how='inner')
print(df_inner[['Regi√≥n', 'Producto', 'Ventas', 'Categor√≠a', 'Precio_Unitario']].head(5))

In [None]:
print("\nMERGE - Uni√≥n LEFT:")
df_left = df.merge(info_productos, on='Producto', how='left')
print(f"Filas originales: {len(df)}, Filas despu√©s del merge: {len(df_left)}")

In [None]:
# Ejemplo pr√°ctico: Calcular ingresos totales
print("\nEJEMPLO PR√ÅCTICO - C√°lculo de ingresos:")
df_ingresos = df.merge(info_productos, on='Producto', how='left')
df_ingresos['Ingresos_Calculados'] = df_ingresos['Unidades'] * df_ingresos['Precio_Unitario']
df_ingresos[['Regi√≥n', 'Producto', 'Mes', 'Ventas', 'Unidades', 'Precio_Unitario', 'Ingresos_Calculados']].head()