### 🎯 Objetivos del ejercicio:

1. Leer ambos archivos CSV en DataFrames separados.
2. Mostrar las primeras 3 filas de cada DataFrame.
3. Unir los DataFrames usando la columna `ID` para enriquecer los datos de ventas.
4. Calcular el ingreso por venta (`Cantidad × Precio Unitario`) y agregarlo como una nueva columna llamada `Ingreso`.
5. Obtener el ingreso total de la tienda.
6. Mostrar la cantidad de ventas por país.
7. Determinar qué **grupo de edad** (por rangos: `<25`, `25–34`, `35+`) generó más ingresos.
8. Encontrar el producto más vendido **por género del cliente**.
9. Agrupar las ventas por mes y país, mostrando el total de ingresos por grupo.
10. Guardar el DataFrame resultante con la información completa en un archivo llamado `ventas_enriquecidas.csv`.

In [19]:
import pandas as pd

ventas = pd.read_csv("datos/ventas.csv")
clientes = pd.read_csv("datos/clientes.csv")


In [20]:
# Mostrar las primeras 3 filas de cada DF

print("Ventas - primeras 3 filas:")
print(ventas.head(3))

Ventas - primeras 3 filas:
   ID       Fecha  Producto Categoría  Cantidad  Precio Unitario
0   0  2025-01-06   Bufanda      ropa         1            32.62
1   1  2025-05-12   Bufanda      ropa         2            93.76
2   2  2025-04-28  Camiseta   calzado         1            29.70


In [21]:
print("Clientes - primeras filas:")
print(clientes.head(3))

Clientes - primeras filas:
   ID   Nombre  Edad     Genero                       Pais
0   0   Alexis    57   Femenino                      Yemen
1   1    Emily    36  Masculino                    Estonia
2   2  Jessica    59   Femenino  Saint Pierre and Miquelon


In [22]:
# Unir los dos dataframes

combinado = pd.merge(ventas, clientes, on="ID")

print(combinado)

      ID       Fecha   Producto   Categoría  Cantidad  Precio Unitario  \
0      0  2025-01-06    Bufanda        ropa         1            32.62   
1      1  2025-05-12    Bufanda        ropa         2            93.76   
2      2  2025-04-28   Camiseta     calzado         1            29.70   
3      3  2025-11-26   Chaqueta        ropa         5            25.81   
4      4  2025-12-22  Sandalias     calzado         3            48.31   
..   ...         ...        ...         ...       ...              ...   
995  995  2025-03-31   Pantalón     calzado         3            10.65   
996  996  2025-11-30   Camiseta     calzado         1            14.04   
997  997  2025-05-07    Bufanda        ropa         2            95.70   
998  998  2025-02-15   Sombrero  accesorios         5            91.40   
999  999  2025-02-15  Sandalias     calzado         5            64.20   

       Nombre  Edad     Genero                                          Pais  
0      Alexis    57   Femenino  

In [24]:
# Crear columna Ingresos = Cantidad * Precio

combinado["Ingreso"] = combinado["Cantidad"] * combinado["Precio Unitario"]

combinado.head()

Unnamed: 0,ID,Fecha,Producto,Categoría,Cantidad,Precio Unitario,Nombre,Edad,Genero,Pais,Ingreso
0,0,2025-01-06,Bufanda,ropa,1,32.62,Alexis,57,Femenino,Yemen,32.62
1,1,2025-05-12,Bufanda,ropa,2,93.76,Emily,36,Masculino,Estonia,187.52
2,2,2025-04-28,Camiseta,calzado,1,29.7,Jessica,59,Femenino,Saint Pierre and Miquelon,29.7
3,3,2025-11-26,Chaqueta,ropa,5,25.81,Jake,38,Femenino,South Georgia and the South Sandwich Islands,129.05
4,4,2025-12-22,Sandalias,calzado,3,48.31,Angela,52,Masculino,Saint Barthelemy,144.93


In [28]:
# Ingreso total de la tienda

ingreso_total = combinado["Ingreso"].sum()

print(f"Ingreso total de la tienda: USD {ingreso_total:.2f}")

Ingreso total de la tienda: USD 165345.50


In [30]:
# Cantidad de ventas por país

ventas_por_pais = combinado.groupby("Pais")["Cantidad"].sum().reset_index(name="Cantidad de Ventas")
print("Cantidad de ventas por pais:")
print(ventas_por_pais)

Cantidad de ventas por pais:
                  Pais  Cantidad de Ventas
0          Afghanistan                   7
1              Albania                  12
2              Algeria                  18
3       American Samoa                  10
4              Andorra                  12
..                 ...                 ...
234  Wallis and Futuna                  15
235     Western Sahara                   8
236              Yemen                  26
237             Zambia                   6
238           Zimbabwe                  13

[239 rows x 2 columns]


In [34]:
# Clasificar edades en grupos y calcular ingresos por grupo

bins = [0,24,35, float('inf')]
labels = ['<25', '25-34', '35+']

combinado["Grupo Edad"] = pd.cut(combinado["Edad"], bins=bins, labels=labels)

combinado.head()

Unnamed: 0,ID,Fecha,Producto,Categoría,Cantidad,Precio Unitario,Nombre,Edad,Genero,Pais,Ingreso,Grupo Edad
0,0,2025-01-06,Bufanda,ropa,1,32.62,Alexis,57,Femenino,Yemen,32.62,35+
1,1,2025-05-12,Bufanda,ropa,2,93.76,Emily,36,Masculino,Estonia,187.52,35+
2,2,2025-04-28,Camiseta,calzado,1,29.7,Jessica,59,Femenino,Saint Pierre and Miquelon,29.7,35+
3,3,2025-11-26,Chaqueta,ropa,5,25.81,Jake,38,Femenino,South Georgia and the South Sandwich Islands,129.05,35+
4,4,2025-12-22,Sandalias,calzado,3,48.31,Angela,52,Masculino,Saint Barthelemy,144.93,35+


In [35]:
ingreso_por_grupo_edad = combinado.groupby("Grupo Edad")["Ingreso"].sum().reset_index()

print("Ingresos por grupo de edad:")
print(ingreso_por_grupo_edad)

Ingresos por grupo de edad:
  Grupo Edad    Ingreso
0        <25   21690.42
1      25-34   34335.58
2        35+  109319.50


  ingreso_por_grupo_edad = combinado.groupby("Grupo Edad")["Ingreso"].sum().reset_index()


In [38]:
# Producto más vendido por género

ventas_por_producto_genero = combinado.groupby(["Genero", "Producto"])["Cantidad"].sum().reset_index()

producto_mas_vendido = ventas_por_producto_genero.sort_values(["Genero", "Cantidad"], ascending=[True,False]).drop_duplicates('Genero')

print("Producto más vendido por género")
print(producto_mas_vendido)

Producto más vendido por género
       Genero   Producto  Cantidad
5    Femenino  Sandalias       212
13  Masculino  Sandalias       245


In [40]:
# Ingresos por mes y país

combinado["Fecha"] = pd.to_datetime(combinado["Fecha"])
combinado["Mes"] = combinado["Fecha"].dt.to_period('M')

ingreso_mensuales_por_pais = combinado.groupby(["Mes", "Pais"])["Ingreso"].sum().reset_index()

print("Ingresos mensuales por país")
print(ingreso_mensuales_por_pais)

Ingresos mensuales por país
         Mes                                  Pais  Ingreso
0    2025-01                           Afghanistan   233.46
1    2025-01                               Albania    13.33
2    2025-01                               Austria   214.62
3    2025-01                               Belarus   251.23
4    2025-01                               Belgium   287.40
..       ...                                   ...      ...
848  2025-12                                Tuvalu    36.99
849  2025-12  United States Minor Outlying Islands    26.48
850  2025-12                            Uzbekistan   321.65
851  2025-12                               Vietnam    75.85
852  2025-12                                Zambia    64.10

[853 rows x 3 columns]


In [41]:
# Guardar el df combinado como un nuevo csv

combinado.to_csv('datos/ventas_combinado.csv', index=False)