## 📊 Prueba Técnica
#### Jhojan Martínez Martin

Esta es mi solución para la prueba técnica para el puesto de analista. La solución la realicé de forma en que puedan ver mi metodologia  y un paso a paso de cómo lo hice. 

Muchas gracias por la oportunidad.

## 🔹 1. Cargar los Datos  
Se cargará el archivo **`datos_ventas.xlsx`**.  
Las columnas de interés son:  

- `ID_Venta`: Identificador único de la venta  
- `Fecha`: Fecha de la venta  
- `Producto`: Nombre del producto  
- `Cantidad`: Cantidad vendida  
- `Precio_Unitario`: Precio por unidad  
- `Total_Venta`: Monto total de la venta (puede tener valores faltantes)  
- `Vendedor`: Nombre del vendedor  

Luego procedemos a verificar si hay columnas con datos **faltantes**

In [57]:
import pandas as pd

In [58]:
df = pd.read_excel("datos_ventas.xlsx", sheet_name="Sheet1")
df = df.drop(columns=['ID_Cruce']) # No necesitamos esta columna

for colum in df.columns:
    if df[colum].isna().any():
        print(f"La columna {colum} le faltan datos")

La columna Total_Venta le faltan datos


## 🔹 2. Verificación y Manejo de Valores Faltantes.
Se identificarán y completarán valores faltantes (`NaN`) en la columna **Total_Venta**, calculándola como:  

    Total_Venta= Cantidad*Precio_Unitario


In [59]:
df['Total_Venta'] = df['Total_Venta'].fillna(df['Cantidad'] * df['Precio_Unitario'])

## 🔹 3. Conversión de la Columna Fecha  
La columna **Fecha** se convertirá a formato `datetime` para facilitar su manipulación.


In [60]:
df['Fecha'] = pd.to_datetime(df['Fecha'])

## 🔹 4. Filtrar las Ventas del Año 2023  
Se extraerán únicamente las ventas realizadas en el año **2023**.


In [61]:
df_2023 = df[df['Fecha'].dt.year == 2023]
df_2023

Unnamed: 0,ID_Venta,Fecha,Producto,Cantidad,Precio_Unitario,Total_Venta,Vendedor
0,1,2023-06-02,Monitor,3,669,2007.0,Elena
1,2,2023-12-16,Celular,3,172,516.0,Ana
2,3,2023-03-02,Monitor,5,765,3825.0,Elena
3,4,2023-03-19,Laptop,4,303,1212.0,Carlos
4,5,2023-01-24,Impresora,8,644,5152.0,David
...,...,...,...,...,...,...,...
95,96,2023-08-15,Monitor,7,138,966.0,Beatriz
96,97,2023-04-07,Laptop,10,222,2220.0,Beatriz
97,98,2023-07-11,Celular,9,1306,11754.0,Ana
98,99,2023-12-21,Laptop,4,1885,7540.0,Carlos


## 🔹 5. Agregar la Columna Mes  
Se añadirá una nueva columna **Mes** con el número del mes extraído de la columna `Fecha`. Además, se organizará la columna en la 2da posicion.


In [62]:
df['Mes'] = df['Fecha'].dt.month
col = df.pop('Mes') 
df.insert(2, 'Mes', col)
df

Unnamed: 0,ID_Venta,Fecha,Mes,Producto,Cantidad,Precio_Unitario,Total_Venta,Vendedor
0,1,2023-06-02,6,Monitor,3,669,2007.0,Elena
1,2,2023-12-16,12,Celular,3,172,516.0,Ana
2,3,2023-03-02,3,Monitor,5,765,3825.0,Elena
3,4,2023-03-19,3,Laptop,4,303,1212.0,Carlos
4,5,2023-01-24,1,Impresora,8,644,5152.0,David
...,...,...,...,...,...,...,...,...
95,96,2023-08-15,8,Monitor,7,138,966.0,Beatriz
96,97,2023-04-07,4,Laptop,10,222,2220.0,Beatriz
97,98,2023-07-11,7,Celular,9,1306,11754.0,Ana
98,99,2023-12-21,12,Laptop,4,1885,7540.0,Carlos


## 🔹 6. Cálculo del Total de Ventas  
Se calculará el total de ventas agrupado por:  
 - **Vendedor**  
 - **Mes**  


In [63]:
ventas_por_vendedor_mes = df.groupby(['Vendedor', 'Mes'])['Total_Venta'].sum().reset_index()
ventas_por_vendedor_mes

Unnamed: 0,Vendedor,Mes,Total_Venta
0,Ana,1,3927.0
1,Ana,2,23373.0
2,Ana,3,7452.0
3,Ana,4,3366.0
4,Ana,5,11752.0
5,Ana,6,4910.0
6,Ana,7,11754.0
7,Ana,8,17112.0
8,Ana,9,11782.0
9,Ana,10,22795.0


## 🔹 7. Generación de un Nuevo Archivo Excel  
Se guardará un archivo llamado **`resumen_ventas.xlsx`** con dos hojas:  

**"Resumen_Ventas"** :Total de ventas por vendedor.  
**"Ventas_Mensuales"** :Total de ventas por mes.  


In [64]:
ventas_por_vendedor = df.groupby('Vendedor')['Total_Venta'].sum().reset_index()
ventas_por_mes = df.groupby('Mes')['Total_Venta'].sum().reset_index()

with pd.ExcelWriter('resumen_ventas.xlsx', engine='xlsxwriter') as writer:
    ventas_por_vendedor.to_excel(writer, sheet_name='Resumen_Ventas', index=False)
    ventas_por_mes.to_excel(writer, sheet_name='Ventas_Mensuales', index=False)


In [65]:
resumen_ventas = pd.read_excel("resumen_ventas.xlsx", sheet_name="Resumen_Ventas")
datos_ventas = pd.read_excel("resumen_ventas.xlsx", sheet_name='Ventas_Mensuales')

In [66]:
resumen_ventas

Unnamed: 0,Vendedor,Total_Venta
0,Ana,141425
1,Beatriz,111286
2,Carlos,130801
3,David,104820
4,Elena,85343


In [67]:
datos_ventas

Unnamed: 0,Mes,Total_Venta
0,1,38617
1,2,79020
2,3,26514
3,4,19552
4,5,33014
5,6,81217
6,7,26158
7,8,73812
8,9,52082
9,10,47184
