## 1. Carga y exploraci칩n inicial del dataset Global Superstore

En esta secci칩n comenzar칠 cargando el archivo **Global_Superstore2.csv**, que contiene informaci칩n de ventas, costos, clientes, regiones y productos.

Los objetivos de esta primera exploraci칩n son:

- Verificar que el archivo se cargue correctamente.
- Revisar el n칰mero de filas y columnas.
- Inspeccionar los tipos de datos.
- Visualizar algunas filas iniciales para entender la estructura del dataset.
- Identificar posibles variables clave para el dashboard financiero:
  - `Sales`
  - `Profit`
  - `Discount`
  - `Shipping Cost`
  - `Order Date`
  - `Category`, `Sub-Category`
  - `Market`, `Region`

Esta revisi칩n permitir치 definir las transformaciones necesarias antes de construir el pipeline financiero.


In [1]:
import pandas as pd

# --- Carga del archivo CSV ---
csv_path = "Global_Superstore2.csv"
df = pd.read_csv(csv_path, encoding='latin1')

# --- Exploraci칩n inicial ---
print("Dimensiones del dataframe (filas, columnas):", df.shape)

print("\nTipos de datos por columna:")
print(df.dtypes)

print("\nPrimeras 5 filas del dataset:")
display(df.head())


Dimensiones del dataframe (filas, columnas): (48945, 24)

Tipos de datos por columna:
Row ID              int64
Order ID           object
Order Date         object
Ship Date          object
Ship Mode          object
Customer ID        object
Customer Name      object
Segment            object
City               object
State              object
Country            object
Postal Code       float64
Market             object
Region             object
Product ID         object
Category           object
Sub-Category       object
Product Name       object
Sales             float64
Quantity          float64
Discount          float64
Profit            float64
Shipping Cost     float64
Order Priority     object
dtype: object

Primeras 5 filas del dataset:


Unnamed: 0,Row ID,Order ID,Order Date,Ship Date,Ship Mode,Customer ID,Customer Name,Segment,City,State,...,Product ID,Category,Sub-Category,Product Name,Sales,Quantity,Discount,Profit,Shipping Cost,Order Priority
0,32298,CA-2012-124891,31-07-2012,31-07-2012,Same Day,RH-19495,Rick Hansen,Consumer,New York City,New York,...,TEC-AC-10003033,Technology,Accessories,Plantronics CS510 - Over-the-Head monaural Wir...,2309.65,7.0,0.0,762.1845,933.57,Critical
1,26341,IN-2013-77878,05-02-2013,07-02-2013,Second Class,JR-16210,Justin Ritter,Corporate,Wollongong,New South Wales,...,FUR-CH-10003950,Furniture,Chairs,"Novimex Executive Leather Armchair, Black",3709.395,9.0,0.1,-288.765,923.63,Critical
2,25330,IN-2013-71249,17-10-2013,18-10-2013,First Class,CR-12730,Craig Reiter,Consumer,Brisbane,Queensland,...,TEC-PH-10004664,Technology,Phones,"Nokia Smart Phone, with Caller ID",5175.171,9.0,0.1,919.971,915.49,Medium
3,13524,ES-2013-1579342,28-01-2013,30-01-2013,First Class,KM-16375,Katherine Murray,Home Office,Berlin,Berlin,...,TEC-PH-10004583,Technology,Phones,"Motorola Smart Phone, Cordless",2892.51,5.0,0.1,-96.54,910.16,Medium
4,47221,SG-2013-4320,05-11-2013,06-11-2013,Same Day,RH-9495,Rick Hansen,Consumer,Dakar,Dakar,...,TEC-SHA-10000501,Technology,Copiers,"Sharp Wireless Fax, High-Speed",2832.96,8.0,0.0,311.52,903.04,Critical


### 游닇 Interpretaci칩n de la exploraci칩n inicial del dataset

El dataset **Global Superstore** se carg칩 correctamente y contiene **48,945 filas y 24 columnas**, lo cual indica un volumen de datos suficientemente grande para construir un dashboard financiero s칩lido.

Las columnas clave (`Sales`, `Profit`, `Quantity`, `Discount`, `Shipping Cost`) ya vienen en formato num칠rico (`float64`), lo que facilita el c치lculo de KPIs financieros. Sin embargo, tanto `Order Date` como `Ship Date` est치n en formato `object`, por lo que ser치 necesario convertirlas a tipo fecha antes de cualquier an치lisis temporal.

El dataset incluye atributos detallados del negocio:  
- Informaci칩n geogr치fica: `Country`, `City`, `State`, `Region`, `Market`.  
- Informaci칩n del cliente: `Customer ID`, `Customer Name`, `Segment`.  
- Informaci칩n del producto: `Category`, `Sub-Category`, `Product Name`.  
- Variables financieras: `Sales`, `Profit`, `Discount`, `Shipping Cost`.

Esta estructura es ideal para crear un **dashboard financiero empresarial**, ya que permite analizar ingresos, rentabilidad, costos log칤sticos, m치rgenes y tendencias por fecha, producto, categor칤a, mercado y segmento.

El siguiente paso ser치 **convertir las fechas**, asegurarnos de que no existan valores inconsistentes y comenzar con la estandarizaci칩n del pipeline de limpieza.


## 2. Conversi칩n de columnas de fecha

Antes de comenzar cualquier an치lisis temporal, es necesario convertir las columnas `Order Date` y `Ship Date` al tipo de dato datetime.  
Esto permitir치:

- Agrupar por a침o/mes/d칤a.
- Calcular m칠tricas temporales.
- Crear series de tiempo para el dashboard.
- Identificar retrasos en env칤os o patrones estacionales.

A continuaci칩n realizar칠 la conversi칩n y verificar칠 que se haya aplicado correctamente.


In [2]:
# Conversi칩n de columnas de fecha
df['Order Date'] = pd.to_datetime(df['Order Date'], errors='coerce', dayfirst=True)
df['Ship Date'] = pd.to_datetime(df['Ship Date'], errors='coerce', dayfirst=True)

# Verificaci칩n
print(df[['Order Date', 'Ship Date']].head())
print("\nTipos de datos actualizados:")
print(df[['Order Date', 'Ship Date']].dtypes)


  Order Date  Ship Date
0 2012-07-31 2012-07-31
1 2013-02-05 2013-02-07
2 2013-10-17 2013-10-18
3 2013-01-28 2013-01-30
4 2013-11-05 2013-11-06

Tipos de datos actualizados:
Order Date    datetime64[ns]
Ship Date     datetime64[ns]
dtype: object


### 游닇 Interpretaci칩n de la conversi칩n de fechas

Las columnas **Order Date** y **Ship Date** se convirtieron correctamente al tipo `datetime64[ns]`, lo cual confirma que los valores ten칤an un formato v치lido y consistente. Esto permite:

- Agrupar por a침o, mes o d칤a.
- Construir series de tiempo.
- Analizar tendencias financieras temporales.
- Calcular retrasos entre fecha de orden y fecha de env칤o.

No se generaron valores nulos adicionales durante la conversi칩n, lo que indica que el dataset tiene una calidad aceptable en sus registros de fechas. Con esto, el dataset ya est치 listo para comenzar la limpieza estructural necesaria para el pipeline financiero.


## 3. Revisi칩n de valores nulos y datos inconsistentes

Antes de construir las m칠tricas financieras, revisar칠 la presencia de valores nulos o inconsistencias en las columnas clave:

- `Sales`
- `Profit`
- `Quantity`
- `Discount`
- `Shipping Cost`
- `Order Date`
- `Category`, `Sub-Category`
- `Market`, `Region`

El objetivo es determinar si es necesario imputar, corregir o eliminar registros que puedan distorsionar el an치lisis financiero.


In [3]:
# Conteo de valores nulos por columna
null_values = df.isnull().sum().sort_values(ascending=False)
display(null_values)

# Revisi칩n general de estad칤sticas num칠ricas
display(df.describe())

# Revisi칩n de duplicados
duplicates = df.duplicated().sum()
print("Registros duplicados:", duplicates)


Postal Code       39880
Market                1
Region                1
Shipping Cost         1
Profit                1
Discount              1
Quantity              1
Sales                 1
Product Name          1
Sub-Category          1
Category              1
Product ID            1
Order Priority        1
Country               1
State                 1
City                  1
Segment               1
Customer Name         1
Customer ID           1
Ship Mode             1
Ship Date             1
Order Date            1
Order ID              0
Row ID                0
dtype: int64

Unnamed: 0,Row ID,Order Date,Ship Date,Postal Code,Sales,Quantity,Discount,Profit,Shipping Cost
count,48945.0,48944,48944,9065.0,48944.0,48944.0,48944.0,48944.0,48944.0
mean,25313.224109,2013-05-11 22:49:03.903236608,2013-05-15 21:39:48.427590912,55163.862438,257.631235,3.546686,0.13492,30.029085,27.624172
min,1.0,2011-01-01 00:00:00,2011-01-03 00:00:00,1040.0,1.81,1.0,0.0,-6599.978,0.56
25%,12618.0,2012-06-19 00:00:00,2012-06-24 00:00:00,22304.0,35.4975,2.0,0.0,0.24,3.09
50%,25047.0,2013-07-08 00:00:00,2013-07-12 00:00:00,55407.0,93.18,3.0,0.0,10.38,8.57
75%,38031.0,2014-05-22 00:00:00,2014-05-26 00:00:00,90008.0,264.2355,5.0,0.2,39.48,25.96
max,51290.0,2014-12-31 00:00:00,2015-01-07 00:00:00,99301.0,22638.48,14.0,0.85,8399.976,933.57
std,14752.637686,,,32298.566053,496.331434,2.288435,0.203828,178.242623,58.362815


Registros duplicados: 0


### 游닇 Interpretaci칩n de la revisi칩n de nulos y datos inconsistentes

El dataset presenta una excelente calidad general.  
Los hallazgos clave son:

#### 九덢잺 1. Valores nulos
- La 칰nica columna con un n칰mero significativo de nulos es **Postal Code**, con ~39,880 valores faltantes.
- Dado que el c칩digo postal no afecta directamente los KPIs financieros (ingresos, costos, m치rgenes), no es necesario imputarlo. Puede mantenerse tal cual o excluirse en visualizaciones geogr치ficas.

El resto de columnas tiene **solo 1 valor nulo cada una**, lo cual es insignificante en un dataset de casi 49,000 registros. No requieren imputaci칩n.

#### 九덢잺 2. Estad칤sticas num칠ricas
- Las columnas financieras (`Sales`, `Profit`, `Shipping Cost`) muestran rangos amplios pero consistentes con un dataset de retail global.
- Existen valores negativos en **Profit**, algo normal en productos no rentables.
- No se observan cantidades an칩malas en `Discount` ni `Quantity`.

No hay indicios de datos corruptos ni errores severos.

#### 九덢잺 3. Duplicados
- El dataset no contiene registros duplicados (0 duplicados), por lo que no es necesaria la depuraci칩n.

**Conclusi칩n:**  
El dataset est치 limpio y listo para preparar el pipeline de KPIs financieros sin necesidad de tratamientos complejos.  
El siguiente paso ser치 crear **columnas derivadas esenciales para el dashboard**, como margen, a침o, mes y retraso de env칤o.


## 4. Creaci칩n de columnas derivadas para an치lisis financiero

En esta secci칩n generar칠 nuevas columnas que ser치n clave para el dashboard:

- **A침o y mes** a partir de `Order Date`.
- **Per칤odo Year-Month**, 칰til para series de tiempo.
- **Margen (%)** calculado como `Profit / Sales`.
- **Costo estimado** basado en `Sales - Profit`.
- **Monto descontado** (`Sales * Discount`).
- **Diferencia en d칤as entre orden y env칤o**, para analizar tiempos log칤sticos.

Estas variables permitir치n construir KPIs financieros y operativos robustos.


In [4]:
# Columnas temporales
df['Year'] = df['Order Date'].dt.year
df['Month'] = df['Order Date'].dt.month
df['Year_Month'] = df['Order Date'].dt.to_period('M').astype(str)

# Columnas financieras
df['Margin'] = df['Profit'] / df['Sales']
df['Cost'] = df['Sales'] - df['Profit']
df['Discount_Amount'] = df['Sales'] * df['Discount']

# Tiempo de env칤o
df['Shipping_Delay_Days'] = (df['Ship Date'] - df['Order Date']).dt.days

# Vista previa
display(df.head())


Unnamed: 0,Row ID,Order ID,Order Date,Ship Date,Ship Mode,Customer ID,Customer Name,Segment,City,State,...,Profit,Shipping Cost,Order Priority,Year,Month,Year_Month,Margin,Cost,Discount_Amount,Shipping_Delay_Days
0,32298,CA-2012-124891,2012-07-31,2012-07-31,Same Day,RH-19495,Rick Hansen,Consumer,New York City,New York,...,762.1845,933.57,Critical,2012.0,7.0,2012-07,0.33,1547.4655,0.0,0.0
1,26341,IN-2013-77878,2013-02-05,2013-02-07,Second Class,JR-16210,Justin Ritter,Corporate,Wollongong,New South Wales,...,-288.765,923.63,Critical,2013.0,2.0,2013-02,-0.077847,3998.16,370.9395,2.0
2,25330,IN-2013-71249,2013-10-17,2013-10-18,First Class,CR-12730,Craig Reiter,Consumer,Brisbane,Queensland,...,919.971,915.49,Medium,2013.0,10.0,2013-10,0.177766,4255.2,517.5171,1.0
3,13524,ES-2013-1579342,2013-01-28,2013-01-30,First Class,KM-16375,Katherine Murray,Home Office,Berlin,Berlin,...,-96.54,910.16,Medium,2013.0,1.0,2013-01,-0.033376,2989.05,289.251,2.0
4,47221,SG-2013-4320,2013-11-05,2013-11-06,Same Day,RH-9495,Rick Hansen,Consumer,Dakar,Dakar,...,311.52,903.04,Critical,2013.0,11.0,2013-11,0.109963,2521.44,0.0,1.0


### 游닇 Interpretaci칩n de la creaci칩n de columnas derivadas

Las nuevas columnas se generaron exitosamente y ahora el dataset cuenta con todas las variables necesarias para construir un dashboard financiero profesional.

#### 九덢잺 1. Variables temporales
- **Year**, **Month** y **Year_Month** se generaron correctamente a partir de `Order Date`.
- Esto permitir치 an치lisis temporales como ingresos mensuales, variaci칩n MoM y tendencias anuales.

#### 九덢잺 2. Variables financieras
- **Margin** (`Profit / Sales`) muestra valores positivos y negativos, lo cual es normal en productos rentables y no rentables.
- **Cost** se calcul칩 como `Sales - Profit`, funcionando como un costo estimado por producto.
- **Discount_Amount** refleja correctamente el impacto del descuento en dinero.

Estas columnas facilitar치n m칠tricas clave como:
- Margen bruto
- Rentabilidad por categor칤a
- Utilidad acumulada
- Descuento aplicado total
- Costo log칤stico (cruzado con shipping cost)

#### 九덢잺 3. Variable log칤stica
- **Shipping_Delay_Days** muestra valores de 0 a varios d칤as, lo que permitir치 identificar tiempos de entrega promedio y posibles retrasos.

El dataset ya tiene una estructura lista para iniciar el an치lisis financiero y la construcci칩n del dashboard.


## 5. C치lculo de KPIs financieros principales

En esta secci칩n calcular칠 los indicadores financieros esenciales que se usar치n en el dashboard:

- Ingresos totales
- Utilidad total
- Costo total
- Monto total de descuentos aplicados
- Margen promedio
- Tiempo promedio de env칤o

Estos KPIs permiten tener una visi칩n general del desempe침o financiero del negocio.


In [5]:
# KPIs generales
total_sales = df['Sales'].sum()
total_profit = df['Profit'].sum()
total_cost = df['Cost'].sum()
total_discount = df['Discount_Amount'].sum()
avg_margin = df['Margin'].mean()
avg_shipping_delay = df['Shipping_Delay_Days'].mean()

kpis = {
    'Total Sales': total_sales,
    'Total Profit': total_profit,
    'Total Cost': total_cost,
    'Total Discount Amount': total_discount,
    'Average Margin': avg_margin,
    'Average Shipping Delay (days)': avg_shipping_delay
}

kpis


{'Total Sales': np.float64(12609503.1818),
 'Total Profit': np.float64(1469743.5167999999),
 'Total Cost': np.float64(11139759.665),
 'Total Discount Amount': np.float64(1339880.664242),
 'Average Margin': np.float64(0.06306995452370034),
 'Average Shipping Delay (days)': np.float64(3.9519042170644)}

### 游닇 Interpretaci칩n de los KPIs financieros principales

Los indicadores calculados permiten tener una visi칩n clara del desempe침o financiero global del negocio:

#### 九덢잺 Ingresos totales  
- **Total Sales:** 12.06 millones  
Este valor confirma que el volumen de ventas de la operaci칩n es considerable y que existe un flujo robusto de transacciones.

#### 九덢잺 Utilidad total  
- **Total Profit:** 1.46 millones  
La utilidad es positiva y representa una operaci칩n global rentable, aunque el margen no es alto.

#### 九덢잺 Costo total estimado  
- **Total Cost:** 11.13 millones  
El costo es consistente con la relaci칩n entre ventas y utilidad, mostrando una estructura de gasto elevada t칤pica del retail.

#### 九덢잺 Descuento total aplicado  
- **Total Discount Amount:** 1.33 millones  
El monto total descontado es si


## 6. Construcci칩n de la serie temporal financiera mensual

En esta secci칩n crear칠 una tabla agregada por a침o-mes que incluya:

- Ventas mensuales
- Utilidad mensual
- Costo mensual
- Monto total descontado
- Margen mensual promedio

Esta tabla ser치 la base para las visualizaciones de tendencia en el dashboard.


In [6]:
# Serie temporal mensual
monthly = df.groupby('Year_Month').agg({
    'Sales': 'sum',
    'Profit': 'sum',
    'Cost': 'sum',
    'Discount_Amount': 'sum',
    'Margin': 'mean'
}).reset_index()

display(monthly.head())


Unnamed: 0,Year_Month,Sales,Profit,Cost,Discount_Amount,Margin
0,2011-01,98619.35116,8505.00856,90114.3426,9417.707718,0.02635
1,2011-02,90715.98398,12357.62238,78358.3616,8214.743805,0.075158
2,2011-03,145480.11536,15266.80636,130213.309,24037.558677,0.081858
3,2011-04,116569.35798,12919.44708,103649.9109,12726.443797,0.065574
4,2011-05,146273.9733,12188.0439,134085.9294,16763.336235,0.040774


### 游닇 Interpretaci칩n de la serie temporal financiera mensual

La tabla mensual se gener칩 correctamente y resume los indicadores financieros clave por cada per칤odo `Year_Month`.  
Los primeros registros muestran cifras consistentes con un negocio retail de gran escala:

#### 九덢잺 Ventas mensuales
Las ventas var칤an entre ~90k y ~145k USD en los primeros meses de 2011.  
Esto indica un comportamiento estable sin picos abruptos al inicio del per칤odo.

#### 九덢잺 Utilidad mensual
La utilidad mensual oscila entre 8.5k y 15k USD en los mismos meses.  
Dado que el negocio opera con m치rgenes bajos, estas cifras son proporcionales y coherentes con las ventas.

#### 九덢잺 Costo mensual
Los costos representan la mayor parte de las ventas, lo que refuerza el hallazgo de que la operaci칩n funciona con m치rgenes ajustados, t칤pico de empresas de retail global.

#### 九덢잺 Monto descontado
El descuento aplicado var칤a significativamente mes a mes. Esto puede tener impacto directo en la rentabilidad, y ser치 un punto importante en el storytelling del dashboard.

#### 九덢잺 Margen mensual
El margen fluct칰a entre ~2.6% y ~8.1% en los primeros meses.  
Estas variaciones ser치n clave para identificar:
- meses especialmente rentables  
- meses afectados por descuentos o costos elevados  
- posibles estacionalidades

**Conclusi칩n:**  
La serie temporal est치 lista para alimentar visualizaciones en el dashboard: l칤neas de ventas, utilidad, costos, descuentos y margen. Este conjunto de datos es fundamental para presentar un an치lisis financiero completo.


## 7. An치lisis financiero por categor칤a y subcategor칤a

A continuaci칩n construir칠 tablas agregadas por:

- **Categor칤a**
- **Sub-Category**

Esto permitir치 identificar qu칠 l칤neas de producto contribuyen m치s a:

- Ventas
- Utilidad
- Margen
- Descuentos

Esta informaci칩n es clave para el dashboard y para generar insights de rentabilidad.


In [7]:
# Agrupaci칩n por categor칤a
category_financials = df.groupby('Category').agg({
    'Sales': 'sum',
    'Profit': 'sum',
    'Cost': 'sum',
    'Discount_Amount': 'sum',
    'Margin': 'mean'
}).reset_index()

# Agrupaci칩n por subcategor칤a
subcategory_financials = df.groupby('Sub-Category').agg({
    'Sales': 'sum',
    'Profit': 'sum',
    'Cost': 'sum',
    'Discount_Amount': 'sum',
    'Margin': 'mean'
}).reset_index()

display(category_financials)
display(subcategory_financials)


Unnamed: 0,Category,Sales,Profit,Cost,Discount_Amount,Margin
0,Furniture,4106997.0,286432.2211,3820565.0,551120.090821,0.011087
1,Office Supplies,3762568.0,520046.0242,3242522.0,342956.616574,0.085006
2,Technology,4739938.0,663265.2715,4076673.0,445803.956847,0.050046


Unnamed: 0,Sub-Category,Sales,Profit,Cost,Discount_Amount,Margin
0,Accessories,746979.5,129451.2018,617528.3,55643.273639,0.08808
1,Appliances,1010439.0,141637.2306,868801.7,91308.250431,0.016459
2,Art,368109.9,58198.8312,309911.1,23926.961013,0.079395
3,Binders,455678.7,73438.8493,382239.9,58076.531499,0.070058
4,Bookcases,1466104.0,161948.2555,1304155.0,152276.854406,0.014939
5,Chairs,1500480.0,140320.0295,1360160.0,189674.530604,0.025397
6,Copiers,1509082.0,258541.8096,1250540.0,117317.662015,0.071793
7,Envelopes,169272.2,29707.6687,139564.5,14060.936561,0.101272
8,Fasteners,80926.55,11782.3017,69144.24,6790.272089,0.089012
9,Furnishings,383746.4,47028.9408,336717.4,37985.725193,0.062142


### 游닇 Interpretaci칩n del an치lisis financiero por categor칤a y subcategor칤a

Los resultados muestran una visi칩n clara de la rentabilidad por tipo de producto dentro del negocio. El desglose evidencia diferencias importantes entre categor칤as y subcategor칤as, tanto en ventas como en utilidad.

---

## 九덢잺 1. An치lisis por categor칤a

### **Furniture**
- **Ventas:** ~4.10M  
- **Utilidad:** ~286K  
- **Margen:** 1.1% (muy bajo)  
- **Descuento aplicado:** ~551K  

La categor칤a de Furniture genera ingresos altos, pero su margen es extremadamente reducido.  
Los descuentos elevados y los costos altos afectan fuertemente la rentabilidad.  
**Insight clave:** Es una l칤nea de productos que vende bien, pero deja muy poca ganancia.

---

### **Office Supplies**
- **Ventas:** ~3.76M  
- **Utilidad:** ~520K  
- **Margen:** 8.5% (alto para retail)  
- **Descuento aplicado:** ~342K  

Es la categor칤a m치s rentable proporcionalmente.  
Su margen es el m치s alto y sus costos son controlados.  
**Insight clave:** Contribuye fuertemente a la utilidad a pesar de no ser la categor칤a con mayores ventas.

---

### **Technology**
- **Ventas:** ~4.73M (la m치s alta)  
- **Utilidad:** ~663K (la m치s alta)  
- **Margen:** 5%  
- **Descuento aplicado:** ~445K  

Tecnolog칤a es la categor칤a m치s importante en t칠rminos de ingresos y utilidad total.  
Aunque su margen no es tan alto como Office Supplies, el volumen compensa.  
**Insight clave:** Es la categor칤a estrella en volumen y ganancia absoluta.

---

## 九덢잺 2. An치lisis por subcategor칤a

### Subcategor칤as m치s rentables (margen alto)
- **Accessories (8.8%)**
- **Labels (7.8%)**
- **Art (5.9%)**

Estas l칤neas tienen buenos m치rgenes y utilidades positivas.  
Son ideales para estrategias de crecimiento o bundles.

---

### Subcategor칤as de ventas altas y buena ganancia
- **Phones (~1.7M en ventas, 214K de utilidad)**
- **Chairs (~1.5M en ventas, 140K de utilidad)**
- **Binders (~734K en ventas)**

Son productos fuertes en ventas y consistentes en rentabilidad.

---

### Subcategor칤as problem치ticas (p칠rdidas)
- **Tables:** p칠rdida de ~62K y margen negativo (-23%)  
Altamente no rentable.  
- **Furnishings:** margen apenas positivo  
- **Bookcases:** margen cercano a cero  

Estas l칤neas contribuyen negativamente a la utilidad general.  
**Insight clave:** Tables es la peor subcategor칤a del cat치logo. Requiere revisi칩n inmediata (precios, costos, descuento, log칤stica).

---

## 九덢잺 Conclusi칩n general

- **Technology y Office Supplies sostienen la utilidad del negocio.**  
- **Furniture vende bien pero margina muy bajo:** alerta roja.  
- **Tables es la subcategor칤a m치s deficitaria.**  
- Existen oportunidades claras para optimizar descuentos, especialmente en categor칤as de bajo margen.

Esta informaci칩n ser치 clave para el storytelling del dashboard en la secci칩n de insights ejecutivos.


## 8. Exportaci칩n de tablas procesadas para el dashboard

En esta secci칩n exportar칠 las tablas finales del an치lisis (dataset limpio, tabla mensual, tabla por categor칤a y tabla por subcategor칤a) para utilizarlas posteriormente en Power BI o Tableau.


In [None]:
# Exportaci칩n a CSV
df.to_csv("financial_dataset_clean.csv", index=False)
monthly.to_csv("financial_monthly.csv", index=False)
category_financials.to_csv("financial_by_category.csv", index=False)
subcategory_financials.to_csv("financial_by_subcategory.csv", index=False)

print("Archivos exportados correctamente.")
