# Entregable 1: Análisis y Consolidación de Datos para Optimización Estratégica
## Preparado por RobertScience
**Correo**: robertscience.ia@gmail.com | **Web**: robertScience.com

**Objetivo**: Este entregable presenta un análisis exhaustivo basado en los datos proporcionados, consolidando información en un conjunto unificado para habilitar decisiones estratégicas de alto impacto. Los resultados reflejan un enfoque profesional que transforma los datos en valor accionable.

**Entregables**:
- `data_consolidated.xlsx`: Conjunto de datos consolidado con métricas derivadas.
- Este documento: Detalle de los resultados y recomendaciones.
- Visualizaciones: Gráficos de barras y mapas de calor.

**RobertScience** | Soluciones Avanzadas en Data

## 1. Carga de Datos
Se trabajaron los archivos: FACT_SALES, DIM_PRODUCT, DIM_CATEGORY, DIM_SEGMENT, y DIM_CALENDAR, integrándolos en un análisis consolidado.

**Archivos**:
- FACT_SALES: Tabla de hechos de ventas (122002 filas, 6 columnas).
- DIM_PRODUCT: Dimensiones de productos (505 filas, 9 columnas).
- DIM_CATEGORY: Dimensiones de categorías (5 filas, 2 columnas).
- DIM_SEGMENT: Dimensiones de segmentos (53 filas, 6 columnas).
- DIM_CALENDAR: Dimensiones de calendario (156 filas, 5 columnas).

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar el archivo consolidado
df_consolidated = pd.read_excel('data_consolidated.xlsx')

# Verificar carga
print('Estructura del conjunto consolidado:', df_consolidated.shape)
print('Columnas disponibles:', df_consolidated.columns.tolist())

## 2. Exploración Inicial de los Datos
Se revisaron los datos para entender su estructura y calidad, preparando el terreno para un análisis estratégico.

In [None]:
# Inspección de datos
print('\nPrimeras filas del conjunto consolidado:')
print(df_consolidated.head())
print('\nInformación del conjunto consolidado:')
df_consolidated.info()
print('\nValores nulos:', df_consolidated.isnull().sum().to_dict())

## 3. Limpieza de Datos
Se optimizaron los datos para asegurar su calidad, eliminando inconsistencias y preparando métricas accionables.

In [None]:
# Limpieza de datos
df_consolidated = df_consolidated.dropna(subset=['ITEM_CODE'])
df_consolidated = df_consolidated.drop_duplicates()
df_consolidated['ITEM_CODE'] = df_consolidated['ITEM_CODE'].str.strip().str.upper()

# Verificación
print('Estructura tras limpieza:', df_consolidated.shape)

## 4. Análisis Estratégico
Se derivaron métricas clave y se generaron visualizaciones para apoyar la toma de decisiones.

In [None]:
# Análisis y visualizaciones
top_categories = df_consolidated.groupby('CATEGORY')['REVENUE'].sum().nlargest(5).reset_index()

# Gráfico de barras
plt.figure(figsize=(12, 6))
sns.barplot(data=top_categories, x='REVENUE', y='CATEGORY', palette='viridis', edgecolor='black')
plt.title('Top 5 Categorías por Ingresos', pad=15)
plt.xlabel('Ingresos')
plt.ylabel('Categorías')
plt.grid(True, linestyle='--', alpha=0.7)
for i, v in enumerate(top_categories['REVENUE']):
    plt.text(v + 1000, i, f'${v:,.0f}', va='center')
plt.show()

# Mapa de calor
plt.figure(figsize=(10, 8))
correlation_matrix = df_consolidated[['REVENUE', 'TOTAL_UNIT_SALES', 'REVENUE_PER_UNIT']].corr()
sns.heatmap(correlation_matrix, annot=True, cmap='YlOrRd', fmt='.2f', square=True, linewidths=0.5)
plt.title('Correlaciones entre Métricas Clave', pad=15)
plt.show()

## 5. Recomendaciones Estratégicas
Basados en el análisis, se proponen estrategias para maximizar el valor del negocio:
- Enfocarse en las categorías de mayor ingreso para optimizar recursos.
- Aprovechar las correlaciones identificadas para ajustar estrategias de ventas.

**Contacto**: Para más detalles, contáctenos en robertscience.ia@gmail.com. RobertScience: Su aliado en soluciones de datos.