In [2]:
# Paso 1: Importar las librerías necesarias
import pandas as pd
import numpy as np

# Paso 2: Cargar los datos desde los archivos CSV
# Cargar los datos con rutas absolutas
ventas = pd.read_csv('/workspace/ventas.csv')
inventarios = pd.read_csv('/workspace/inventarios.csv')
satisfaccion = pd.read_csv('/workspace/satisfaccion.csv')

# Paso 3: Limpieza de datos
# Eliminar filas con valores nulos
ventas = ventas.dropna()
inventarios = inventarios.dropna()
satisfaccion = satisfaccion.dropna()

# Verificar que los DataFrames tengan la estructura correcta
print("Estructura de los datos de ventas:")
print(ventas.info())
print("\nEstructura de los datos de inventarios:")
print(inventarios.info())
print("\nEstructura de los datos de satisfacción del cliente:")
print(satisfaccion.info())

# Paso 4: Exploración de datos - Ventas

# Calcular las ventas totales por producto y por tienda
ventas['Total_Ventas'] = ventas['Cantidad_Vendida'] * ventas['Precio_Unitario']
ventas_por_tienda = ventas.groupby('ID_Tienda')['Total_Ventas'].sum().reset_index()

# Resumen estadístico de las ventas
print("\nResumen estadístico de las ventas:")
print(ventas.describe())

# Ingresos totales por tienda
print("\nVentas totales por tienda:")
print(ventas_por_tienda)

# Paso 5: Análisis de inventarios

# Agrupar el stock disponible por tienda
inventarios_totales = inventarios.groupby('ID_Tienda')['Stock_Disponible'].sum().reset_index()

# Calcular la rotación de inventarios (ventas totales / inventario disponible)
inventarios_totales['Total_Ventas'] = ventas_por_tienda['Total_Ventas']
inventarios_totales['Rotacion'] = inventarios_totales['Total_Ventas'] / inventarios_totales['Stock_Disponible']

# Filtrar tiendas con niveles críticos de inventario (< 10% de ventas respecto al stock disponible)
tiendas_nivel_critico = inventarios_totales[inventarios_totales['Rotacion'] < 0.1]

print("\nTiendas con niveles críticos de inventario:")
print(tiendas_nivel_critico)

# Paso 6: Satisfacción del cliente

# Filtrar tiendas con baja satisfacción (< 60%)
satisfaccion_baja = satisfaccion[satisfaccion['Satisfacción_Promedio'] < 60]

print("\nTiendas con baja satisfacción de clientes:")
print(satisfaccion_baja)

# Paso 7: Operaciones con Numpy

# Convertir la columna 'Total_Ventas' de Pandas a un array de Numpy usando .values
ventas_array = ventas['Total_Ventas'].values

# Calcular la mediana de ventas
ventas_mediana = np.median(ventas_array)
print("\nMediana de ventas:", ventas_mediana)

# Calcular la desviación estándar de las ventas
ventas_desviacion = np.std(ventas_array)
print("\nDesviación estándar de las ventas:", ventas_desviacion)

# Usar Numpy para generar proyecciones de ventas futuras con seed
seed = 42  # Definir una semilla para asegurar la reproducibilidad
rng = np.random.default_rng(seed)  # Crear un generador aleatorio con la semilla
proyecciones_ventas = rng.integers(1000, 5000, size=10)  # Generar números aleatorios entre 1000 y 5000

print("\nProyecciones de ventas futuras (simulación) con seed:")
print(proyecciones_ventas)

Estructura de los datos de ventas:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10 entries, 0 to 9
Data columns (total 5 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   ID_Tienda         10 non-null     int64 
 1   Producto          10 non-null     object
 2   Cantidad_Vendida  10 non-null     int64 
 3   Precio_Unitario   10 non-null     int64 
 4   Fecha_Venta       10 non-null     object
dtypes: int64(3), object(2)
memory usage: 532.0+ bytes
None

Estructura de los datos de inventarios:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10 entries, 0 to 9
Data columns (total 4 columns):
 #   Column               Non-Null Count  Dtype 
---  ------               --------------  ----- 
 0   ID_Tienda            10 non-null     int64 
 1   Producto             10 non-null     object
 2   Stock_Disponible     10 non-null     int64 
 3   Fecha_Actualización  10 non-null     object
dtypes: int64(2), object(2)
memory usage: 452.