# Lab 2 Python : Entrenamiento 2

El proyecto debe cumplir con los siguientes requisitos:

1. Utilizar el lenguaje de programación Python.
2. Utilizar las librerías Pandas y Numpy para el análisis de datos y las operaciones numéricas.
3. Implementar el proyecto en Visual Studio Code utilizando el plugin de Jupyter para trabajar con archivos .ipynb.
4. Cargar los datos desde los archivos CSV que están presentes en el proyecto. Las rutas de los archivos deben ser absolutas, como se muestra a continuación:
- /workspace/ventas.csv
- /workspace/inventarios.csv
- /workspace/satisfaccion.csv
5. Procesamiento de los datos:
- Limpiar los datos eliminando filas con valores nulos.
- Asegurar que los DataFrames tengan la estructura correcta y estén listos para su análisis.
6. Realizar los siguientes análisis estadísticos utilizando Pandas:
- Calcular las ventas totales por tienda.
- Calcular la rotación de inventarios por tienda.
- Filtrar las tiendas con inventarios críticos (menos del 10% en ventas respecto al inventario disponible).
- Analizar la satisfacción del cliente y filtrar las tiendas con una satisfacción menor al 60%.
7. Realizar cálculos numéricos con Numpy:
- Calcular la mediana de las ventas totales.
- Calcular la desviación estándar de las ventas.
- Simular proyecciones de ventas futuras usando arrays aleatorios de Numpy.
8. El código debe estar bien organizado y comentado, explicando los pasos importantes del análisis y las operaciones realizadas.
9. El proyecto debe contener un archivo Jupyter Notebook (.ipynb) donde se implementen y expliquen los pasos, análisis y resultados obtenidos en cada sección.

# Instrucciones

La empresa ficticia RetailNow, que gestiona una cadena de tiendas minoristas, desea realizar un análisis detallado del rendimiento de sus diferentes sucursales en varias ciudades. Para ello, han recopilado datos de las ventas, los inventarios y la satisfacción del cliente en archivos CSV. Tu misión será procesar, explorar y analizar estos datos usando Pandas y Numpy para ayudar a la dirección a tomar decisiones estratégicas sobre la optimización del rendimiento de las tiendas.

1. Preparar el entorno de trabajo:
- Abre Visual Studio Code y asegúrate de tener instalado el plugin de Jupyter.
- Crea un nuevo archivo Jupyter Notebook llamado analisis_red_tiendas.ipynb.
2. Importar las librerías necesarias:
- Importa las librerías Pandas y Numpy que necesitarás para realizar el análisis.
3. Cargar los datos (lectura y procesamiento de datos - Pandas):
- Utiliza Pandas para cargar los archivos CSV: ventas.csv, inventarios.csv y satisfaccion.csv.
- Guarda los datos en tres DataFrames distintos.
- Limpia los datos eliminando filas con valores nulos utilizando el método dropna(). Esto te permitirá trabajar solo con datos válidos.
4. Exploración de datos (Pandas)
- Calcula las ventas totales por producto y por tienda.
- Calcula los ingresos totales por tienda, multiplicando la cantidad vendida por el precio unitario.
- Genera un resumen estadístico de las ventas utilizando el método describe() para obtener la media, mediana y otras métricas clave.
- Si los productos están clasificados por categorías, calcula el promedio de ventas por tienda y categoría de productos.
- Utiliza groupby() en Pandas para calcular las ventas totales por tienda o por categoría.
5. Análisis de inventarios (Pandas)
- Calcula la rotación de inventarios para cada tienda. Esto se hace dividiendo las ventas totales por el stock disponible de cada producto.
- Almacena los resultados en una nueva columna dentro del DataFrame de inventarios.
- Filtra y muestra las tiendas con niveles críticos de inventario, es decir, aquellas tiendas donde el porcentaje de productos vendidos sea menor al 10% del stock disponible.
- Utiliza groupby() y operaciones matemáticas para calcular la rotación de inventarios.
- Aplica filtros con Pandas para identificar las tiendas con niveles críticos.
6. Satisfacción del cliente (Pandas)
- Realiza un análisis de la satisfacción de los clientes en cada tienda. Relaciona estos datos con el rendimiento de las ventas.
- Filtra las tiendas con niveles bajos de satisfacción (< 60%) y haz recomendaciones para mejorar el rendimiento de estas tiendas.
7. Operaciones con Numpy
- Usar Numpy para realizar los siguientes cálculos sobre las ventas:
1. Mediana de las ventas totales.
2. Desviación estándar de las ventas totales.
- Para los cálculos, convierte la columna Total_Ventas del DataFrame de Pandas a un array de Numpy usando .to_numpy (o .values si lo prefieres).
- Genera arrays aleatorios utilizando la biblioteca Numpy para simular proyecciones de ventas futuras.
- Usa el módulo de aleatoriedad de Numpy y asegúrate de establecer una semilla (seed) para obtener resultados reproducibles.


## Estructura del Proyecto

Archivo principal: analisis_red_tiendas.ipynb
Este notebook será el archivo donde se importan y procesan los datos, se realizan los análisis solicitados, y se muestran los resultados. Incluirá el procesamiento con Pandas y cálculos con Numpy.

Descarga los archivos CSV:
- ventas.csv: datos de ventas.
- inventarios.csv: datos de inventarios.
- satisfaccion.csv: datos de satisfacción de clientes.

In [71]:
#Paso 2: Importamos librerías
import pandas as pd
import numpy as np

#Paso 3: Cargamos los archivos y quitamos NA
'''
ventas = pd.read_csv("/workspace/ventas.csv").dropna()
satisfaccion = pd.read_csv("/workspace/satisfaccion.csv").dropna()
inventarios = pd.read_csv("/workspace/inventarios.csv").dropna()
'''
ventas = pd.read_csv("C:/Users/Usuario01/Downloads/Sprint Python/Lab2/python_intermedio/ventas.csv").dropna()
satisfaccion = pd.read_csv("C:/Users/Usuario01/Downloads/Sprint Python/Lab2/python_intermedio/satisfaccion.csv").dropna()
inventarios = pd.read_csv("C:/Users/Usuario01/Downloads/Sprint Python/Lab2/python_intermedio/inventarios.csv").dropna()
print("El dataset de ventas es:")
print(ventas)
print("El dataset de inventarios es:")
print(inventarios)
print("El dataset de satisfaccion es:")
print(satisfaccion)

El dataset de ventas es:
   ID_Tienda    Producto  Cantidad_Vendida  Precio_Unitario Fecha_Venta
0          1  Producto A                20              100  2023-01-05
1          1  Producto B                15              200  2023-01-06
2          2  Producto A                30              100  2023-01-07
3          2  Producto C                25              300  2023-01-08
4          3  Producto A                10              100  2023-01-09
5          3  Producto B                40              200  2023-01-10
6          4  Producto C                35              300  2023-01-11
7          4  Producto A                25              100  2023-01-12
8          5  Producto B                20              200  2023-01-13
9          5  Producto C                30              300  2023-01-14
El dataset de inventarios es:
   ID_Tienda    Producto  Stock_Disponible Fecha_Actualización
0          1  Producto A                50          2023-01-05
1          1  Producto B   

In [86]:
#Paso 4: Cáculos
#Ventas totales por producto y tienda
ventas_tienda = ventas.groupby(['ID_Tienda'])['Cantidad_Vendida'].sum().reset_index().rename(columns={'Cantidad_Vendida': 'Total_Ventas'})
ventas_producto = ventas.groupby(['Producto'])['Cantidad_Vendida'].sum().reset_index()
print('Las ventas por tienda son:')
print(ventas_tienda)
print('Las ventas por producto son:')
print(ventas_producto)
print('Las ventas por tienda y producto son:')
ventas_producto_tienda = ventas.groupby(['ID_Tienda','Producto'])['Cantidad_Vendida'].sum().reset_index()
print(ventas_producto_tienda)
paso41 = ventas.groupby(['ID_Tienda', 'Producto'])['Cantidad_Vendida'].sum().reset_index()
ventas['Total_Ingresos'] = ventas['Cantidad_Vendida']*ventas['Precio_Unitario']
print('Los principales estadísticos son:')
print(ventas.describe())
print('La media de ventas por productos y tiendas es:')
paso42 = ventas.groupby(['ID_Tienda', 'Producto'])['Total_Ingresos'].mean().reset_index()
print(paso42)

Las ventas por tienda son:
   ID_Tienda  Total_Ventas
0          1            35
1          2            55
2          3            50
3          4            60
4          5            50
Las ventas por producto son:
     Producto  Cantidad_Vendida
0  Producto A                85
1  Producto B                75
2  Producto C                90
Las ventas por tienda y producto son:
   ID_Tienda    Producto  Cantidad_Vendida
0          1  Producto A                20
1          1  Producto B                15
2          2  Producto A                30
3          2  Producto C                25
4          3  Producto A                10
5          3  Producto B                40
6          4  Producto A                25
7          4  Producto C                35
8          5  Producto B                20
9          5  Producto C                30
Los principales estadísticos son:
       ID_Tienda  Cantidad_Vendida  Precio_Unitario  Total_Ventas  \
count  10.000000         10.000000      

In [88]:
#Paso 5
inventarios_tienda = inventarios.groupby(['ID_Tienda'])['Stock_Disponible'].sum().reset_index()
totales_tienda = inventarios_tienda.merge(ventas_tienda,on=['ID_Tienda'],how='left')
totales_tienda['Rotacion_Inventario'] = totales_tienda['Total_Ventas'] / totales_tienda['Stock_Disponible']
print('Mezclamos el inventario y las ventas por tienda:')
print(totales_tienda)
inventarios_criticos = totales_tienda[totales_tienda['Rotacion_Inventario'] < 0.10]
print('Observamos los inventarios críticos:')
print(inventarios_criticos)
#print(inventarios)

Mezclamos el inventario y las ventas por tienda:
   ID_Tienda  Stock_Disponible  Total_Ventas  Rotacion_Inventario
0          1                90            35             0.388889
1          2               105            55             0.523810
2          3               110            50             0.454545
3          4               120            60             0.500000
4          5               100            50             0.500000
Observamos los inventarios críticos:
Empty DataFrame
Columns: [ID_Tienda, Stock_Disponible, Total_Ventas, Rotacion_Inventario]
Index: []


In [89]:
#Paso 6
#Unimos todos los datos para conocer una visión completa de los mismos
total = totales_tienda.merge(satisfaccion, on= ['ID_Tienda'], how='outer')
print('Las tiendas con satisfacción menor al 60% son:')
tiendas_baja_satisfaccion = satisfaccion[satisfaccion['Satisfacción_Promedio'] < 60]
print(tiendas_baja_satisfaccion)

Las tiendas con satisfacción menor al 60% son:
   ID_Tienda  Satisfacción_Promedio Fecha_Evaluación
4          5                     55       2023-01-15


In [90]:
#Para ver una visión global de los datos, los imprimimos
print(total)

   ID_Tienda  Stock_Disponible  Total_Ventas  Rotacion_Inventario  \
0          1                90            35             0.388889   
1          2               105            55             0.523810   
2          3               110            50             0.454545   
3          4               120            60             0.500000   
4          5               100            50             0.500000   

   Satisfacción_Promedio Fecha_Evaluación  
0                     85       2023-01-15  
1                     90       2023-01-15  
2                     70       2023-01-15  
3                     65       2023-01-15  
4                     55       2023-01-15  


In [91]:
#Paso 7
#Datos estadísticos de las ventas totales con numpy
array = total['Total_Ventas'].to_numpy()
media = np.mean(array)
mediana = np.median(array)
desviacion = np.std(array)
print("La mediana es "+str(mediana))
print("La desviación estándar es "+str(desviacion))

#Proyecciones de ventas futuras aleatorias con numpy (Usamoa una distribución normal por ejemplo)
np.random.seed(42)
ventaaleatoria = np.random.normal(loc=media,scale=desviacion,size=12)
print("Un vector de Ventas Aleatorias sería:")
print(ventaaleatoria)

La mediana es 50.0
La desviación estándar es 8.366600265340756
Un vector de Ventas Aleatorias sería:
[54.15580876 48.84319786 55.41895109 62.742582   48.04093231 48.04106967
 63.21264236 56.42081961 46.07209548 54.539383   46.12276941 46.10342532]
