#Actividad 1: Análisis de Tendencia Central
##Contexto
En esta nueva semana de pasantía en SynthData. Silvia, la Project Manager y Data Scientist, te acaba de asignar una tarea crucial para conocer mejor los datos de clientes que la empresa ha recopilado. Tenés que calcular las medidas de tendencia central de las ventas mensuales de un producto específico en el último año. Esto les ayudará a identificar patrones y tomar decisiones informadas sobre el inventario.
##Objetivos
Calcular la media, la mediana y la moda de las ventas mensuales.
Comprender la importancia de estas medidas en el análisis de datos de ventas.
##Ejercicio práctico
Realiza los siguientes cálculos en Python con los datos sobre las ventas mensuales en unidades del último año:
* Calcular la media de las ventas.
* Calcular la mediana de las ventas.
* Calcular la moda de las ventas.
Interpretá y explicá qué significan estos valores.

##Set de datos
```
ventas = {
    'Mes': ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre'],
    'Ventas (millones)': [10.2, 12.5, 15.1, 18.3, 20.5, 22.1, 24.8, 26.2, 25.5, 23.8, 21.9, 19.2]
}
```
##¿Por qué importa esto en SynthData?
Las medidas de tendencia central son esenciales para entender el rendimiento de un producto en el mercado. Ayudan a identificar si las ventas están creciendo, estables o en declive, permitiendo tomar decisiones estratégicas para el negocio.


In [None]:
import pandas as pd

# Crear un dataframe con las ventas de enero a diciembre
ventas = {
    'Mes': ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre'],
    'Ventas (millones)': [1.2, 2.5, 3.1, 18.3, 40.5, 52.1, 54.8, 46.2, 25.5, 13.8, 11.9, 9.2]
}

df = pd.DataFrame(ventas)

print(df)
print()

# Calcular la media de las ventas
media_ventas = df['Ventas (millones)'].mean()
print(f"Media de las ventas: {media_ventas:.2f} millones")

# Calcular la mediana de las ventas
mediana_ventas = df['Ventas (millones)'].median()
print(f"Mediana de las ventas: {mediana_ventas:.2f} millones")

# Calcular la moda de las ventas
moda_ventas = df['Ventas (millones)'].mode().values[0]
print(f"Moda de las ventas: {moda_ventas:.2f} millones")

           Mes  Ventas (millones)
0        Enero                1.2
1      Febrero                2.5
2        Marzo                3.1
3        Abril               18.3
4         Mayo               40.5
5        Junio               52.1
6        Julio               54.8
7       Agosto               46.2
8   Septiembre               25.5
9      Octubre               13.8
10   Noviembre               11.9
11   Diciembre                9.2

Media de las ventas: 23.26 millones
Mediana de las ventas: 16.05 millones
Moda de las ventas: 1.20 millones


#Actividad 2: Medidas de Dispersión
##Contexto
Matías, el Data Analyst, te solicita que analices la variabilidad de las ventas mensuales que calculaste en la actividad anterior. Este análisis es fundamental para saber si las fluctuaciones en las ventas podrían afectar los pronósticos futuros. Así, podrás entender mejor el comportamiento del producto en distintos meses del año.
##Objetivos
Calcular el rango, la varianza y la desviación standard de las ventas mensuales.
Reconocer cómo estas medidas de dispersión informan sobre la estabilidad de las ventas.
##Ejercicio práctico
Utiliza el mismo conjunto de datos de ventas mensuales del ejercicio anterior y realiza lo siguiente en Python:
* Calcular el rango de las ventas.
* Calcular la varianza de las ventas.
* Calcular la desviación standard de las ventas.
Teorizá a partir de las dos actividades: Si tuvieras que adivinar de qué producto se trata, ¿cuál crees que se ajusta más a los valores obtenidos? Justificá tu elección.
```
[ ] Leche
[ ] Bufanda
[ ] Árbol de navidad
[ ] Kit de geometría escolar
[ ] Bronceador
```
##¿Por qué importa esto en SynthData?
Las medidas de dispersión son esenciales para evaluar el riesgo y la estabilidad de las ventas. Un alto rango, varianza o desviación standard puede indicar comportamientos erráticos, lo que podría afectar la planificación del inventario y ventas futuras.


In [None]:
# Calcular el rango de las ventas
rango_ventas = df['Ventas (millones)'].max() - df['Ventas (millones)'].min()
print(f"Rango de las ventas: {rango_ventas:.2f} millones")

# Calcular la varianza de las ventas
varianza_ventas = df['Ventas (millones)'].var()
print(f"Varianza de las ventas: {varianza_ventas:.2f} millones^2")

# Calcular la desviación standard de las ventas
desviacion_standard_ventas = df['Ventas (millones)'].std()
print(f"Desviación standard de las ventas: {desviacion_standard_ventas:.2f} millones")

Rango de las ventas: 53.60 millones
Varianza de las ventas: 401.81 millones^2
Desviación standard de las ventas: 20.05 millones



Basándome en el análisis de los datos, puedo deducir que los patrones de demanda del producto se ajustan a las métricas de consumo esperadas para las bufandas.
Esto se debe a que el patrón estacional de las ventas, con un pico muy alto en los meses de mayo, junio y julio, se ajusta a la temporada de invierno en el hemisferio sur, cuando las temperaturas son más bajas.
