In [24]:
import pandas as pd
import plotly.express as px

In [3]:
data = pd.read_csv('datos_ejercicio_ventas.csv')
data.head()

Unnamed: 0,COUNTRY,SUBBRAND,YEAR,MONTH,SCENARIO,FORECAST,FORECAST_YEAR,AMOUNT
0,Portugal,Lipton (L3),2023,12,AI_forecast,AI_P02F,2023.0,754356.237194
1,Great Britain,Lipton (L3),2023,12,AI_forecast,AI_P10F,2023.0,560030.558029
2,Spain,Pepsi Max (L3),2023,12,AI_forecast,AI_P09F,2023.0,88501.980847
3,Great Britain,7up (L3),2024,12,AI_forecast,AI_P10F,2023.0,363224.511516
4,Hungary,Lipton (L3),2023,9,AI_forecast,AI_P03F,2023.0,396176.120491


In [25]:
print("Valores nulos por columna:")
print(data.isnull().sum())

Valores nulos por columna:
COUNTRY            0
SUBBRAND           0
YEAR               0
MONTH              0
SCENARIO           0
FORECAST         900
FORECAST_YEAR    900
AMOUNT             0
dtype: int64


# Ejercicio 1

In [27]:
ventas_por_pais_producto = data.groupby(['COUNTRY', 'SUBBRAND'])['AMOUNT'].sum().reset_index()

fig = px.bar(ventas_por_pais_producto, x='COUNTRY', y='AMOUNT', color='SUBBRAND',
             title='Distribución de Ventas por País y Producto (Submarca)',
             labels={'SUBBRAND': 'Producto'})
fig.show()


Reino Unido tiene el volumen de ventas más alto, principalmente impulsado por la marca Lipton (L3), que representa la mayor parte de las ventas en este país. También hay contribuciones menores de Pepsi Regular (L3) y otros productos.

Dinamarca y Países Bajos también tienen volúmenes de ventas significativos, nuevamente dominados por Lipton (L3), seguido de otras marcas en menor proporción.

Pepsi Regular (L3) y Pepsi Max (L3) tienen una presencia más notable en ciertos países, aunque Lipton (L3) parece ser el producto más vendido en general en la mayoría de los países.

Países como República Checa, Portugal y España tienen volúmenes de ventas mucho más bajos en comparación con otros, lo que sugiere que estos mercados podrían estar menos desarrollados para estas marcas o tener menor demanda.

In [5]:
ventas_por_mes_ano = data.groupby(['YEAR', 'MONTH'])['AMOUNT'].sum().reset_index()

fig = px.line(ventas_por_mes_ano, x='MONTH', y='AMOUNT', color='YEAR', title='Distribución de Ventas por Mes y Año')
fig.show()


Año 2024 (línea roja):

Comienza con ventas relativamente altas y alcanza su punto máximo alrededor de los meses de mayo a julio, superando los 1.1 mil millones en ventas.
Después de julio, las ventas comienzan a disminuir progresivamente hasta diciembre, mostrando una tendencia de descenso en la segunda mitad del año.

Año 2023 (línea azul):

Muestra un crecimiento constante en las ventas a lo largo del año, comenzando en niveles bajos en enero y alcanzando un pico en diciembre.
Esto indica una tendencia de crecimiento anual, sin caídas significativas, lo que podría interpretarse como un año de expansión o consolidación en ventas.

Año 2025 (línea verde):

Comienza con niveles de ventas más bajos en comparación con los otros años y muestra una tendencia decreciente hasta mayo, momento en el que parece estabilizarse.
Esto podría sugerir un inicio lento en las ventas para el año 2025, o posiblemente una reducción en la demanda o en las previsiones de ventas.

In [28]:
ventas_por_marca_pais = data.groupby(['SUBBRAND', 'COUNTRY'])['AMOUNT'].sum().reset_index()

fig = px.bar(ventas_por_marca_pais, x='SUBBRAND', y='AMOUNT', color='COUNTRY',
             title='Distribución de Ventas por Marca y País',
             labels={'COUNTRY': 'País', 'SUBBRAND': 'Marca'})
fig.show()


Pepsi Max (L3) es la marca con el mayor volumen de ventas, alcanzando más de 12 mil millones en total, distribuido en varios países:

- Reino Unido y Países Bajos contribuyen

de manera significativa a las ventas de Pepsi Max.

- Otros países, como Italia, Noruega y España, también participan, pero en menor medida.

Lipton (L3) muestra un volumen de ventas menor en comparación con Pepsi Max, pero está distribuido de manera más balanceada entre varios países, incluidos Dinamarca, Reino Unido, España, y Países Bajos.

Otras marcas, como 7up (L3), 7up Free (L3) y Mountain Dew (L3), tienen volúmenes de ventas más bajos, con presencia limitada en unos pocos países.

# Ejercicio 2

In [29]:
pais_menos_ventas = data.groupby('COUNTRY')['AMOUNT'].sum().idxmin()
print(f"País con menos ventas: {pais_menos_ventas}")

marca_mas_ventas = data.groupby('SUBBRAND')['AMOUNT'].sum().idxmax()
print(f"Marca con más ventas: {marca_mas_ventas}")


País con menos ventas: Spain
Marca con más ventas: Pepsi Max (L3)


In [30]:
data_pais_menos_ventas = data[data['COUNTRY'] == pais_menos_ventas]

ventas_pais_menos_ventas = data_pais_menos_ventas.groupby(['YEAR', 'MONTH'])['AMOUNT'].sum().reset_index()

fig = px.line(ventas_pais_menos_ventas, x='MONTH', y='AMOUNT', color='YEAR',
              title=f'Tendencia y Estacionalidad de Ventas en {pais_menos_ventas}')
fig.show()


Año 2024 (línea roja):

Registra un pico importante de ventas alrededor de los meses de julio y agosto, alcanzando su valor máximo por encima de los 14 millones.
Después de este pico, hay una disminución significativa en ventas hacia finales de año, mostrando una fuerte estacionalidad con un auge en el verano seguido de una caída.

Año 2023 (línea azul):

Muestra un crecimiento constante a lo largo del año, sin grandes fluctuaciones estacionales, alcanzando su punto más alto en diciembre.
Esta tendencia ascendente indica una demanda sostenida en el tiempo, posiblemente reflejando un año de crecimiento progresivo en ventas.

Año 2025 (línea verde):

Muestra una tendencia decreciente desde enero hasta mayo, con un punto bajo alrededor del mes 5 (mayo).
Esto puede ser una señal de un inicio de año más débil en términos de ventas, aunque es posible que haya recuperación en los meses siguientes.

In [31]:
data_marca_mas_ventas = data[data['SUBBRAND'] == marca_mas_ventas]

ventas_marca_mas_ventas = data_marca_mas_ventas.groupby(['YEAR', 'MONTH'])['AMOUNT'].sum().reset_index()

fig = px.line(ventas_marca_mas_ventas, x='MONTH', y='AMOUNT', color='YEAR',
              title=f'Tendencia y Estacionalidad de Ventas para la Marca {marca_mas_ventas}')
fig.show()


Año 2024 (línea roja):

Alcanza su punto más alto en los meses de verano, con un pico de más de 700 millones en ventas.
Después de este pico, las ventas disminuyen constantemente hacia fin de año, indicando una fuerte estacionalidad donde el verano es el periodo de mayor demanda.

Año 2023 (línea azul):

Muestra un crecimiento continuo en ventas durante todo el año, empezando en niveles bajos en enero y alcanzando un máximo en diciembre.
No presenta una estacionalidad clara como en 2024, sino una tendencia de crecimiento sostenido, lo cual podría reflejar una consolidación de la marca en este periodo.

Año 2025 (línea verde):

Tiene una tendencia descendente desde enero hasta mayo, sin recuperación posterior en los datos mostrados.
Esto podría indicar un inicio de año débil en términos de ventas, lo que puede ser preocupante si continúa esta tendencia.

# Ejercicio 3

In [32]:
data_espana = data[data['COUNTRY'] == 'Spain'].dropna(subset=['FORECAST', 'AMOUNT'])

data_espana['FORECAST'] = pd.to_numeric(data_espana['FORECAST'], errors='coerce')
data_espana['AMOUNT'] = pd.to_numeric(data_espana['AMOUNT'], errors='coerce')


In [38]:
data_espana_promedio = data_espana.groupby(['YEAR', 'MONTH'])[['AMOUNT', 'FORECAST']].mean().reset_index()

fig = px.line(data_espana_promedio, x='MONTH', y=['AMOUNT', 'FORECAST'], color='YEAR',
              labels={'value': 'Ventas', 'variable': 'Tipo'},
              title='Promedio Mensual de Predicciones vs Ventas Reales en España')
fig.show()



Año 2024 (línea roja):

Es el año con el pico de ventas más alto, alcanzando más de 140,000 unidades en julio.
Después del pico de julio, las ventas muestran una ligera disminución, pero se mantienen relativamente altas hasta fin de año.
Este patrón sugiere que las predicciones fueron más optimistas en verano, posiblemente debido a una estacionalidad esperada o una campaña importante.

Año 2023 (línea azul):

Las ventas muestran un crecimiento gradual a lo largo del año, con un incremento notable hasta agosto, alcanzando un máximo alrededor de las 110,000 unidades.
Sin embargo, después del pico de agosto, las ventas bajan y se mantienen en un nivel moderado, lo que podría indicar un ajuste estacional o una reducción en la demanda.
Este crecimiento constante, sin variaciones significativas, indica un patrón estable.

Año 2025 (línea verde):

Las ventas inician en un nivel alto en enero, pero fluctúan a lo largo del primer semestre del año, alcanzando un máximo en abril.
El desempeño general es estable en comparación con los otros años, sin un aumento drástico, lo que podría señalar una demanda constante.

In [39]:
data_espana['Error_Absoluto'] = abs(data_espana['FORECAST'] - data_espana['AMOUNT'])
data_espana['Error_Porcentual'] = (data_espana['Error_Absoluto'] / data_espana['AMOUNT']) * 100


In [40]:
fig = px.bar(data_espana, x='MONTH', y='Error_Absoluto', color='YEAR',
             title='Error Absoluto de las Predicciones en España a lo Largo del Tiempo')
fig.show()


In [42]:
data_espana = data_espana.dropna(subset=['FORECAST'])

data_espana['Error_Absoluto'] = abs(data_espana['FORECAST'] - data_espana['AMOUNT'])

print(data_espana[['MONTH', 'YEAR', 'FORECAST', 'AMOUNT', 'Error_Absoluto']].head())

fig = px.bar(data_espana, x='MONTH', y='Error_Absoluto', color='YEAR',
             title='Error Absoluto de las Predicciones en España a lo Largo del Tiempo')
fig.show()



Empty DataFrame
Columns: [MONTH, YEAR, FORECAST, AMOUNT, Error_Absoluto]
Index: []


In [36]:
error_porcentaje_anual = data_espana.groupby('YEAR')['Error_Porcentual'].mean().reset_index()

fig = px.bar(error_porcentaje_anual, x='YEAR', y='Error_Porcentual',
             title='Error Porcentual Promedio de las Predicciones en España por Año',
             labels={'Error_Porcentual': 'Error Porcentual Promedio (%)'})
fig.show()
