In [None]:
import pandas as pd

# Carga tu archivo CSV en un DataFrame
# Asegúrate de que el archivo .csv esté en la misma carpeta que este notebook
df = pd.read_csv('tortilla_prices.csv')

# Muestra las primeras 5 filas para una inspección inicial
print(df.head())

In [None]:
df.info()

In [None]:
df.dropna(subset=['Price per kilogram'], inplace=True)

In [None]:
df.info()

In [None]:
# Importa la librería datetime
from datetime import datetime

# Combina las columnas Year, Month, y Day en una sola columna de fecha
df['date'] = pd.to_datetime(df[['Year', 'Month', 'Day']])

# Muestra el DataFrame con la nueva columna de fecha
df.head()

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Configurar el estilo de los gráficos
sns.set_style('whitegrid')

# --- Evolución del Precio Promedio a lo largo del Tiempo ---
# Agrupar los datos por fecha y calcular el precio promedio
precio_promedio_por_fecha = df.groupby('date')['Price per kilogram'].mean()

# Crear un gráfico de líneas para visualizar la tendencia
plt.figure(figsize=(12, 6))
precio_promedio_por_fecha.plot()
plt.title('Evolución del Precio Promedio de la Tortilla en México')
plt.xlabel('Fecha')
plt.ylabel('Precio Promedio por Kilogramo')
plt.grid(True)
plt.show()


# --- Comparación de Precios por Estado ---
# Calcular el precio promedio por estado y ordenarlo
precio_promedio_por_estado = df.groupby('State')['Price per kilogram'].mean().sort_values(ascending=False)

# Crear un gráfico de barras
plt.figure(figsize=(15, 8))
sns.barplot(x=precio_promedio_por_estado.index, y=precio_promedio_por_estado.values, palette='viridis')
plt.title('Precio Promedio de la Tortilla por Estado')
plt.xlabel('Estado')
plt.ylabel('Precio Promedio por Kilogramo')
plt.xticks(rotation=90)
plt.show()

In [None]:
# --- Estadísticas descriptivas de los precios ---
print("Estadísticas Descriptivas del Precio por Kilogramo:")
print(df['Price per kilogram'].describe())

# --- Análisis por Tipo de Tienda ---
# Calcular el precio promedio por tipo de tienda
precio_promedio_por_tienda = df.groupby('Store type')['Price per kilogram'].mean().sort_values()

# Crear un gráfico de barras para comparar los precios
plt.figure(figsize=(10, 6))
sns.barplot(x=precio_promedio_por_tienda.index, y=precio_promedio_por_tienda.values, palette='coolwarm')
plt.title('Precio Promedio de la Tortilla por Tipo de Tienda')
plt.xlabel('Tipo de Tienda')
plt.ylabel('Precio Promedio por Kilogramo')
plt.xticks(rotation=45)
plt.show()

In [None]:
# Analiza los precios más altos para identificar los picos
precios_altos = df.nlargest(10, 'Price per kilogram')
print("Top 10 de precios más altos y sus fechas:")
print(precios_altos[['State', 'City', 'date', 'Price per kilogram']])

# Opcional: Filtra por un rango de fechas para investigar un pico específico
# df_pico = df[(df['date'] >= '2020-01-01') & (df['date'] <= '2020-12-31')]
# print(df_pico['State'].value_counts())

In [None]:
# Filtra los datos para obtener solo los de Baja California
df_baja = df[df['State'] == 'Baja California']

# Agrupa los precios de Baja California por fecha
precio_baja_por_fecha = df_baja.groupby('date')['Price per kilogram'].mean()

# Agrupa los precios nacionales para la comparación
precio_nacional_por_fecha = df.groupby('date')['Price per kilogram'].mean()

# Crea un gráfico de líneas para comparar la evolución de precios
plt.figure(figsize=(15, 8))
precio_nacional_por_fecha.plot(label='Promedio Nacional')
precio_baja_por_fecha.plot(label='Baja California')

plt.title('Evolución del Precio de la Tortilla: Baja California vs. Promedio Nacional')
plt.xlabel('Fecha')
plt.ylabel('Precio Promedio por Kilogramo')
plt.legend()
plt.grid(True)
plt.show()

In [None]:
# Calcula el precio promedio por tipo de tienda, solo para Baja California
precio_por_tienda_baja = df_baja.groupby('Store type')['Price per kilogram'].mean().sort_values()

# Crea un gráfico de barras para comparar los precios
plt.figure(figsize=(10, 6))
sns.barplot(x=precio_por_tienda_baja.index, y=precio_por_tienda_baja.values, palette='viridis')
plt.title('Precio Promedio de la Tortilla por Tipo de Tienda en Baja California')
plt.xlabel('Tipo de Tienda')
plt.ylabel('Precio Promedio por Kilogramo')
plt.xticks(rotation=45)
plt.show()

In [None]:
# Agrupa los datos por fecha y por estado, calculando el precio promedio
precios_por_estado_fecha = df.groupby(['date', 'State'])['Price per kilogram'].mean().unstack()

# Selecciona los estados de interés (Sonora y Tlaxcala)
estados_a_comparar = precios_por_estado_fecha[['Sonora', 'Tlaxcala']]

# Crea un gráfico de líneas para la comparación
plt.figure(figsize=(15, 8))
estados_a_comparar.plot(ax=plt.gca())
plt.title('Comparación de la Evolución del Precio del Kilo de Tortilla: Sonora vs. Tlaxcala')
plt.xlabel('Fecha')
plt.ylabel('Precio Promedio por Kilogramo')
plt.legend(title='Estado')
plt.grid(True)
plt.show()

In [None]:
# Calcula el precio promedio por tipo de tienda
precio_por_tienda = df.groupby('Store type')['Price per kilogram'].mean().sort_values()

# Crea un gráfico de barras para visualizar la diferencia de precios
plt.figure(figsize=(10, 6))
sns.barplot(x=precio_por_tienda.index, y=precio_por_tienda.values, palette='coolwarm')
plt.title('Precio Promedio de la Tortilla por Tipo de Tienda')
plt.xlabel('Tipo de Tienda')
plt.ylabel('Precio Promedio por Kilogramo')
plt.xticks(rotation=45)
plt.show()

In [None]:
# Importar las librerías si no lo has hecho
import matplotlib.pyplot as plt
import seaborn as sns

# Calcular el precio promedio por tipo de tienda a nivel nacional
precio_promedio_por_tienda_nacional = df.groupby('Store type')['Price per kilogram'].mean().sort_values()

# Crear el gráfico de barras para comparar los precios
plt.figure(figsize=(10, 6))
sns.barplot(x=precio_promedio_por_tienda_nacional.index, y=precio_promedio_por_tienda_nacional.values, palette='coolwarm')
plt.title('Precio Promedio de la Tortilla por Tipo de Tienda (Nivel Nacional)')
plt.xlabel('Tipo de Tienda')
plt.ylabel('Precio Promedio por Kilogramo')
plt.xticks(rotation=45)
plt.show()