In [1]:
import os
import json
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
from datetime import datetime
from utiles import json_loader, obtener_df


pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

json_list = json_loader('jsons')

df = obtener_df(json_list)


In [2]:

df_type_counts = df.groupby('type').size().reset_index(name='counts')
df_type_qualification = df.groupby('type')['qualification'].mean().reset_index(name='qualification')
px.pie(
    df_type_counts,
    names='type',
    values='counts',
    title='Proporción de establecimientos por tipo de local:',
    labels={'type': 'Tipo', 'counts': 'Cantidad'},
    color='type',
    height=400
).show()
px.bar(
    df_type_qualification,
    x='type',
    y='qualification',
    title='Calificación promedio por tipo de local:',
    labels={'type': 'Tipo', 'qualification': 'Calificación'},
    color='type',
    height=400,
    range_y= (df_type_qualification['qualification'].min(), df_type_qualification['qualification'].max())
)

In [3]:
df_type_facebook = df.groupby('contact.facebook').count().reset_index()
df_type_instagram = df.groupby('contact.instagram').count().reset_index()
df_type_website = df.groupby('contact.website').count().reset_index()
df_type_phone = df.groupby('contact.phone').count().reset_index()

df_type_facebook['contact.facebook'] = df_type_facebook['contact.facebook'].map({True: 'Si', False: 'No'})
df_type_instagram['contact.instagram'] = df_type_instagram['contact.instagram'].map({True: 'Si', False: 'No'})
df_type_website['contact.website'] = df_type_website['contact.website'].map({True: 'Si', False: 'No'})
df_type_phone['contact.phone'] = df_type_phone['contact.phone'].map({True: 'Si', False: 'No'})

px.bar(
    df_type_facebook,
    x='contact.facebook',
    y='name',
    labels={'contact.facebook': 'Facebook', 'name': 'Cantidad de locales'},
    color='contact.facebook',
    title='Cantidad de locales que poseen Facebook',
    height=300
).show()

px.bar(
    df_type_instagram,
    x='contact.instagram',
    y='name',
    labels={'contact.instagram': 'Instagram', 'name': 'Cantidad de locales'},
    color='contact.instagram',
    title='Cantidad de locales que poseen Instagram',
    height=300
).show()

px.bar(
    df_type_website,
    x='contact.website',
    y='name',
    labels={'contact.website': 'Website', 'name': 'Cantidad de locales'},
    color='contact.website',
    title='Cantidad de locales que poseen Website',
    height=300
).show()

px.bar(
    df_type_phone,
    x='contact.phone',
    y='name',
    labels={'contact.phone': 'Telefono', 'name': 'Cantidad de locales'},
    color='contact.phone',
    title='Cantidad de locales que poseen Telefono',
    height=300
).show()

El objetivo que me trace con el proyecto fue el de analizar los horarios de apertura y cierre de los restaurantes que puede tener varios objetivos y beneficios, tanto para los propietarios de los restaurantes como para los clientes y analistas del sector como los siguientes: 

1. Optimizacion de Operaciones
Identificacion de Horas Pico: analizar los horarios puede ayudar a identificar las horas mas concurridas, lo que permite a los restaurantes ajustar su personal y recursos para satisfacer la demanda.
Ajuste de Horarios: Si se observa que ciertos días o horas tienen poca afluencia, los propietarios pueden considerar ajustar los horarios de apertura o cierre para optimizar costos.
2. Mejora de la Experiencia del Cliente
Disponibilidad: Conocer los horarios de apertura permite a los clientes planificar sus visitas, evitando frustraciones por encontrar el restaurante cerrado.
Promociones y Eventos: Los restaurantes pueden programar promociones o eventos especiales en horarios donde normalmente hay menos clientes, atrayendo mas visitantes.
3. Analisis de Competencia
Comparacion de Horarios: analizar los horarios de apertura de la competencia puede ayudar a los restaurantes a posicionarse mejor en el mercado, eligiendo horarios que les permitan captar mas clientes.
Identificacion de Oportunidades: Si muchos restaurantes en una zona cierran temprano, un restaurante que permanezca abierto mas tiempo puede atraer a clientes que buscan opciones mas tarde.
4. Planificacion de Recursos
Gestion de Personal: Con un analisis de horarios, los restaurantes pueden planificar mejor la programacion de su personal, asegurando que haya suficiente personal durante las horas pico y evitando el exceso de personal en horas de baja afluencia.
Control de Costos: Ajustar los horarios de operacion puede ayudar a reducir costos operativos, como el consumo de energía y otros gastos asociados.
5. Tendencias del Mercado
Identificacion de Patrones: Analizar los horarios puede revelar tendencias en el comportamiento del consumidor, lo que puede ser útil para la planificacion a largo plazo.
Adaptacion a Cambios: Los cambios en los habitos de los consumidores (por ejemplo, mas personas que cenan tarde) pueden ser identificados a través del analisis de horarios, permitiendo a los restaurantes adaptarse a estas tendencias.
6. Datos para Toma de Decisiones
Informes y Analisis: Los datos sobre horarios pueden ser utilizados en informes para la toma de decisiones estratégicas, como la expansion de un negocio o la apertura de nuevas sucursales.

In [4]:
# Filtrar los datos para obtener solo los bar restaurant
df_barrestaurant = df[df['type'] == 'barrestaurant']

# Contar las especialidades más comunes
df_speciality_counts = df_barrestaurant['speciality'].explode().value_counts().reset_index()
df_speciality_counts.columns = ['speciality', 'count']

# Crear el gráfico de barras
fig = px.bar(
    df_speciality_counts,
    x='speciality',
    y='count',
    title='Especialidades más comunes en los Bar Restaurant',
    labels={'speciality': 'Especialidad', 'count': 'Cantidad'},
    color='speciality',
    height=550
)

fig.show()

In [5]:
# Filtrar los datos para obtener solo los bar restaurant
df_barrestaurant = df[df['type'] == 'barrestaurant']

# Explode the services column to count each service individually
df_services = df_barrestaurant['services'].explode().value_counts().reset_index()
df_services.columns = ['service', 'count']

# Crear el gráfico de barras apiladas
fig = px.bar(
    df_services,
    x='service',
    y='count',
    title='Servicios más comunes y menos comunes en los Bar Restaurant',
    labels={'service': 'Servicio', 'count': 'Cantidad'},
    color='service',
    height=700
)

fig.show()

In [6]:
# Contar los platos en cada categoría del menú
menu_categories = [
    'menu.starters', 'menu.salads', 'menu.vegetables', 'menu.meats', 'menu.beef',
    'menu.seafood', 'menu.burgers', 'menu.desserts', 'menu.cocktails', 'menu.twist_cocktails',
    'menu.classic_cocktails', 'menu.tiki_cocktails', 'menu.tiki_author_cocktails', 'menu.others',
    'menu.drinks'
]

menu_counts = {category: df[category].explode().notna().sum() for category in menu_categories}
df_menu_counts = pd.DataFrame(list(menu_counts.items()), columns=['category', 'count'])

# Crear el gráfico de barras
fig = px.bar(
    df_menu_counts,
    x='category',
    y='count',
    title='Cantidad de platos en cada categoría del menú',
    labels={'category': 'Categoría', 'count': 'Cantidad'},
    color='category',
    height=550
)

fig.show()

In [3]:
# Filtrar las columnas de precios de bebidas
df_drinks_prices = df[drink_price_columns]
df_drinks_prices = df_drinks_prices.rename(columns={'drinks.nacional': 'nacional', 'drinks.importada': 'importada'})

# Crear una columna para indicar si la bebida es nacional o importada
df_drinks_prices = df_drinks_prices.melt(var_name='drink', value_name='price')
df_drinks_prices['origin'] = df_drinks_prices['drink'].apply(lambda x: 'Nacional' if 'nacional' in x.lower() else 'Importada')

# Eliminar filas con precios nulos
df_drinks_prices = df_drinks_prices.dropna(subset=['price'])

# Convertir la columna de precios a numérica
df_drinks_prices['price'] = pd.to_numeric(df_drinks_prices['price'], errors='coerce')

# Calcular el porcentaje de bebidas nacionales e importadas
total_drinks = df_drinks_prices['origin'].value_counts().sum()
percentages = df_drinks_prices['origin'].value_counts() / total_drinks * 100

# Crear el gráfico de violín
fig = px.violin(
    df_drinks_prices,
    x='origin',
    y='price',
    color='origin',
    box=True,
    points='all',
    title='Distribución de precios de las bebidas (Nacionales vs Importadas)',
    labels={'origin': 'Origen', 'price': 'Precio'}
)

# Añadir el porcentaje al título del gráfico
fig.update_layout(
    title=f'Distribución de precios de las bebidas (Nacionales: {percentages["Nacional"]:.2f}%, Importadas: {percentages["Importada"]:.2f}%)'
)

fig.show()

NameError: name 'df' is not defined