---
<a id="inicio"></a>
# Proyecto de Ciencias de Datos sobre Restaurantes y Bares:
---

***Comencemos*** importando las bibliotecas necesarias y el archivo **data_process** donde se procesan los datos clave, este archivo contiene la logica para cargar todos los jsons y aplanar los datos para poder convertirlos en un DataFrame.

In [1]:
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
import ipywidgets as wgt
from data_process import load_datas, flatten_data
from map_loaders import plot_havana_map, map_geojson_show
from static_datas import *

Ahora, extraeremos los jsons y los obtenemos como una lista de diccionarios llamada *'json_datas'*, posteriormente tomaremos esta lista de elementos y aplanamos sus datos usando el metodo *flatten_data* para luego convertir los datos planos a un objeto de tipo ***DataFrame***.

In [2]:
json_datas = load_datas('db')        # Cargamos la lista de diccionarios que corresponden a cada json
flat_data = flatten_data(json_datas) # Convertimos los diccionarios a una nueva lista adaptada para poder convertirla en el DataFrame
df = pd.DataFrame(flat_data)         # Simplemente convertimos los datos ya aplanados a un objeto DataFrame

df['level'] = pd.Categorical(df['level'], categories=['economic', 'medium', 'high', 'luxurious'], ordered=True)
df = df.sort_values('level')

274


Entonces ya que tenemos los datos principales listos, podremos observar la informacion obtenida como una lista ordenada. Esta tabla es solo demostrativa, no se pretende mostrar nada especial con ella, asi que simplemente puede ignorarla y saltar al siguiente *marco*.

In [3]:
pd.set_option('display.max_rows', None)    #Esto es para que se pueda visualizar todas las filas de la tabla
pd.set_option('display.max_columns', None) #Esto es para que se pueda visualizar todas las columnas de la tabla
df.sort_values('name').reset_index(drop=True)   #Mostramos la lista completa de locales, si no quiere verla(supongo que no) Solamente ocultela.

Unnamed: 0,name,phone,email,web,est_type,bus_type,cuisine,cap,promo,rating,reviews,level,fb,ig,tw,menu_types,menu_breakfast_mean,menu_breakfast_min,menu_breakfast_max,menu_breakfast_count,menu_breakfast_sum,menu_breakfast_median,menu_breakfast_mode,menu_appetizer_mean,menu_appetizer_min,menu_appetizer_max,menu_appetizer_count,menu_appetizer_sum,menu_appetizer_median,menu_appetizer_mode,menu_starters_mean,menu_starters_min,menu_starters_max,menu_starters_count,menu_starters_sum,menu_starters_median,menu_starters_mode,menu_mains_mean,menu_mains_min,menu_mains_max,menu_mains_count,menu_mains_sum,menu_mains_median,menu_mains_mode,menu_pizza_mean,menu_pizza_min,menu_pizza_max,menu_pizza_count,menu_pizza_sum,menu_pizza_median,menu_pizza_mode,menu_pasta_mean,menu_pasta_min,menu_pasta_max,menu_pasta_count,menu_pasta_sum,menu_pasta_median,menu_pasta_mode,menu_seafood_mean,menu_seafood_min,menu_seafood_max,menu_seafood_count,menu_seafood_sum,menu_seafood_median,menu_seafood_mode,menu_sandwich_mean,menu_sandwich_min,menu_sandwich_max,menu_sandwich_count,menu_sandwich_sum,menu_sandwich_median,menu_sandwich_mode,menu_sides_mean,menu_sides_min,menu_sides_max,menu_sides_count,menu_sides_sum,menu_sides_median,menu_sides_mode,menu_salads_mean,menu_salads_min,menu_salads_max,menu_salads_count,menu_salads_sum,menu_salads_median,menu_salads_mode,menu_soups_mean,menu_soups_min,menu_soups_max,menu_soups_count,menu_soups_sum,menu_soups_median,menu_soups_mode,menu_desserts_mean,menu_desserts_min,menu_desserts_max,menu_desserts_count,menu_desserts_sum,menu_desserts_median,menu_desserts_mode,menu_cocktails_mean,menu_cocktails_min,menu_cocktails_max,menu_cocktails_count,menu_cocktails_sum,menu_cocktails_median,menu_cocktails_mode,menu_wines_mean,menu_wines_min,menu_wines_max,menu_wines_count,menu_wines_sum,menu_wines_median,menu_wines_mode,menu_alcoholic_drinks_mean,menu_alcoholic_drinks_min,menu_alcoholic_drinks_max,menu_alcoholic_drinks_count,menu_alcoholic_drinks_sum,menu_alcoholic_drinks_median,menu_alcoholic_drinks_mode,menu_non_alcoholic_drinks_mean,menu_non_alcoholic_drinks_min,menu_non_alcoholic_drinks_max,menu_non_alcoholic_drinks_count,menu_non_alcoholic_drinks_sum,menu_non_alcoholic_drinks_median,menu_non_alcoholic_drinks_mode,menu_infusions_mean,menu_infusions_min,menu_infusions_max,menu_infusions_count,menu_infusions_sum,menu_infusions_median,menu_infusions_mode,menu_water_mean,menu_water_min,menu_water_max,menu_water_count,menu_water_sum,menu_water_median,menu_water_mode,menu_others_mean,menu_others_min,menu_others_max,menu_others_count,menu_others_sum,menu_others_median,menu_others_mode,menu_mean,menu_min,menu_max,menu_count,menu_sum,menu_median,menu_mode,hours_open,hours_close,hours_days,reservation_online,reservation_phone,reservation_in_person,reservation_others,delivery_home,delivery_takeaway,delivery_on_site,delivery_others,payment_cash,payment_card,payment_transfer,payment_others,amenities_wifi,amenities_accessible,amenities_live_music,amenities_outdoor,amenities_pet_friendly,loc_street,loc_council,loc_municipe,loc_province,loc_zip,loc_country,loc_x,loc_y
0,28 y Mar,72125013.0,,,restaurant,private,cuban,12,False,4.5,75,medium,28 y Mar Restaurante,@28_y_mar_restaurante,,"[breakfast, appetizer, mains, salads, pasta, s...",1295.0,650.0,2800.0,10,12950.0,925.0,750.0,1794.230769,750.0,7500.0,26,46650.0,1700.0,950.0,,,,0,0.0,,,5178.571429,3500.0,7250.0,7,36250.0,5000.0,3500.0,,,,0,0.0,,,1683.333333,1150.0,2150.0,3,5050.0,1750.0,1150.0,,,,0,0.0,,,,,,0,0.0,,,473.684211,350.0,850.0,19,9000.0,450.0,450.0,1587.5,1350.0,1750.0,4,6350.0,1625.0,1350.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,650.0,650.0,650.0,1,650.0,650.0,650.0,540.0,300.0,850.0,10,5400.0,525.0,350.0,583.333333,350.0,950.0,12,7000.0,600.0,350.0,550.0,300.0,900.0,6,3300.0,475.0,300.0,,,,0,0.0,,,1433.565307,300.0,7500.0,98,132600.0,787.5,350.0,08:30,24:00,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,False,True,False,False,False,True,False,True,False,False,False,False,False,False,,,Playa,La Habana,,Cuba,23.123617,-82.427105
1,2KFE,,,,restaurant,private,cuban,12,False,5.0,30,luxurious,,,,"[starters, mains, non_alcoholic_drinks]",,,,0,0.0,,,,,,0,0.0,,,575.0,100.0,1200.0,6,3450.0,550.0,800.0,680.0,400.0,900.0,5,3400.0,650.0,400.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,243.571429,100.0,600.0,14,3410.0,210.0,250.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,499.52381,100.0,1200.0,25,10260.0,550.0,250.0,10:00,20:00,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,False,False,False,False,False,True,False,True,False,False,False,False,False,False,"entre Martí y Maceo, Pereira",,Regla,La Habana,,Cuba,,
2,5 Esquinas Trattoria,78606295.0,trattoria5esquinashabana@gmail.com,,restaurant,private,italian,12,False,4.5,75,high,https://www.facebook.com/5esquinastrattoria/,https://www.instagram.com/5esquinastrattoria?i...,,"[appetizer, starters, salads, soups, pizza, si...",,,,0,0.0,,,1500.0,300.0,3000.0,3,4500.0,1200.0,300.0,2680.0,1200.0,6000.0,5,13400.0,2500.0,1200.0,3900.0,3500.0,4500.0,6,23400.0,3700.0,3500.0,2588.888889,2000.0,3200.0,9,23300.0,2700.0,2000.0,2775.0,2200.0,3500.0,20,55500.0,2800.0,2800.0,3750.0,3500.0,4500.0,4,15000.0,3500.0,3500.0,,,,0,0.0,,,536.842105,350.0,800.0,19,10200.0,600.0,350.0,1750.0,1000.0,2000.0,4,7000.0,2000.0,2000.0,1600.0,1200.0,2000.0,3,4800.0,1600.0,1200.0,800.0,800.0,800.0,3,2400.0,800.0,800.0,1293.333333,1200.0,1600.0,15,19400.0,1200.0,1200.0,1200.0,1200.0,1200.0,2,2400.0,1200.0,1200.0,712.5,550.0,900.0,4,2850.0,700.0,550.0,483.333333,400.0,600.0,6,2900.0,500.0,500.0,478.571429,300.0,800.0,7,3350.0,350.0,350.0,400.0,400.0,400.0,2,800.0,400.0,400.0,,,,0,0.0,,,1653.029318,300.0,6000.0,112,191200.0,1200.0,1200.0,11:00,22:30,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,False,False,True,False,False,True,False,True,False,False,False,False,True,False,Calle Habana #104 Esquina Cuarteles,Habana Vieja,La Habana Vieja,La Habana,,Cuba,,
3,5ta Billar,52943290.0,,,bar,private,others,12,True,4.8,75,medium,,,,"[starters, mains, pizza, alcoholic_drinks, non...",,,,0,0.0,,,,,,0,0.0,,,1022.5,110.0,2950.0,12,12270.0,910.0,110.0,1928.181818,950.0,4950.0,11,21210.0,1800.0,1800.0,1325.0,700.0,1900.0,4,5300.0,1350.0,700.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,887.083333,320.0,3720.0,24,21290.0,770.0,400.0,385.789474,220.0,750.0,19,7330.0,350.0,350.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,1109.710925,110.0,4950.0,70,67400.0,910.0,110.0,13:00,01:00,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,True,False,False,False,True,True,False,True,False,False,False,True,False,False,,,Regla,La Habana,,Cuba,,
4,700º,54063906.0,,700gradoshabana,restaurant,private,others,12,False,4.45,75,high,,,,"[breakfast, appetizer, pasta, pizza, mains, se...",,,,0,0.0,,,1104.545455,790.0,1600.0,11,12150.0,990.0,890.0,,,,0,0.0,,,2250.0,1650.0,3550.0,12,27000.0,2025.0,1650.0,1325.0,1200.0,1450.0,2,2650.0,1325.0,1200.0,1800.0,1100.0,2500.0,4,7200.0,1800.0,1100.0,2920.0,1850.0,3600.0,5,14600.0,2800.0,2800.0,,,,0,0.0,,,100.0,100.0,100.0,5,500.0,100.0,100.0,100.0,100.0,100.0,1,100.0,100.0,100.0,,,,0,0.0,,,,,,0,0.0,,,431.538462,300.0,550.0,13,5610.0,450.0,380.0,400.0,400.0,400.0,1,400.0,400.0,400.0,578.571429,350.0,750.0,7,4050.0,550.0,750.0,427.142857,250.0,830.0,7,2990.0,380.0,250.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,1039.708927,100.0,3600.0,68,77250.0,550.0,100.0,11:00,03:00,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,False,True,False,False,False,True,True,True,False,False,False,False,False,False,avenida 41 esquina 86,,Marianao,La Habana,,Cuba,,
5,Abuelo D'Oro,76472100.0,,https://es.restaurantguru.com/El-abuelo-de-oro...,restaurant,private,cuban,12,False,4.5,75,luxurious,https://www.facebook.com/AbueloDOro?utm_source...,@abuelo_de_oro_cuba,,"[appetizer, pizza, pasta, mains, seafood, sand...",,,,0,0.0,,,1245.0,450.0,3000.0,10,12450.0,750.0,500.0,,,,0,0.0,,,4471.052632,1200.0,19000.0,19,84950.0,3000.0,3000.0,1233.333333,1000.0,1500.0,6,7400.0,1200.0,1100.0,1350.0,1200.0,1500.0,2,2700.0,1350.0,1200.0,4120.0,3000.0,4800.0,5,20600.0,4000.0,4000.0,1650.0,1500.0,1800.0,2,3300.0,1650.0,1500.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,2344.897661,450.0,19000.0,44,131400.0,1500.0,500.0,12:00,24:00,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,False,True,False,False,False,True,True,True,False,False,False,False,False,False,Calzada Aldabo % 12 y 13,Aldabo,Boyeros,La Habana,,Cuba,,
6,Aires de Cojimar,58385050.0,,,restaurant,private,others,15,False,4.4,75,medium,https://www.facebook.com/Aires de Cojimar,https://www.instagram.com/aires_decojimar,,"[starters, soups, mains, sides, desserts]",,,,0,0.0,,,,,,0,0.0,,,664.583333,350.0,1200.0,12,7975.0,550.0,550.0,1917.391304,1150.0,5500.0,23,44100.0,1550.0,1450.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,400.0,400.0,400.0,1,400.0,400.0,400.0,,,,0,0.0,,,580.0,500.0,750.0,5,2900.0,550.0,500.0,450.0,450.0,450.0,1,450.0,450.0,450.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,802.394928,350.0,5500.0,42,55825.0,550.0,400.0,12:00,00:00,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,False,False,False,False,False,True,True,False,False,False,False,False,False,False,Pezuela #3e05 entre RUA y Espartero,Cojimar,Habana del Este,La Habana,,Cuba,,
7,Al Campestre,53236469.0,,,restaurant,private,others,70,False,3.4,75,medium,Alcampestre.,alcampestre,,"[starters, pizza, pasta, mains, seafood, sides...",,,,0,0.0,,,,,,0,0.0,,,836.470588,180.0,2200.0,17,14220.0,560.0,350.0,3201.875,1300.0,10500.0,16,51230.0,2560.0,2450.0,1160.0,550.0,1960.0,3,3480.0,970.0,550.0,1331.25,820.0,2400.0,8,10650.0,1100.0,820.0,4868.888889,4500.0,5200.0,9,43820.0,4860.0,4500.0,,,,0,0.0,,,379.0,100.0,960.0,20,7580.0,350.0,350.0,,,,0,0.0,,,,,,0,0.0,,,2156.25,380.0,5000.0,8,17250.0,650.0,650.0,562.0,400.0,1100.0,15,8430.0,450.0,400.0,,,,0,0.0,,,,,,0,0.0,,,450.0,450.0,450.0,1,450.0,450.0,450.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,1660.637164,100.0,10500.0,97,157110.0,650.0,350.0,09:00,23:00,"[mon, tue, wed, thu, fri, sat, sun]",False,True,False,False,True,True,False,False,True,True,False,True,False,False,False,False,False,"El Intermitente, Via Blanca, Alamar",,Habana del Este,La Habana,,Cuba,,
8,Allegro,7661010.0,,,restaurant,state,italian,20,False,4.0,75,medium,,,,"[starters, mains, pizza]",,,,0,0.0,,,,,,0,0.0,,,319.0,313.0,329.0,3,957.0,315.0,313.0,510.0,410.0,570.0,3,1530.0,550.0,410.0,563.25,390.0,735.0,4,2253.0,564.0,390.0,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,,,,0,0.0,,,464.083333,313.0,735.0,10,4740.0,550.0,313.0,12:00,21:00,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,True,False,False,False,True,True,True,False,False,False,False,False,False,False,"Paseo de la Villa, Villa Panamericana",,Habana del Este,La Habana,,Cuba,,
9,Altahabana_Club,76441348.0,,,bar,private,others,12,False,4.5,75,medium,https://www.facebook.com/profile.php?id=100064...,,,"[appetizer, mains, seafood, pizza, sandwich, p...",,,,0,0.0,,,1154.545455,400.0,3500.0,11,12700.0,950.0,550.0,,,,0,0.0,,,1455.0,1300.0,1750.0,10,14550.0,1375.0,1350.0,1195.454545,950.0,1500.0,11,13150.0,1150.0,1150.0,1090.0,900.0,1250.0,5,5450.0,1150.0,900.0,1691.666667,1550.0,1800.0,6,10150.0,1700.0,1800.0,1048.75,700.0,1500.0,8,8390.0,1030.0,1080.0,333.333333,250.0,400.0,3,1000.0,350.0,250.0,500.0,500.0,500.0,1,500.0,500.0,500.0,,,,0,0.0,,,625.0,500.0,750.0,2,1250.0,625.0,500.0,558.75,460.0,750.0,16,8940.0,550.0,550.0,850.0,850.0,850.0,1,850.0,850.0,850.0,1107.8125,250.0,4000.0,32,35450.0,1000.0,1300.0,424.166667,250.0,550.0,12,5090.0,440.0,300.0,385.714286,150.0,600.0,7,2700.0,400.0,150.0,200.0,200.0,200.0,1,200.0,200.0,200.0,240.0,200.0,280.0,2,480.0,240.0,200.0,803.762091,150.0,4000.0,128,120850.0,737.5,200.0,14:00,02:00,"[mon, tue, wed, thu, fri, sat, sun]",False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,"Calle D, esq. a 10",Altabana,Boyeros,La Habana,,Cuba,,


---

Pero, Observar datos en una tabla resulta poco *atractivo*, asi que mejor visualicemos la ***ubicación*** de los locales en un **mapa** con información básica, útil si deseas tener una noción basica de su ***ubicación*** y otros **datos** de *interés*.

In [4]:
filter_df = df.dropna(subset=['loc_x', 'loc_y'])
plot_havana_map(
    filter_df,
    {
        "est_type": True,
        "cuisine": True,
        "phone": True,
        "rating": True,
        "cap": True,
        "loc_street": True,
        "loc_municipe": True,
        "loc_x": False,
        "loc_y": False,
    },
    labels=dict_data_labels,
    size='cap', 
    color='rating'
)

---

La distribucion de la puntuacion general total ronda los 4.5 en promedio como podemos observar en la siguiente grafica: 

In [5]:
px.histogram(df, x='rating',labels=dict_data_labels, title='Distribución de la puntuacion general en total')

Una de las preguntas es por qué la **puntuación** está distribuida de forma tan distintiva sobre *4.5* y no se distribuye como una [**distribución de Gauss**](https://es.wikipedia.org/wiki/Distribución_normal). Esto podría deberse a la irregularidad en los datos o a la falta de más datos para formar una distribución gaussiana. En el futuro, espero dar una respuesta definitiva a este problema.

---

---

Ahora observemos el promedio de la puntuacion general definida por **municipios**, el mapa, indica datos como el **municipio**, la **Cantidad de locales evaluados** en ese **municipio**, y por supuesto la ***puntuacion promedio***.

**Nota:** Agradecimientos especiales a [Yudivian](https://github.com/yudivian) por compartir el geojson usado en este proyecto, gracias a su   [proyecto en *GitHub*](https://github.com/yudivian/cuba-geojsons).

In [6]:
result_tabla = map_geojson_show(df)
result_tabla.sort_values(by='Cantidad de locales evaluados', ascending=False).reset_index(drop=True) # 'Municipio', 'Cantidad de locales evaluados', 'Puntuacion promedio'

municipe_list = [ 'Plaza de la Revolucion', 'Playa', 'La Habana Vieja', 'Centro Habana', 'Cerro', 'Diez de Octubre', 'Marianao', 'Boyeros', 'Arroyo Naranjo', 'Cotorro', 'San Miguel del Padron', 'Regla', 'Guanabacoa', 'La Lisa', 'Habana del Este']



---
<a id="puntuacionpromedio"></a>
                Tablas respecto a la ***puntuacion promedio***:
---
  Ahora observemos la diferencia de ***puntuacion promedio*** por el ***Tipo de establecimiento***, ***Tipo de negocio*** y por la ***tematica*** que utiliza, o sea de que pais principal es su oferta gastronomica.

  Ademas de ello tambien vale la pena ver por el nivel de ***accecibilidad economica*** respecto a la ***puntuacion promedio***, aunque la unica conclusion que podemos sacar de esto es que los restaurantes que dan un servicio de nivel economico tienen a recibir una peor puntuacion.

  Ordenado de $Menos$ a $Más$

---
>**Nota**: Ha sido acercado artificialmente para mostrar la diferencia entre uno y el otro  mas graficamente, fijese en los valores individuales de cada uno para evitar confusiones con los rangos de los datos.
---
Ir a [inicio](#inicio)

In [7]:
df_est_type = df.groupby('est_type', observed=True)['rating'].mean().reset_index()
df_bus_type = df.groupby('bus_type', observed=True)['rating'].mean().reset_index()
df_cuisine = df.groupby('cuisine', observed=True)['rating'].mean().reset_index()
df_level = df.groupby('level', observed=True)['rating'].mean().reset_index()

df_est_type_add_reviews = df.groupby('est_type', observed=True).size().reset_index(name='cantity')
df_bus_type_add_reviews = df.groupby('bus_type', observed=True).size().reset_index(name='cantity')
df_cuisine_add_reviews = df.groupby('cuisine', observed=True).size().reset_index(name='reviews')
df_level_add_reviews = df.groupby('level', observed=True).size().reset_index(name='cantity')

df_est_type = df_est_type.merge(df_est_type_add_reviews, on='est_type', how='left')
df_bus_type = df_bus_type.merge(df_bus_type_add_reviews, on='bus_type', how='left')
df_cuisine = df_cuisine.merge(df_cuisine_add_reviews, on='cuisine', how='left')
df_level = df_level.merge(df_level_add_reviews, on='level', how='left')

df_est_type['est_type'] = df_est_type['est_type'].map({'bar': 'Bar', 'restaurant': 'Restaurante'})
df_bus_type['bus_type'] = df_bus_type['bus_type'].map({'private': 'Privado', 'state': 'Publico'})
df_cuisine['cuisine'] = df_cuisine['cuisine'].map({"chinese": "Chino", "cuban": "Cubano", "italian": "Italiano", "japanese": "Japonés", "mexican": "Mexicano", "others": "Otros"})
df_level['level'] = df_level['level'].map({'economic':'Económico','medium': 'Promedio','high': 'Alto','luxurious': 'Lujoso'})

df_est_type = df_est_type.sort_values('rating')
df_bus_type = df_bus_type.sort_values('rating')
df_cuisine = df_cuisine.sort_values('rating')
df_level = df_level.sort_values('rating')

#print(type(df_est_type))
#print(df_est_type['rating'])

fig_est_type = px.bar(
    df_est_type,
    x='est_type',
    y='rating',
    hover_data=['cantity'],
    labels={
        **dict_data_labels,
        "rating": "Puntuacion promedio",
        "cantity": "Cantidad de tipos de establecimientos"
    },
    title='Puntuacion promedio por tipo de establecimiento:',
    range_y=[min(df_est_type['rating']) -0.1, max(df_est_type['rating']) + 0.05],
    color='est_type',
    width=0, height=350
)

fig_bus_type = px.bar(
    df_bus_type,
    x='bus_type',
    y='rating',
    hover_data=['cantity'],
    labels={
        **dict_data_labels,
        "rating": "Puntuacion promedio",
        "cantity": "Cantidad de tipos de negocios"
    },
    title='Puntuacion promedio por tipo de negocio:',
    range_y=[ df_bus_type['rating'] -0.2, max(df_bus_type['rating']) + 0.1],
    color='bus_type',
    width=0, height=350
)
fig_cuisine = px.bar(
    df_cuisine,
    x='cuisine',
    y='rating',
    hover_data=['reviews'],
    labels={
        "cuisine": "Tematica del local",
        "rating": "Puntuacion promedio",
        "reviews": "Numero de reseñas"
    },
    title='Puntuacion promedio por tematica de los locales:',
    range_y=[min(df_cuisine['rating']) -0.1, max(df_cuisine['rating']) + 0.1],
    color='cuisine',
    width=0, height=350
)

fig_level = px.bar(
    df_level,
    x='level',
    y='rating',
    hover_data=['cantity'],
    labels={
        "level": "Nivel de accesibilidad económica",
        "rating": "Puntuacion promedio",
        "cantity": "Cantidad de locales con este nivel"
    },
    title='Puntuacion promedio por nivel de accesibilidad económica:',
    range_y=[min(df_level['rating']) -0.1, max(df_level['rating']) + 0.1],
    color='level',
    width=0, height=350
)

fig_est_type.show()
fig_bus_type.show()
fig_cuisine.show()
fig_level.show()

Observemos que los bares tienden a tener una **puntuación** más alta que los ***restaurantes***. Además, los locales ***privados*** superan significativamente a los ***públicos*** en términos de **puntuación**.

En cuanto a la ***temática culinaria***, la comida ***cubana*** lidera con la mejor recepción, encabezando el TOP.

Respecto a la ***accesibilidad económica***, los locales ***económicos*** tienden a recibir puntuaciones más bajas en comparación con otras categorías, lo curioso sería que el nivel promedio compita en ***puntuacion*** con el nivel ***alto*** y el considerado ***lujoso***.

---

---

Ahora miremos si puede existir una relacion de existencia de redes sociales respecto a los precios de los locales y ver si influye o no en una mejor o peor puntuacion.
tambien podremos observar la distrubución de cantidad de reseñas por quienes tienen cuentas en un servicio y quienes no:

In [8]:
df['clasif_fb'] = df['fb'].apply(lambda x: 'Con Facebook' if pd.notna(x) and x != '' else 'Sin Facebook')
df['clasif_ig'] = df['ig'].apply(lambda x: 'Con Instagram' if pd.notna(x) and x != '' else 'Sin Instagram')
df['clasif_tw'] = df['tw'].apply(lambda x: 'Con Twitter' if pd.notna(x) and x != '' else 'Sin Twitter')


dict_clasif_social_red = {
    'Facebook': 'fb',
    'Instagram': 'ig',
    'Twitter(X)': 'tw'
}

dict_clasif_types = {
    'Puntuación': 'rating',
    'Cant. Reseñas': 'reviews'
}

dropdown_clasif_social_red = wgt.Dropdown(
    options=list(dict_clasif_social_red.keys())
)

dropdown_clasif_type = wgt.Dropdown(
    options=list(dict_clasif_types)
)
hbox_calsif_dropdown_container = wgt.HBox([dropdown_clasif_social_red,dropdown_clasif_type])
vbox_clasif = wgt.VBox([hbox_calsif_dropdown_container])

def on_change_clasif(option):
    if option['type'] != 'change' or option['name'] != 'value':
        return
    
    value_red = dict_clasif_social_red[dropdown_clasif_social_red.value]
    value_type = dict_clasif_types[dropdown_clasif_type.value]
    fig = px.box(
        df,
        x='clasif_' + value_red,
        y=value_type,
        title=f'Distribución de la {dropdown_clasif_type.value} por quienes tienen {dropdown_clasif_social_red.value} y quienes no:',
        labels={'clasif_' + value_red: 'Clasificación', value_type: dropdown_clasif_type.value},
        color='clasif_' + value_red
    )

    fig = go.FigureWidget(fig)

    vbox_clasif.children = (hbox_calsif_dropdown_container, fig)

dropdown_clasif_social_red.observe(on_change_clasif)
dropdown_clasif_type.observe(on_change_clasif)

display(vbox_clasif)

on_change_clasif({'type': 'change', 'name': 'value', 'new': 'Facebook'})

VBox(children=(HBox(children=(Dropdown(options=('Facebook', 'Instagram', 'Twitter(X)'), value='Facebook'), Dro…

Ahora vemos que no parece haber una diferencia clara, temo que pueda ser falta de informacion consistente de la **cantidad de reseñas**, generalmente extraida de paginas webs o sus propias redes, evaluación no concluyente.

Observando los datos podemos concluir que no parece haber relacion alguna respecto a tener o no redes sociales del lugar.
Ademas sorpresivamente ningún local parece tener x(Twitter)

---

---

Ahora observemos que ocurre con los ***tipos de reservas*** que se pueden hacer, cabe señalar que la opción de ***reserva en persona*** no la incluiremos ya que todos los locales admiten reserva local por obvias razones.

Nuevamente ajustamos el zoom de los datos para hacer las graficas mas representativas, revisar la tasa de valores reales antes de tomar cualquier desicion.

In [9]:
df_reservation_online = df[df['reservation_online'] == True]
df_reservation_no_online = df[df['reservation_online'] == False]
df_reservation_phone = df[df['reservation_phone'] == True]
df_reservation_no_phone = df[df['reservation_phone'] == False]
df_reservation_others = df[df['reservation_others'] == True]
df_reservation = pd.DataFrame(
    {
        'method': ['Online', 'No Online', 'Telefonico', 'No Telefonico', 'Otros'],
        'rating': [
            df_reservation_online['rating'].mean(),
            df_reservation_no_online['rating'].mean(),
            df_reservation_phone['rating'].mean(),
            df_reservation_no_phone['rating'].mean(),
            df_reservation_others['rating'].mean()
        ],
        'count': [
            df_reservation_online['reservation_online'].count(),
            df_reservation_no_online['reservation_online'].count(),
            df_reservation_phone['reservation_phone'].count(),
            df_reservation_no_phone['reservation_phone'].count(),
            df_reservation_others['reservation_others'].count()
        ]
    }
)

labels = {
    'method': 'Método de Reserva',
    'rating': 'Media de Puntuacion',
    'count': 'Cantidad de locales',
}

fig_rating = px.bar(
    df_reservation,
    x='method',
    y='rating',
    title='Media de puntuacion por Método de Reservacion',
    hover_data=['count'],
    labels=labels,
    color='method',
    range_y=[min(df_reservation['rating']) - 0.05, max(df_reservation['rating']) + 0.01],
    height=350
)

fig_count = px.bar(
    df_reservation,
    x='method',
    y='count',
    title='Cantidad de locales usando cada Método de Reservacion',
    hover_data=['rating'],
    labels=labels,
    color='method',
    range_y=[0, max(df_reservation['count']) + 10],
    height=350
)

# Mostrar los gráficos
fig_rating.show()
fig_count.show()

### Conclusiones sobre Métodos de Reserva

Podemos concluir que los *locales* que implementan las ***reservas online*** o ***reservas por teléfono*** tienden a tener una mejor ***puntuación*** en comparación con otras alternativas. Este efecto es especialmente notable frente a la ausencia de tales métodos de reserva. Además, la segunda gráfica muestra la cantidad de locales que utilizan estos métodos frente a los que no.

Para un local, incluir alternativas de ***reserva online*** y/o ***telefónica*** es una estrategia beneficiosa. No solo aumenta la *satisfacción* del cliente, sino que también incrementa la ***puntuación***. Además, los datos indican que hay relativamente pocos **locales** que usan estos métodos, mientras que la demanda puede ser considerablemente alta, lo que sugiere que implementar estos métodos de **reservación** podría ser una excelente __inversión__.

---

---

Ahora observemos elementos de ***comodidad*** en este ambito, observemos si existe alguna relacion entre diferentes tipos de ***comodidad*** con la **puntuacion** para asi saber que mas afecta a los *locales* tanto *positiva* como *negativamente*:

In [10]:
df_amenities_wifi = df[df['amenities_wifi'] == True]
df_amenities_no_wifi = df[df['amenities_wifi'] == False]
df_amenities_live_music = df[df['amenities_live_music'] == True]
df_amenities_no_live_music = df[df['amenities_live_music'] == False]
df_amenities_outdoor = df[df['amenities_outdoor'] == True]
df_amenities_no_outdoor = df[df['amenities_outdoor'] == False]
df_amenities_pet_friendly = df[df['amenities_pet_friendly'] == True]
df_amenities_no_pet_friendly = df[df['amenities_pet_friendly'] == False]

df_amenities = pd.DataFrame(
    {
        'amenities': ["WiFi","Sin WiFi", "Musica en vivo", "Sin Musica en vivo", "En exteriores", "Solo Interiores", "Admite mascotas", "No Admite mascotas"],
        'rating': [
            df_amenities_wifi['rating'].mean(),
            df_amenities_no_wifi['rating'].mean(),
            df_amenities_live_music['rating'].mean(),
            df_amenities_no_live_music['rating'].mean(),
            df_amenities_outdoor['rating'].mean(),
            df_amenities_no_outdoor['rating'].mean(),
            df_amenities_pet_friendly['rating'].mean(),
            df_amenities_no_pet_friendly['rating'].mean()
        ],
        'counts': [
            df_amenities_wifi['amenities_wifi'].count(),
            df_amenities_no_wifi['amenities_wifi'].count(),
            df_amenities_live_music['amenities_live_music'].count(),
            df_amenities_no_live_music['amenities_live_music'].count(),
            df_amenities_outdoor['amenities_outdoor'].count(),
            df_amenities_no_outdoor['amenities_outdoor'].count(),
            df_amenities_pet_friendly['amenities_pet_friendly'].count(),
            df_amenities_no_pet_friendly['amenities_pet_friendly'].count()
        ]
    }
)

labels = {
    "amenities": "Amenidades",
    "counts": "Cantidad de amenidades",
    "rating": "Puntuacion promedio"
}

fig_amenities_rewiews = px.bar(
    df_amenities,
    x='amenities',
    y='rating',
    title='Media de puntuacion por amenidades',
    hover_data=['counts'],
    labels=labels,
    color='amenities',
    range_y=[min(df_amenities['rating']) - 0.1, max(df_amenities['rating']) + 0.1],
    height=400
)

fig_amenities_rating = px.bar(
    df_amenities,
    x='amenities',
    y='counts',
    title='Cantidad de locales con cada tipo de amenidad',
    hover_data=['rating'],
    labels=labels,
    color='amenities',
    height=400
)

fig_amenities_rating.update_layout(
    yaxis_type="log",
)

fig_amenities_rewiews.show()
fig_amenities_rating.show()

Entonces podemos concluir al analizar ambos graficos que los *locales* con acceso ***wifi*** tienden a obtener mejor **puntuacion** y por ende sera visto con una mejor *calidad de servicio*, también vale la pena mencionar que los que se encuentran ***en exteriores*** también tienden a conseguir una mejor puntuacion, no tan pronunciada pero vale la pena mencionarlo.

Tambien vale la pena mencionar que según nuestros *datos* recopilados los *locales* que ***no admiten mascotas*** por alguna razon no gustan tanto siendo que *locales* que tienen este *comoditie* bajan su puntuacion de un poco mas que quienes no lo admiten, parece ser que la mayoria prefiere no tener animales cerca cuando comen, es entendible.

---

In [11]:
df_level_mapped = df.copy()
df_level_mapped['level'] = df_level_mapped['level'].map({'economic':'Económico','medium': 'Promedio','high': 'Alto','luxurious': 'Lujoso'})

def mode(series):
    mode_vals = series.mode()
    if len(mode_vals) > 0:
        freq = series.value_counts()
        return list(zip(mode_vals, freq))
    else:
        return []

level_mean = df_level_mapped.groupby(['level'], observed=False)['menu_mean'].mean().reset_index()
level_min = df_level_mapped.groupby(['level'], observed=False)['menu_min'].min().reset_index()
level_max = df_level_mapped.groupby(['level'], observed=False)['menu_max'].max().reset_index()
level_median = df_level_mapped.groupby(['level'], observed=False)['menu_median'].median().reset_index()
level_sum = df_level_mapped.groupby(['level'], observed=False)['menu_sum'].sum().reset_index()
level_mode = df_level_mapped.groupby(['level'], observed=False)['menu_mode'].apply(mode).reset_index()

level_mode_expanded = level_mode.explode('menu_mode')

level_mode_expanded[['menu_mode', 'frequency']] = pd.DataFrame(level_mode_expanded['menu_mode'].tolist(), index=level_mode_expanded.index)

fig_mean = px.bar(
    level_mean, 
    x='level', 
    y='menu_mean', 
    color='level', 
    title='Precio promedio por nivel de accesibilidad economica', 
    labels={
        'level': 'Nivel de accesibilidad economica',
        'menu_mean': 'Precio promedio'
    },
    height= 300
)
fig_min = px.bar(
    level_min,
    x='level', 
    y='menu_min', 
    color='level',
    title='Precio minimo por nivel de accesibilidad economica', 
    labels={
        'level': 'Nivel de accesibilidad economica',
        'menu_min': 'Precio minimo'
    },
    height= 300
)
fig_max = px.bar(
    level_max, 
    x='level', 
    y='menu_max', 
    color='level',
    title='Precio máximo por nivel de accesibilidad economica', 
    labels={
        'level': 'Nivel de accesibilidad economica',
        'menu_max': 'Precio máximo'
    },
    height= 300
)
fig_median = px.bar(
    level_median, 
    x='level', 
    y='menu_median', 
    color='level',
    title='Precio medio por nivel de accesibilidad economica', 
    labels={
        'level': 'Nivel de accesibilidad economica',
        'menu_median': 'Precio medio'
    },
    height= 300
)
fig_sum = px.bar(
    level_sum, 
    x='level', 
    y='menu_sum', 
    color='level',
    title='Suma de precios por nivel de accesibilidad economica(No importante)', 
    labels={
        'level': 'Nivel de accesibilidad economica',
        'menu_sum': 'Precio sumado'
    },
    height= 300
)
fig_mode = px.bar(
    level_mode_expanded,
    x='level', 
    y='menu_mode', 
    color=[str(val) for val in level_mode_expanded['menu_mode']],
    barmode='group',
    title='La moda del precio de productos por nivel de accesibilidad economica', 
    hover_data=['frequency'],
    labels={
        'level': 'Nivel de accesibilidad economica',
        'menu_mode': 'Moda del precio',
        'frequency': 'Frecuencia'
    },
    text='frequency',
    height= 300
)

fig_mode.update_traces(texttemplate='%{text}')

fig_mean.show()
fig_min.show()
fig_max.show()
fig_median.show()
fig_sum.show()
fig_mode.show()

In [14]:
df_menu_type_explode = df_level_mapped.explode('menu_types')

df_menu_type_explode['menu_types'] = df_menu_type_explode['menu_types'].map(dict_menu_types)

df_menu_type_explode = df_menu_type_explode.sort_values(by='level', ascending= True)

count = df_menu_type_explode.groupby(['level', 'menu_types'],observed='False').size().reset_index(name='counts')

count = count.sort_values('menu_types')

widget_level = wgt.Dropdown(
    options = ['Todos', 'Económico', 'Promedio', 'Alto', 'Lujoso'],
    description='Selecciona el nivel de acc. economica a mostrar: ',
    layout=wgt.Layout(width='400px')
)

widget_level.style.description_width = 'initial'

vbox_level = wgt.VBox([widget_level])

def change_on_menus(option):
    if option['type'] != 'change' or option['name'] != 'value':
        return
    value = widget_level.value
    if value == 'Todos':
        fig = px.bar(
            count,
            x='menu_types',
            y='counts',
            color='level',
            color_discrete_map=dict_color_levels,
            barmode='group',
            title='Cantidad de platos de cada tipo de menú:',
            labels={**dict_data_labels, 'level': 'Niv acc. Economica'}
        )
    else:
        count2 = count.loc[count['level'] == value]

        fig = px.bar(
            count2,
            x='menu_types',
            y='counts',
            color= 'level',
            color_discrete_map=dict_color_levels,
            title=f'Cantidad de platos de cada tipo de menú en el nivel de acc. {value}:',
            labels=dict_data_labels
        )
        fig.update_layout(showlegend=False)
    
    fig = go.FigureWidget(fig)
    vbox_level.children = (widget_level, fig)


widget_level.observe(change_on_menus)
display(vbox_level)
change_on_menus({'type': 'change', 'name': 'value'})

VBox(children=(Dropdown(description='Selecciona el nivel de acc. economica a mostrar: ', layout=Layout(width='…

In [22]:
selector_type = wgt.Dropdown(
    options=list(dict_menu_data.keys()),
    description='Selecciona el tipo de menú que deseas observar: ',
    layout=wgt.Layout(width='500px')
)
selector_arg = wgt.Dropdown(
    options=list(dict_args.keys()),
)


selector_type.style.description_width = 'initial'
selector_arg.style.description_width = 'initial'

hbox_dropdown = wgt.HBox([selector_type, selector_arg])
vbox_container = wgt.VBox([hbox_dropdown])

def select(change):
    if not change['type'] == 'change' or not change['name'] == 'value':
        return
    
    arg = dict_args[selector_arg.value]
    value = dict_menu_data[selector_type.value] + '_' + arg

    df_grouped = df_level_mapped.groupby(['level', 'loc_municipe'], observed=False)[value].agg([arg, 'count']).reset_index()
    df_grouped.columns = ['level', 'loc_municipe', value, 'count']

    fig = px.bar(
        df_grouped, 
        x='loc_municipe', 
        y=value,
        color='level', 
        barmode='group', 
        title=f'({selector_arg.value}) Gráfico de barras del tipo {selector_type.value}, por municipios y agrupadas por nivel economico:',
        hover_data=['count'],
        labels={
            'loc_municipe': f'Municipios ({selector_arg.value})', 
            value: selector_type.value, 
            'count': 'Cantidad',
            'level': 'Nivel de accesibilidad'
        }
    )

    fig_widget = go.FigureWidget(fig)
    vbox_container.children = (hbox_dropdown, fig_widget)


selector_type.observe(select)
selector_arg.observe(select)
display(vbox_container)
select({'type': 'change', 'name': 'value', 'new': 'Platos principales'})

VBox(children=(HBox(children=(Dropdown(description='Selecciona el tipo de menú que deseas observar: ', layout=…

---
## Conclusiones:
* La ****puntuación*** general* de los *locales* tiende a estar alrededor de *4.5*, lo que sugiere una alta satisfacción general entre los clientes.
* Los bares tienden a tener una ***puntuación*** más alta que los restaurantes, y los locales ***privados*** superan significativamente a los ***públicos(Del estado)*** en términos de ***puntuación***.
* La comida ***cubana*** lidera en términos de ***puntuación promedio***, seguida por otras temáticas culinarias.
* Los locales ***económicos*** tienden a recibir **puntuaciones** más bajas en comparación con otras categorías de **accesibilidad económica**.
* No parece haber una relación significativa entre la presencia de redes sociales (***Facebook***, ***Instagram***, ***Twitter***) y la **puntuación** de los locales.
* La cantidad de **reseñas** no muestra una diferencia clara entre *locales* con o sin presencia en *redes sociales*.
* Los locales que implementan ***reservas online*** o ***telefónicas*** tienden a tener una mejor puntuación en comparación con aquellos que no ofrecen estas opciones.
* Los locales con acceso a ***WiF***i tienden a obtener mejor ***puntuación***, lo que sugiere que esta **amenidad** es valorada por los *clientes*.
* Los locales que ofrecen ***música en vivo*** tienden a tener una ***puntuación*** más *baja*, lo que podría indicar que este servicio no es del agrado de la mayoría de los *clientes*, o al menos no lo ofrecen como deberían.
* La ***admisión de mascotas*** también parece tener un impacto **negativo** en la ***puntuación***, aunque no tan *pronunciado* como la ***música en vivo***.