# *¡Antes de que gastes! Project :*
##### La capital cubana goza de una de las tradiciones gastronómicas más grandes de todo el Caribe, no solo por su comida autóctona, sino también por la mezcla resultante de toda la inmigración que ha recibido de todas partes del mundo; sin contar, obviamente, que la propia comida criolla es fruto de la relación entre las influencias aborígenes, españolas y africanas, las primeras huellas culturales que forjaron la esencia del cubano. Ya sea de Europa, Medio Oriente, Asia y la propia América, Cuba se ha retroalimentado de todo el potencial culinario que generación tras generación se ha inculcado en su tierra y añadiendo con el pasar del tiempo nuevas cocinas, platos y estilos que la enriquecen cada vez más, esto ha creado una de las ciudades con más variedad en cuanto a restaurantes y bares se trata.
### *INTRO*
##### Aquí empieza la idea sobre un guión para un hipotético vídeo-reseña en donde se hablará acerca de este pequeño proyecto de análisis de datos y como se busca comprender cómo se trabaja con todos los datos recopilados sobre estos locales, cosa que obviamente a mano sería tonto. Para eso mismo, alguien anteriormente se le ocurrió la brillante idea de crear la solución para manejar y representar de manera más visual y sencilla cualquier tipo de datos de cualquier tema de la vida, y eso es: la programación... o mejor dicho las bibliotecas para programar con datos como estos. En este caso, bibliotecas que podemos usar en nuestro querido Python, el cual es extremadamente útil para estos tipos de trabajos, y porque es el único que medianamente (si es que puedo decir eso) sé usar. Sin más, estas serían las bibliotecas principales que he usado:

In [1]:
import glob
# El salvador en cuanto a la automatización en estos trabajos se refiere. 
# Se utiliza para encontrar todos los nombres de archivos que coincidan con un patrón específico. Es útil para trabajar con múltiples archivos en un directorio.
import json as jn
# Que otra biblioteca mejor para trabajar con datos de este tipo que no sea json.
import pandas as pd
# Es una biblioteca muy poderosa para la manipulación y análisis de datos.
# Proporciona estructuras de datos como DataFrames.
import csv
# Esta biblioteca se utiliza para leer y escribir archivos CSV.
import matplotlib.pyplot as plt
# Es una biblioteca para crear visualizaciones estáticas, animadas e interactivas en Python.
import plotly.express as px
# Es una biblioteca para crear visualizaciones interactivas de manera sencilla.
import numpy as np
# Es una biblioteca para la computación numérica en Python.
from collections import Counter
# Es útil para contar la frecuencia de elementos en una lista.
import warnings
warnings.filterwarnings("ignore")
# Esta biblioteca se utiliza para manejar advertencias en Python. 
# En este caso, se ignora todas las advertencias.

from Herramientas.Biblioteca import*

df = crear_data_frame() 
# Para importar los dataframes necesarios para que funcionen los codigos.

##### Pues estas serán nuestras principales herramientas a la hora de desenvolvernos en este estresante pero hermoso mundo de datos y datos y datos y datos y datos y dat... cof, cof... bueno, ya. Pero también nos va a servir para adquirir conocimientos esenciales para saber cómo se mueve el mundo, ya que sin los datos, la tecnología, la medicina, las ciencias, el ocio, en fin, TODO no sería lo que es actualmente y en especial este proyecto que nos permite explorar la gastronomía habanera; por lo cual aquí les traigo lo básico, lo bueno y lo malo de este submundo, y para que sepáis de entre todas estas opciones de locales que existen, cuáles de los más de 200 que se han investigado serían los más rentables, buenos y acogedores, o los más horribles, desbalanceados y caros. Esto es:

## ¡Antes de que gastes!...
### "Restaurantes y Bares de La Habana".

# *Lo Básico*
##### Comenzando por lo básico, creo que sería un paso importante ver, en principio, a qué nos enfrentamos: los diferentes tipos de locales que hay, afortunadamente categorizados de dos maneras: restaurantes y bares. Si me preguntan por qué no usar también la definición que tienen muchos establecimientos como "bar-restaurante", "restaurante-bar", "bar-cafetería", etc., la principal razón es: que al cubano le da igual. Analizando, antes de hacer este proyecto, la diferencia más remarcada entre un restaurante y bar como tales es cómo se distribuye el establecimiento para aprovechar de manera correcta sus servicios. En un bar no vas a ver la misma distribución de mesas que en un restaurante, y eso solo por poner un ejemplo sencillo, pero no estamos aquí para hablar sobre arquitectura ni interiorismo, sino sobre la oferta gastronómica de estos. En primer lugar, ¿qué cantidad de establecimientos de cada tipo hay?:

In [2]:
tipo_establecimientos = df['type_of_establishment'].value_counts().reset_index()
tipo_establecimientos.columns = ['Tipo de Establecimiento', 'Cantidad']

fig = px.pie(tipo_establecimientos, 
            values='Cantidad', 
            names='Tipo de Establecimiento', 
            title='Porcentaje de tipos de establecimientos en La Habana',
            hole=0.1,
            color_discrete_sequence=px.colors.sequential.Turbo)
fig.show()

##### Al final, viendo los resultados, remarco lo dicho sobre la etimología de llamar "bar-restaurante" o viceversa, porque no hay una necesidad vital de usar estos términos, ya que en esencia los locales denominados así son iguales al resto de restaurantes, los cuales vemos que son la mayoría, y si es verdad que son mayores en número que los bares "originales", al fin y al cabo son solo etiquetas legales para aumentar la oferta en sus recintos.

##### Otro aspecto que destaca en estos locales es que a diferencia de otros países, donde hay grandes cadenas de restaurantes como *KFC*, *McDonalds* o *Burger King*, aqui tenemos los llamados locales estatales y particulares, ahora cual es la diferencia entre estos además de la conclución lógica a la que podemos llegar por sus nombres, pues en general no hay demasiada, la única cosa que se podría remarcar con claridad sería la calidad de los locales, los estatales son en su gran mayoría mucho peores en cuanto a valoración en comparación a los particulares. Por ahora vamos a hacer una comparativa en la cantidad que existen de ambos tipos:

In [3]:
property_type_counts = df['property_type'].value_counts().reset_index()
property_type_counts.columns = ['property_type', 'count']

fig = px.bar(property_type_counts, 
             x='property_type', 
             y='count', 
             title='Distribución de Tipos de Propiedad en Establecimientos',
             labels={'property_type': 'Tipo de Propiedad', 'count': 'Cantidad'},
             color='property_type',
             text='count')

fig.update_traces(textposition='outside')
fig.update_layout(xaxis_title='Tipo de Propiedad', 
                  yaxis_title='Cantidad de Establecimientos',
                  showlegend=False)

fig.show()

##### Como se puede apreciar, hay una masiva diferencia en cuanto a la cantidad de locales particulares y estatales, algo que no es de mucha sorpresa teniendo en cuenta cómo se comportan ciertos ámbitos en cuanto a la economía y políticas de Cuba. Los negocios privados han prosperado gracias al esfuerzo y la competencia sana que representa crear y hacer crecer tu negocio en un mercado saturado de este tipo de servicio, cosa que han dejado atrás los locales del gobierno, por lo cual la balanza de la calidad termina cayendo del lado del sector particular, pero sobre esto se abordará más adelante.

##### El tamaño de los locales es una cuestión a tener en cuenta siempre antes de hacer una salida, puede que el local sea el mejor valorado del municipio o el que mejor haga cierto plato, pero si tiene una capacidad reducida no merecería la pena estar esperando 2 horas para poder entrar en el, vamos a ver entonces como se distribuye la capacidad de estos locales:

In [4]:
import pandas as pd
import plotly.express as px

# Llamar a la función para obtener el DataFrame
df = crear_data_frame()

# Verificar que la columna 'establishment_capacity' y 'address.district' existan
if 'location_details' in df.columns and 'address' in df.columns:
    # Extraer la capacidad y el municipio de cada local
    df['capacity'] = df['location_details'].apply(lambda x: x.get('establishment_capacity', 'Desconocido'))
    df['municipio'] = df['address'].apply(lambda x: x.get('district', 'Desconocido'))

    # Crear un histograma con plotly.express
    fig = px.histogram(df, 
                       x='municipio', 
                       color='capacity', 
                       title='Distribución de la Capacidad de los Locales por Municipio',
                       labels={'municipio': 'Municipio', 'capacity': 'Capacidad', 'count': 'Cantidad de Locales'},
                       barmode='group')  # Agrupar las barras por capacidad

    # Personalizar el gráfico
    fig.update_layout(xaxis_title='Municipio', 
                      yaxis_title='Cantidad de Locales',
                      legend_title='Capacidad',
                      xaxis={'categoryorder': 'total descending'})  # Ordenar municipios por cantidad total

    # Mostrar el gráfico
    fig.show()
else:
    print("Las columnas 'location_details' o 'address' no existen en el DataFrame.")

##### En cuanto a este tema aquí esta un TOP-5 de los mejores restaurantes en dependencia de su capacidad:

In [None]:
# Crear un gráfico de barras horizontales con matplotlib
plt.figure(figsize=(10, 8))  # Tamaño del gráfico

# Colores para cada capacidad
colores = {"grande": "skyblue", "media": "lightgreen", "chica": "salmon"}

# Iterar sobre cada capacidad y graficar
for i, capacidad in enumerate(["grande", "media", "chica"]):
    df_capacidad = top_5_df[top_5_df["capacidad"] == capacidad]
    plt.barh(df_capacidad["place_name"], df_capacidad["puntuacion_valida"], color=colores[capacidad], label=capacidad)

# Personalizar el gráfico
plt.title("Top-5 Mejores Restaurantes por Capacidad", fontsize=16)
plt.xlabel("Puntuación Valida", fontsize=12)
plt.ylabel("Nombre del Local", fontsize=12)
plt.legend(title="Capacidad", bbox_to_anchor=(1.05, 1), loc="upper left")  # Leyenda fuera del gráfico
plt.grid(axis="x", linestyle="--", alpha=0.7)  # Líneas de cuadrícula en el eje x
plt.tight_layout()  # Ajustar el layout para que no se corten las etiquetas

# Mostrar el gráfico
plt.show()

KeyError: 'puntuacion_ponderada'

<Figure size 1000x800 with 0 Axes>

##### Debido obviamente a la variedad cultural mucho antes mencionada es normal que cada restaurante tenga raíces diferentes y que cada dueño o dueña decida decorar su establecimiento de diversas maneras, en La Habana se suelen encontrar muchos tipo diferentes de decoraciones, vamos a ver a continuación y cuales son los mejores locales con su respectivo estilo:

In [None]:
# Crear un treemap con plotly.express
fig = px.treemap(decoracion_count, 
                 path=['decoracion'],  # Categoría a visualizar
                 values='count',       # Tamaño de cada categoría
                 title='Distribución de Tipos de Decoración en los Locales',
                 color='count',        # Colorear por la cantidad
                 color_continuous_scale='Blues')  # Escala de colores

# Personalizar el gráfico
fig.update_traces(textinfo="label+value",  # Mostrar etiqueta y valor en cada bloque
                  hovertemplate='<b>%{label}</b><br>Cantidad: %{value}')

# Mostrar el gráfico
fig.show()

# *Lo Bueno y Lo Malo*
##### Como todo en la vida todo siempre hay dos caras de la moneda, en anteriores analisis vimos varios de los mejores restaurantes en algunos parametros pero ahora veamos cuales son los peores locales en la capital, midiendo su valoracion y la cantidad de reacciones que tienen:

##### Es normal en la vida 