# *¡Antes de que gastes! Project :*
##### La capital cubana goza de una de las tradiciones gastronómicas más grandes de todo el Caribe, no solo por su comida autóctona, sino también por la mezcla resultante de toda la inmigración que ha recibido de todas partes del mundo; sin contar, obviamente, que la propia comida criolla es fruto de la relación entre las influencias aborígenes, españolas y africanas, las primeras huellas culturales que forjaron la esencia del cubano. Ya sea de Europa, Medio Oriente, Asia y la propia América, Cuba se ha retroalimentado de todo el potencial culinario que generación tras generación se ha inculcado en su tierra y añadiendo con el pasar del tiempo nuevas cocinas, platos y estilos que la enriquecen cada vez más, esto ha creado una de las ciudades con más variedad en cuanto a restaurantes y bares se trata.
### *INTRO*
##### Aquí empieza la idea sobre un guión para un hipotético vídeo-reseña en donde se hablará acerca de este pequeño proyecto de análisis de datos y como se busca comprender cómo se trabaja con todos los datos recopilados sobre estos locales, cosa que obviamente a mano sería tonto. Para eso mismo, alguien anteriormente se le ocurrió la brillante idea de crear la solución para manejar y representar de manera más visual y sencilla cualquier tipo de datos de cualquier tema de la vida, y eso es: la programación... o mejor dicho las bibliotecas para programar con datos como estos. En este caso, bibliotecas que podemos usar en nuestro querido Python, el cual es extremadamente útil para estos tipos de trabajos, y porque es el único que medianamente (si es que puedo decir eso) sé usar. Sin más, estas serían las bibliotecas principales que he usado:

In [None]:
import glob
# El salvador en cuanto a la automatización en estos trabajos se refiere. 
# Se utiliza para encontrar todos los nombres de archivos que coincidan con un patrón específico. Es útil para trabajar con múltiples archivos en un directorio.
import json as jn
# Que otra biblioteca mejor para trabajar con datos de este tipo que no sea json.
import pandas as pd
# Es una biblioteca muy poderosa para la manipulación y análisis de datos.
# Proporciona estructuras de datos como DataFrames.
import csv
# Esta biblioteca se utiliza para leer y escribir archivos CSV.
import matplotlib.pyplot as plt
# Es una biblioteca para crear visualizaciones estáticas, animadas e interactivas en Python.
import plotly.express as px
# Es una biblioteca para crear visualizaciones interactivas de manera sencilla.
import numpy as np
# Es una biblioteca para la computación numérica en Python.
from collections import Counter
# Es útil para contar la frecuencia de elementos en una lista.
import warnings
warnings.filterwarnings("ignore")
# Esta biblioteca se utiliza para manejar advertencias en Python. 
# En este caso, se ignora todas las advertencias.

from Herramientas.Biblioteca import*

df = crear_data_frame() 
# Para importar los dataframes necesarios para que funcionen los codigos.

##### Pues estas serán nuestras principales herramientas a la hora de desenvolvernos en este estresante pero hermoso mundo de datos y datos y datos y datos y datos y dat... cof, cof... bueno, ya. Pero también nos va a servir para adquirir conocimientos esenciales para saber cómo se mueve el mundo, ya que sin los datos, la tecnología, la medicina, las ciencias, el ocio, en fin, TODO no sería lo que es actualmente y en especial este proyecto que nos permite explorar la gastronomía habanera; por lo cual aquí les traigo lo básico, lo bueno y lo malo de este submundo, y para que sepáis de entre todas estas opciones de locales que existen, cuáles de los más de 200 que se han investigado serían los más rentables, buenos y acogedores, o los más horribles, desbalanceados y caros. Esto es:

## ¡Antes de que gastes!...
### "Restaurantes y Bares de La Habana".

# *Lo Básico*
##### Comenzando por lo básico, creo que sería un paso importante ver, en principio, a qué nos enfrentamos: los diferentes tipos de locales que hay, afortunadamente categorizados de dos maneras: restaurantes y bares. Si me preguntan por qué no usar también la definición que tienen muchos establecimientos como "bar-restaurante", "restaurante-bar", "bar-cafetería", etc., la principal razón es: que al cubano le da igual. Analizando, antes de hacer este proyecto, la diferencia más remarcada entre un restaurante y bar como tales es cómo se distribuye el establecimiento para aprovechar de manera correcta sus servicios. En un bar no vas a ver la misma distribución de mesas que en un restaurante, y eso solo por poner un ejemplo sencillo, pero no estamos aquí para hablar sobre arquitectura ni interiorismo, sino sobre la oferta gastronómica de estos. En primer lugar, ¿qué cantidad de establecimientos de cada tipo hay?:

In [None]:
tipo_establecimientos = df['type_of_establishment'].value_counts().reset_index()
tipo_establecimientos.columns = ['Tipo de Establecimiento', 'Cantidad']

fig = px.pie(tipo_establecimientos, 
            values='Cantidad', 
            names='Tipo de Establecimiento', 
            title='Porcentaje de tipos de establecimientos en La Habana',
            hole=0.1,
            color_discrete_sequence=px.colors.sequential.Turbo)
fig.show()

##### Al final, viendo los resultados, remarco lo dicho sobre la etimología de llamar "bar-restaurante" o viceversa, porque no hay una necesidad vital de usar estos términos, ya que en esencia los locales denominados así son iguales al resto de restaurantes, los cuales vemos que son la mayoría, y si es verdad que son mayores en número que los bares "originales", al fin y al cabo son solo etiquetas legales para aumentar la oferta en sus recintos.

##### Otro aspecto que destaca en estos locales es que a diferencia de otros países, donde hay grandes cadenas de restaurantes como *KFC*, *McDonalds* o *Burger King*, aqui tenemos los llamados locales estatales y particulares, ahora cual es la diferencia entre estos además de la conclución lógica a la que podemos llegar por sus nombres, pues en general no hay demasiada, la única cosa que se podría remarcar con claridad sería la calidad de los locales, los estatales son en su gran mayoría mucho peores en cuanto a valoración en comparación a los particulares. Por ahora vamos a hacer una comparativa en la cantidad que existen de ambos tipos:

In [None]:
property_type_counts = df['property_type'].value_counts().reset_index()
property_type_counts.columns = ['property_type', 'count']

fig = px.bar(property_type_counts, 
             x='property_type', 
             y='count', 
             title='Distribución de Tipos de Propiedad en Establecimientos',
             labels={'property_type': 'Tipo de Propiedad', 'count': 'Cantidad'},
             color='property_type',
             text='count')

fig.update_traces(textposition='outside')
fig.update_layout(xaxis_title='Tipo de Propiedad', 
                  yaxis_title='Cantidad de Establecimientos',
                  showlegend=False)

fig.show()

##### Como se puede apreciar, hay una masiva diferencia en cuanto a la cantidad de locales particulares y estatales, algo que no es de mucha sorpresa teniendo en cuenta cómo se comportan ciertos ámbitos en cuanto a la economía y políticas de Cuba. Los negocios privados han prosperado gracias al esfuerzo y la competencia sana que representa crear y hacer crecer tu negocio en un mercado saturado de este tipo de servicio, cosa que han dejado atrás los locales del gobierno, por lo cual la balanza de la calidad termina cayendo del lado del sector particular, pero sobre esto se abordará más adelante.

##### asdasd

In [None]:
import pandas as pd
import plotly.express as px
from datetime import datetime

# Crear el DataFrame
df = crear_data_frame()

# Función para convertir la hora en minutos desde la medianoche
def hora_a_minutos(hora):
    if hora == "24:00":
        return 1440  # 24:00 es equivalente a 1440 minutos
    return int(hora.split(":")[0]) * 60 + int(hora.split(":")[1])

# Lista de días de la semana
dias_semana = ["monday", "tuesday", "wednesday", "thursday", "friday", "saturday", "sunday"]

# Crear listas para almacenar los promedios de apertura y cierre
aperturas_promedio = []
cierres_promedio = []

for dia in dias_semana:
    # Extraer horas de apertura y cierre para el día actual
    aperturas = df['schedules'].apply(lambda x: x[dia]['open'] if dia in x else None).dropna()
    cierres = df['schedules'].apply(lambda x: x[dia]['closed'] if dia in x else None).dropna()
    
    # Convertir horas a minutos
    aperturas_minutos = aperturas.apply(hora_a_minutos)
    cierres_minutos = cierres.apply(hora_a_minutos)
    
    # Calcular promedios
    apertura_promedio = aperturas_minutos.mean()
    cierre_promedio = cierres_minutos.mean()
    
    # Guardar resultados
    aperturas_promedio.append(apertura_promedio)
    cierres_promedio.append(cierre_promedio)

# Convertir promedios a formato HH:MM
def minutos_a_hora(minutos):
    return f"{int(minutos // 60):02d}:{int(minutos % 60):02d}"

aperturas_promedio_hora = [minutos_a_hora(minutos) for minutos in aperturas_promedio]
cierres_promedio_hora = [minutos_a_hora(minutos) for minutos in cierres_promedio]

# Crear un DataFrame con los resultados
horarios_promedio_df = pd.DataFrame({
    'dia': [dia.capitalize() for dia in dias_semana],
    'apertura_promedio': aperturas_promedio_hora,
    'cierre_promedio': cierres_promedio_hora
})

# Mostrar resultados
print(horarios_promedio_df)

# Contar cuántos establecimientos tienen cada tipo de horario promedio
# Agrupar los horarios en categorías
def categorizar_horario(hora):
    if hora < 360:  # Antes de las 6:00 AM
        return "Muy temprano (antes de 6:00 AM)"
    elif 360 <= hora < 720:  # Entre 6:00 AM y 12:00 PM
        return "Mañana (6:00 AM - 12:00 PM)"
    elif 720 <= hora < 1080:  # Entre 12:00 PM y 6:00 PM
        return "Tarde (12:00 PM - 6:00 PM)"
    else:  # Después de las 6:00 PM
        return "Noche (después de 6:00 PM)"


# Aplicar la categorización a los horarios de apertura y cierre
aperturas_categorizadas = [categorizar_horario(minutos) for minutos in aperturas_promedio]
cierres_categorizadas = [categorizar_horario(minutos) for minutos in cierres_promedio]

# Contar la frecuencia de cada categoría
aperturas_count = pd.Series(aperturas_categorizadas).value_counts().reset_index()
aperturas_count.columns = ['categoria', 'count']

cierres_count = pd.Series(cierres_categorizadas).value_counts().reset_index()
cierres_count.columns = ['categoria', 'count']

# Crear gráficos de funnel para apertura y cierre
fig_apertura = px.funnel(aperturas_count, 
                         x='count', 
                         y='categoria', 
                         title='Distribución de Horarios Promedio de Apertura',
                         labels={'count': 'Cantidad de Establecimientos', 'categoria': 'Categoría de Horario'})

fig_cierre = px.funnel(cierres_count, 
                       x='count', 
                       y='categoria', 
                       title='Distribución de Horarios Promedio de Cierre',
                       labels={'count': 'Cantidad de Establecimientos', 'categoria': 'Categoría de Horario'})

# Mostrar los gráficos
fig_apertura.show()
fig_cierre.show()