# Proyecto MIDAS: Innovación en Ciencia de Datos para La Habana

En el núcleo de La Habana, un grupo de científicos de datos comprometidos ha establecido el equipo **MIDAS** (Modelos Inteligentes para el Desarrollo de Análisis Sostenible). Este equipo se ha constituido con el propósito de aplicar técnicas avanzadas de ciencia de datos para enfrentar desafíos locales y optimizar la calidad de vida en la ciudad, con un enfoque particular en el sector gastronómico.

El objetivo principal del proyecto de MIDAS es analizar datos de diversas fuentes para proporcionar insights valiosos a clientes y propietarios de restaurantes.

## Comida Familiar Aseg-"hour"-ada
 En cierta ocasión un cliente llamado Jordan se acercó a nosotros con la inquietud de conocer información sobre los horarios de apertura y cierre de los restaurantes pues necesitaba conocerlas para planificar sus actividades debido a la llegada de familiares del extranjero. Enseguida el equipo comenzó a trabajar y descubrió varios datos interesantes.

 *¿Los restaurantes estarán siempre para nuestro cliente?*

 ![Porcentaje de Apertura y Cierre](pics\PC.png)

 Jordan recibió una grata sorpresa al saber que solo el 8.95 % de los restaurantes analizados no estarían para él. Todavía quedaba disponible el 91.05% de los restaurantes. 

 *¿Con cuál día debería tener más cuidado?*

 ![Cuidado con estos](pics\DC.png)

 Avisamos al cliente de q tuviera cuidado con el día Lunes pues a pesar de que es difícil encontrar alguno cerrado podría tener problemas con su cena familiar.

 *¿A qué hora lo atenderían seguramente?*

 ![HC](pics\HC.png)

 Era muy común entre los restaurantes comenzar su jornada laboral a las 12:00 y terminarla a las 00:00 pero *¿En todos los municipios sería igual?*



Para el Análisis por Municipios decidimos hacer algo diferente , hicimos uso de nuestros conocimientos y le pedimos a Jordan q introdujera el municipio donde estaría y la hora para asistir a la comida.

In [2]:
import json
import folium
import os
from IPython.display import display

def is_open(schedule, hour):
    hour = hour.strip()  
    for day, hours in schedule.items():
        opening = hours.get('opening')
        closing = hours.get('closing')
        
        
        if opening is not None and closing is not None:
            if opening == "00:00" and closing == "00:00":
                return True  
            elif opening == "00:00":
                if hour <= closing:  
                    return True
            elif closing == "00:00":
                if hour >= opening:  
                    return True
            elif opening < closing:  
                if opening <= hour <= closing:
                    return True
            else: 
                if hour >= opening or hour < closing: 
                    return True
    return False

# Ruta 
ruta = 'restaurantes'  

# Inputs
municipio = input("Ingresa el municipio: ")
hora = input("Ingresa la hora (formato HH:MM): ")

mapa = folium.Map(location=[23.07540405820975, -82.35821067834236], zoom_start=12)

for filename in os.listdir(ruta):
    if filename.endswith('.json'):
        file_path = os.path.join(ruta, filename)
        
        with open(file_path, 'r', encoding='utf-8') as file:
            data = json.load(file)

            if data['locality']['mun'].lower() == municipio.lower():
                lat = data['locality']['locator']['map']['lat']
                lng = data['locality']['locator']['map']['lng']
                popup_text = data.get('name', "Nombre no disponible")
                
                # Buscar el número de teléfono
                mobile = data['locality']['locator']['phones'].get('mobile')
                landline = data['locality']['locator']['phones'].get('landline')
                
                #  Número a mostrar
                if mobile:
                    telefono = mobile
                elif landline:
                    telefono = landline
                else:
                    telefono = "No es posible comunicar ahora"

                if is_open(data['schedule'], hora):
                    icon_color = "green"
                    popup_content = f"{popup_text}<br>Teléfono: {telefono}"
                else:
                    icon_color = "red"
                    popup_content = f"{popup_text}<br>Teléfono: {telefono}"

                folium.Marker(
                    location=[lat, lng],
                    popup=popup_content,
                    icon=folium.Icon(color=icon_color, icon='cutlery', prefix='fa'),
                    tooltip=popup_text
                ).add_to(mapa)

display(mapa)

## Ciencias para El Super Restaurante
Pasado un tiempo de la interesante misión con Jordan, recibimos la visita de un empresario conocido como **"El Chef"** , este hombre se acercó a nosotros con una petición, deseaba crear un Super Restaurante. 
Lo primero que deseaba conocer era sobre los sistemas de calificación de los restaurantes pues su restaurante debía tener la mejor, **los chefs son quisquillosos**


 *¿Cuál es la plataforma preferida por los usuarios para realizar sus calificaciones?*
 
 ![CV](pics\CV.png)

 Los clientes tienden a presentar sus calificaciones principalmente a través de Google, en comparación con otras plataformas como Facebook o Tripadvisor.


 *¿Son todas las plataformas de calificación igualmente confiables?*

 ![disp](pics\disp.png)

 Análisis del Gráfico de Caja:

 1. **Calificaciones Promedio**: 
   - Google: Alrededor de 3.5
   - TripAdvisor: Alrededor de 4.5
   - Facebook: Alrededor de 4.0

 2. **Dispersión de Calificaciones**:
   - Google tiene una mayor dispersión, con algunos valores atípicos.
   - TripAdvisor tiene una menor dispersión, con la mayoría de las calificaciones concentradas en torno a la mediana.
   - Facebook tiene una dispersión intermedia, con algunos valores atípicos.

3.  **Comparación entre Webs**:
   - TripAdvisor tiene las calificaciones más altas en general.
   - Facebook tiene calificaciones más altas que Google.
   - Existe una mayor variabilidad en las calificaciones de Google en comparación con las otras dos redes sociales.

Se decidió continuar con el análisis pues no se consideró que la variabilidad sea tan grande y no afectaría en gran medida la investigación.

*¿Cuáles son los tipos de comidas que reciben las mejores calificaciones por parte de los usuarios?*

![food_cualification](pics\ffc.png)

Las comidas exóticas han demostrado obtener mejores resultados en las calificaciones, sugiriendo que este tipo de productos es valorado más positivamente en comparación con la comida nacional, que se sitúa varios puestos por detrás en las evaluaciones.


*¿Tienen las reservas un impacto en la calificación de los restaurantes?*

![23](pics\23.png)

La calificación promedio de los restaurantes que permiten reservas es de 4.30, en comparación con una calificación promedio de 4.19 para aquellos que no ofrecen este servicio. Aunque la calificación es ligeramente más alta en los restaurantes con reservas, este aspecto no parece ser un factor determinante para alcanzar una puntuación elevada.

*¿Cuál es el medio más comúnmente utilizado para comunicar con el restaurante: dispositivos móviles, fijos o ambos?*

![24](pics\24.png)

*¿Cuál es la preferencia de los restaurantes mejor calificados en cuanto a los medios utilizados para recibir llamadas: dispositivos móviles, fijos o ambos?*

![25](pics\25.png)

*¿Qué características definen a los restaurantes más exitosos?*



In [None]:
import os
import json
import pandas as pd
import plotly.express as px


ruta = 'restaurantes'  

service_details = []

for filename in os.listdir(ruta):
    if filename.endswith('.json'):
        file_path = os.path.join(ruta, filename)
        
        with open(file_path, 'r', encoding='utf-8') as file:
            try:
                restaurant = json.load(file)
                
                # Obtiene calificaciones
                qualifications = [
                    restaurant['quality'].get('qualification_google'),
                    restaurant['quality'].get('qualification_tripadvisor'),
                    restaurant['quality'].get('qualification_facebook')
                ]
                
                qualifications = [q for q in qualifications if q is not None]
                
                # Calificación promedio
                if qualifications:
                    avg_qualification = sum(qualifications) / len(qualifications)
                    
                    if avg_qualification >= 4.5:
                        service_detail = restaurant['service_details']  
                        service_details.append(service_detail)

            except json.JSONDecodeError:
                print(f"Error al decodificar el archivo JSON: {file_path}")
            except Exception as e:
                print(f"Error al procesar el archivo {file_path}: {e}")


df = pd.DataFrame(service_details)

service_counts = df.apply(pd.Series.value_counts).fillna(0).sum(axis=1)

# Cambia nombres para hacerlos amigables 
service_counts.index = service_counts.index.str.replace('generador', 'Generador Eléctrico')
service_counts.index = service_counts.index.str.replace('guardería', 'Cuidados Infantiles')
service_counts.index = service_counts.index.str.replace('wifi', 'Wi-Fi')
service_counts.index = service_counts.index.str.replace('zoologico', 'Zoológico')
service_counts.index = service_counts.index.str.replace('parqueo', 'Parqueo')
service_counts.index = service_counts.index.str.replace('a domicilio', 'A Domicilio')
service_counts.index = service_counts.index.str.replace('billar', 'Billar')
service_counts.index = service_counts.index.str.replace('entretenimiento', 'Entretenimiento')
service_counts.index = service_counts.index.str.replace('terraza al aire libre', 'Terraza Al Aire Libre')
service_counts.index = service_counts.index.str.replace('vip', 'VIP')
service_counts.index = service_counts.index.str.replace('piscina', 'Piscina')
service_counts.index = service_counts.index.str.replace('guarderia', 'Cuidados Infantiles')
service_counts.index = service_counts.index.str.replace('parque infantil', 'Parque Infantil')
service_counts.index = service_counts.index.str.replace('acceso para discapacitados', 'Acceso para Discapacitados')

# Crea el gráfico interactivo
fig = px.pie(service_counts, values=service_counts.values, names=service_counts.index,
             title='Características que poseen los restaurantes más exitosos',
             labels={'value': 'Cantidad', 'index': 'Detalles Del Servicio'},
             hole=0.3)  


fig.show()

Finalmente, verificamos las áreas que presentan las mejores calificaciones.

In [None]:
import json
import os
import folium
from folium.plugins import HeatMap
from IPython.display import display

def calcular_calificaciones(ruta):
    calificaciones = {}
    
    
    for filename in os.listdir(ruta):
        if filename.endswith('.json'):
            file_path = os.path.join(ruta, filename)
            
            with open(file_path, 'r', encoding='utf-8') as file:
                data = json.load(file)

                # Obtiene el municipio
                municipio = data['locality']['mun'].lower()
                
                # Obtiene calificaciones
                calificacion_google = data['quality'].get('qualification_google')
                calificacion_tripadvisor = data['quality'].get('qualification_tripadvisor')
                calificacion_facebook = data['quality'].get('qualification_facebook')

                # Lista de Calificaciones
                calificaciones_validas = [calificacion for calificacion in 
                                           [calificacion_google, calificacion_tripadvisor, calificacion_facebook] 
                                           if calificacion is not None]

                
                if calificaciones_validas:
                    calificacion_promedio = sum(calificaciones_validas) / len(calificaciones_validas)
                else:
                    calificacion_promedio = 0  

                # Añade el diccionario
                if municipio not in calificaciones:
                    calificaciones[municipio] = {'total_calificacion': 0, 'contador': 0, 'coordenadas': []}
                
                calificaciones[municipio]['total_calificacion'] += calificacion_promedio
                calificaciones[municipio]['contador'] += 1
                
                # Obtiene coordenadas
                lat = data['locality']['locator']['map']['lat']
                lng = data['locality']['locator']['map']['lng']
                calificaciones[municipio]['coordenadas'].append((lat, lng))

    # Calcula el promedio por municipio
    for municipio, info in calificaciones.items():
        if info['contador'] > 0:
            info['promedio'] = info['total_calificacion'] / info['contador']
        else:
            info['promedio'] = 0

    return calificaciones

def crear_mapa_calor(calificaciones):
    mapa = folium.Map(location=[23.07540405820975, -82.35821067834236], zoom_start=12)

    # Puntos de calor
    heat_data = []
    for municipio, info in calificaciones.items():
        for coord in info['coordenadas']:
            heat_data.append([coord[0], coord[1], info['promedio']])  # lat, lng, weight

    # Mapa de calor
    HeatMap(heat_data, radius=15).add_to(mapa)

    return mapa

# Ruta 
ruta = 'restaurantes'

# Calcula calificaciones
calificaciones = calcular_calificaciones(ruta)


mapa_calor = crear_mapa_calor(calificaciones)

# Mapa 
display(mapa_calor)

Tras concluir las investigaciones sobre los sistemas de calificación de restaurantes, "El Chef" implementó un enfoque centrado en la experiencia del cliente, combinando una oferta gastronómica excepcional con un servicio impecable y una buena ubicación. En la gran apertura de su Super Restaurante, los comensales disfrutaron de platos innovadores y un ambiente acogedor. Las críticas fueron entusiastas, y "El Chef" se sintió satisfecho al ver su visión hecha realidad. Antes de marcharse, agradeció al equipo MIDAS por ayudarlo a cumplir su sueño, con la certeza de haber creado un legado culinario que perduraría en el tiempo.



## Desentrañando Tendencias y Comportamientos a Través de la Ciencia de Datos



Claudia es una talentosa community manager encargada de gestionar las identidades digitales de varios restaurantes. Con un profundo conocimiento de las dinámicas en redes sociales, ha desarrollado una intuición aguda sobre lo que atrae a los clientes y cómo se construye una comunidad en línea. Al enterarse de nuestro innovador proyecto, Claudia se sintió intrigada y decidió colaborar con nosotros.

Confiando en nuestras habilidades, nos otorgó la libertad de investigar todo lo relacionado con la interacción en redes sociales y la industria restaurantera. Estaba especialmente interesada en probar algunas de sus suposiciones sobre cómo las tendencias digitales afectan la percepción de los restaurantes y su capacidad para atraer y retener clientes. Esta colaboración no solo nos brindó acceso a datos valiosos, sino que también abrió la puerta a nuevas oportunidades para explorar la intersección entre la gastronomía y el mundo digital.

Comenzamos nuestra investigación revisando cuáles eran las redes sociales más utilizadas en el ámbito de la gastronomía. A través de un análisis exhaustivo, identificamos plataformas clave como Instagram, Facebook, Whatsapp y Telegram.

![redes01](pics/redes%20mas%20usadas.png)

De acuerdo al gráfico, las plataformas de redes sociales más utilizadas por los restaurantes son:

1. **Instagram**: Con una gran diferencia, esta es la red social más usada por los restaurantes, con un número de restaurantes que la utilizan muy superior al resto de plataformas.

2. **Facebook**: La segunda red social más utilizada por los restaurantes, con un número también muy alto de restaurantes que la emplean.

3. **WhatsApp**: Ocupa el tercer lugar en cuanto a uso por parte de los restaurantes, aunque con una cifra bastante más baja que las dos primeras.

4. **Telegram**: Es la plataforma menos utilizada por los restaurantes de las mostradas en el gráfico.

Los restaurantes se enfocan principalmente en Instagram y Facebook para su presencia en redes sociales, mientras que herramientas como WhatsApp y Telegram tienen un uso más limitado en este sector.

Optamos realizar una revisión exhaustiva sobre cómo se distribuyen las redes sociales entre los restaurantes

![redes02](pics/cant%20de%20redes.png)



El gráfico muestra una clara tendencia en la distribución del uso de redes sociales entre los establecimientos:

 1. Uso predominante de una red social:

La mayoría de los establecimientos, aproximadamente **90**, optan por utilizar solo una red social. Esto podría deberse a la facilidad de gestión y a la capacidad de enfocarse en una sola plataforma para construir su presencia en línea.

 2. Uso considerable de dos redes sociales:

Un número notable de establecimientos, alrededor de **70**, eligen usar dos redes sociales. Esto permite una mayor diversificación y alcance, llegando a diferentes segmentos del público.

 3. Menor uso de tres redes sociales:

Aproximadamente **40** establecimientos usan tres redes sociales, lo que sugiere que solo algunos están dispuestos a invertir el tiempo y los recursos necesarios para gestionar varias plataformas a la vez.

 4. Mínimo uso de cuatro redes sociales:
 
Muy pocos establecimientos, casi ninguno en realidad, se aventuran a usar cuatro redes sociales. Esto podría deberse a las limitaciones de recursos o a la percepción de que no es necesario estar en tantas plataformas para alcanzar sus objetivos de marketing.

La mayoría de los establecimientos prefieren concentrar sus esfuerzos en una o dos redes sociales, probablemente por motivos de eficiencia y efectividad.


## Ayudando a la Economía

La Habana estaba en plena efervescencia. La noticia sobre los logros del Grupo M.I.D.A.S en su análisis de bares y restaurantes se había esparcido rápidamente, convirtiéndolos en un referente en la ciudad.

Un día, mientras revisaban informes, el teléfono sonó. Era Fernando, el Director del Ministerio de Finanzas y Precios. Fernando explicó que buscaban analizar los precios de los menús y las variaciones en diferentes zonas de la ciudad.

Sabiendo que esta colaboración podría marcar un antes y un después en la regulación del mercado, analizamos todo lo que encontramos útil.

Primero encontramos datos sobre el salario promedio de los cubanos , 5750 CUP (Datos Oficiales: IPS Cuba), luego revisamos el precio promedio de los platos principales por municipio:

![pl](pics/PreciosPromedio.png)

Los precios actuales de los alimentos no se corresponden con el salario promedio de los cubanos, lo que reduce significativamente las posibilidades de disfrutar de las variadas ofertas gastronómicas.

En nuestro análisis, también decidimos abordar el tema de los tragos, dado que hemos notado una marcada desproporción en los precios entre los distintos municipios.

![tragos](pics/Tragos.png)

Esta variabilidad no solo refleja las diferencias en la oferta y demanda local, sino que también pone de manifiesto la diversidad cultural y gastronómica de cada región. Es fascinante observar cómo factores como la ubicación geográfica, el nivel de turismo y las costumbres locales influyen en el costo de bebidas tan populares como el mojito, la margarita, el cuba libre y la caipiroska.

Debido a los problemas que podrían enfrentar los ciudadanos, hemos decidido implementar un programa que alivie los dolores de cabeza causados por estas dificultades.





In [None]:
import os
import json
import folium
import random
from IPython.display import display

def analizar_json_en_carpeta(carpeta, presupuesto_entrante, presupuesto_principal, presupuesto_bebida, presupuesto_postre):
    resultados = []

    
    if not os.path.exists(carpeta):
        print(f"La carpeta '{carpeta}' no existe.")
        return resultados

    for archivo in os.listdir(carpeta):
        if archivo.endswith('.json'):
            ruta_archivo = os.path.join(carpeta, archivo)
            with open(ruta_archivo, 'r', encoding='utf-8') as f:
                try:
                    data = json.load(f)
                    nombre = data.get('name')
                    
                    
                    if 'locality' not in data or 'menu' not in data:
                        print(f"El archivo '{archivo}' no tiene la estructura esperada.")
                        continue
                    
                    localizacion = data['locality']['locator']['map']
                    lat = localizacion['lat']
                    lng = localizacion['lng']
                    menu = data.get('menu', {})
                    
                    entrante_valido = None
                    plato_principal_valido = None
                    bebida_valida = None
                    postre_valido = None

                    # Busca entrantes válidos
                    entrantes_validos = [plato for plato in menu.get('starters', []) if plato and 'price' in plato and plato['price'] is not None and plato['price'] <= presupuesto_entrante]
                    if entrantes_validos:
                        entrante_valido = random.choice(entrantes_validos)

                    # Busca platos principales válidos
                    platos_principales_validos = [plato for plato in menu.get('main_courses', []) if plato and 'price' in plato and plato['price'] is not None and plato['price'] <= presupuesto_principal]
                    if platos_principales_validos:
                        plato_principal_valido = random.choice(platos_principales_validos)

                    # Busca bebidas válidas
                    bebidas_validas = []
                    for categoria in data.get('drinks', {}):
                        for bebida in data['drinks'][categoria]:
                            if bebida and 'item' in bebida and 'price' in bebida and bebida['price'] is not None and bebida['price'] <= presupuesto_bebida:
                                bebidas_validas.append(bebida)
                    if bebidas_validas:
                        bebida_valida = random.choice(bebidas_validas)

                    # Busca postres válidos
                    postres_validos = [plato for plato in menu.get('desserts', []) if plato and 'price' in plato and plato['price'] is not None and plato['price'] <= presupuesto_postre]
                    if postres_validos:
                        postre_valido = random.choice(postres_validos)

                    if entrante_valido and plato_principal_valido and bebida_valida:
                        total_presupuesto = (entrante_valido['price'] + plato_principal_valido['price'] + bebida_valida['price'] + (postre_valido['price'] if postre_valido else 0))
                        resultados.append({
                            'nombre': nombre,
                            'lat': lat,
                            'lng': lng,
                            'entrante': entrante_valido['item'].capitalize(),
                            'precio_entrante': entrante_valido['price'],
                            'plato_principal': plato_principal_valido['item'].capitalize(),
                            'precio_principal': plato_principal_valido['price'],
                            'bebida': bebida_valida['item'].capitalize(),
                            'precio_bebida': bebida_valida['price'],
                            'postre': postre_valido['item'].capitalize() if postre_valido else None,
                            'precio_postre': postre_valido['price'] if postre_valido else 0,
                            'total_presupuesto': total_presupuesto
                        })
                except json.JSONDecodeError:
                    print(f"Error al decodificar el archivo {archivo}")

    return resultados

def crear_mapa(resultados):
    mapa = folium.Map(location=[23.0754, -82.3582], zoom_start=12)  # Centra el mapa en una ubicación

    for resultado in resultados:
        tooltip_text = f"Entrante: {resultado['entrante']} (${resultado['precio_entrante']})<br>Plato Principal: {resultado['plato_principal']} (${resultado['precio_principal']})<br>Bebida: {resultado['bebida']} (${resultado['precio_bebida']})<br>Postre: {resultado['postre'] if resultado['postre'] else 'No seleccionado'} (${resultado['precio_postre']})<br>Presupuesto Total: ${resultado['total_presupuesto']}"
        folium.Marker(
            location=[resultado['lat'], resultado['lng']],
            icon=folium.Icon(color="blue", icon='cutlery', prefix='fa'),
            popup=resultado['nombre'],
            tooltip=tooltip_text
        ).add_to(mapa)

    return mapa

# Inputs del usuario
presupuesto_entrante = float(input("Ingrese su presupuesto para entrantes: "))
presupuesto_principal = float(input("Ingrese su presupuesto para platos principales: "))
presupuesto_bebida = float(input("Ingrese su presupuesto para bebidas: "))
presupuesto_postre = float(input("Ingrese su presupuesto para postres: "))


carpeta = 'restaurantes'
resultados = analizar_json_en_carpeta(carpeta, presupuesto_entrante, presupuesto_principal, presupuesto_bebida, presupuesto_postre)

# Mapa
mapa = crear_mapa(resultados)


display(mapa)




El Ministerio de Finanzas y Precios ha expresado su firme compromiso de abordar la situación actual. Prometió implementar nuevas regulaciones que busquen evitar fluctuaciones abruptas en los niveles salariales y en los precios de los alimentos. Estas medidas tienen como objetivo garantizar una mayor estabilidad económica y mejorar el bienestar de la población.



# Conclusión del Proyecto:

A lo largo de nuestra investigación sobre los datos de restaurantes, hemos descubierto patrones significativos que revelan las preferencias de los comensales y las tendencias del mercado. Al analizar factores como la calificación de los clientes, la oferta gastronómica y la ubicación, logramos identificar las claves del éxito en la industria restaurantera.

Estos hallazgos no solo proporcionan una base sólida para que los propietarios optimicen sus estrategias, sino que también ofrecen recomendaciones prácticas para mejorar la experiencia del cliente. La implementación de estos insights puede conducir a un aumento en la satisfacción del cliente y, en última instancia, a un crecimiento sostenible del negocio.

Estamos convencidos de que, al aplicar métodos de ciencia de datos, los restaurantes pueden adaptarse mejor a las demandas del mercado y crear experiencias memorables para sus comensales. Este proyecto ha demostrado el poder de los datos en la toma de decisiones estratégicas y su impacto en el futuro de la gastronomía.