<div >
<img src = "figs/ans_banner_1920x200.png" />
</div>

# Caso-taller: Identificando  Burger Master con MMG

El Burger Master es un evento creado en el 2016 por el *influencer* Tulio Zuluaga, más conocido en redes como Tulio recomienda, el cual busca que por una semana las hamburgueserías de cada ciudad ofrezcan su mejor producto a un precio reducido. 

El evento ha venido creciendo y en el 2022 se extendió por 21 ciudades de Colombia para las cuales se estimó que se vendieron más de dos millones de hamburguesas. El objetivo del presente caso-taller  es identificar los puntos calientes de hamburgueserías  que compitieron en  la ciudad de Bogotá aplicando el Modelo de Mezclas Gaussianas.

## Instrucciones generales

1. Para desarrollar el *cuaderno* primero debe descargarlo.

2. Para responder cada inciso deberá utilizar el espacio debidamente especificado.

3. La actividad será calificada sólo si sube el *cuaderno* de jupyter notebook con extensión `.ipynb` en la actividad designada como "Revisión por el compañero."

4. El archivo entregado debe poder ser ejecutado localmente por los pares. Sea cuidadoso con la especificación de la ubicación de los archivos de soporte, guarde la carpeta de datos  en la misma ruta de acceso del cuaderno, por ejemplo: `data`.


## Desarrollo

### 1. Carga de datos  

En la carpeta `data` se encuentra el archivo `burger_master.xlsx` para la ciudad de Bogotá, cargue estos datos en su *cuaderno* y reporte brevemente el contenido de la base.

In [10]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import geopandas as gpd

In [11]:
# !pip install openpyxl

In [12]:
data_df = pd.read_excel("data/burger_master.xlsx")
data_df.head(5)

Unnamed: 0,Restaurante,Dirección,Descripción,Latitud,Longitud
0,MAIKKI,Cra 75 # 24D – 48,"<p>MAIKKI MACUIRA: Cama de chicharrón soplado,...",4.668833,-74.116828
1,MAIKKI,Calle 119 # 11A – 24,"<p>MAIKKI MACUIRA: Cama de chicharrón soplado,...",4.698395,-74.036585
2,MAIKKI,Cra 47A # 98 – 47,"<p>MAIKKI MACUIRA: Cama de chicharrón soplado,...",4.686401,-74.060144
3,FRENCHEESE,Calle 51 #22-55,"<p>Presentamos «La French Master», inspirada e...",4.639514,-74.073545
4,FRENCHEESE,Calle 80 #14-41,"<p>Presentamos «La French Master», inspirada e...",4.666147,-74.056758


In [13]:
print("cantidad de locales participantes: {}".format(data_df.shape[0]))
print("cantidad de restaurantes/franquicias participantes: {}".format(len(data_df["Restaurante"].unique())))
print()
print("cantidad de direcciones unicas {}".format(len(data_df["Dirección"].unique())))

cantidad de locales participantes: 137
cantidad de restaurantes/franquicias participantes: 63

cantidad de direcciones unicas 116


In [14]:
data_df = data_df.drop_duplicates()
print("cantidad de locales participantes: {}".format(data_df.shape[0]))
print("cantidad de restaurantes/franquicias participantes: {}".format(len(data_df["Restaurante"].unique())))
print()
print("cantidad de direcciones unicas {}".format(len(data_df["Dirección"].unique())))

cantidad de locales participantes: 116
cantidad de restaurantes/franquicias participantes: 63

cantidad de direcciones unicas 116


In [15]:
data_gp = gpd.GeoDataFrame(data_df, geometry = gpd.points_from_xy(data_df.Longitud, data_df.Latitud))
data_gp.head()

Unnamed: 0,Restaurante,Dirección,Descripción,Latitud,Longitud,geometry
0,MAIKKI,Cra 75 # 24D – 48,"<p>MAIKKI MACUIRA: Cama de chicharrón soplado,...",4.668833,-74.116828,POINT (-74.11683 4.66883)
1,MAIKKI,Calle 119 # 11A – 24,"<p>MAIKKI MACUIRA: Cama de chicharrón soplado,...",4.698395,-74.036585,POINT (-74.03658 4.69839)
2,MAIKKI,Cra 47A # 98 – 47,"<p>MAIKKI MACUIRA: Cama de chicharrón soplado,...",4.686401,-74.060144,POINT (-74.06014 4.68640)
3,FRENCHEESE,Calle 51 #22-55,"<p>Presentamos «La French Master», inspirada e...",4.639514,-74.073545,POINT (-74.07355 4.63951)
4,FRENCHEESE,Calle 80 #14-41,"<p>Presentamos «La French Master», inspirada e...",4.666147,-74.056758,POINT (-74.05676 4.66615)


(Utilice este espacio para describir el procedimiento, análisis, y conclusiones)

### 2.  Visualizando los datos

Visualice la ubicación de cada restaurante en un mapa interactivo. Añada un marcador para cada restaurante y la posibilidad de encontrar la descripción de la hamburguesa ofrecida en un pop-up. (Note que la columna Descripción contiene otra información adicional).

In [16]:
data_gp["descripcion_hamburguesa"] = data_gp["Descripción"].str.split("<br/>").str[0].str.replace("<p>","")

In [17]:
#importamos la librería
import folium

#Mapa base
map = folium.Map(location = [data_gp.Latitud.mean(), data_gp.Longitud.mean()], tiles = "OpenStreetMap", zoom_start = 10)
# Otras opciones de tiles
#Stamen Terrain, Toner, and Watercolor

#capa teatros
for i in range(0,len(data_gp)):
   folium.Marker(
      location=[data_gp.iloc[i]['Latitud'], data_gp.iloc[i]['Longitud']],
      popup=data_gp.iloc[i]['descripcion_hamburguesa']
   ).add_to(map)


#Display el mapa
map

In [18]:
from pyrosm import OSM, get_data

fp = get_data("Bogota")

# Inicializamos el lector para Buenos Aires
osm = OSM(fp)
capital= osm.get_boundaries(boundary_type='administrative',name="UPZ")
excluir = capital["name"] == "UPZs de Bogotá"
capital[~excluir].explore()

ImportError: The 'folium', 'matplotlib' and 'mapclassify' packages are required for 'explore()'. You can install them using 'conda install -c conda-forge folium matplotlib mapclassify' or 'pip install folium matplotlib mapclassify'.

(Utilice este espacio para describir el procedimiento, análisis, y conclusiones)

### 3.  Análisis de puntos calientes

Aplique el modelo de Mezclas Gaussianas para buscar clusters de restaurantes en Bogotá, mencione qué estructura de covarianza usó y explique por qué. Escoja el número óptimo de componentes, explicando el procedimiento y justificando su elección.

In [None]:
from sklearn.mixture import GaussianMixture

In [None]:
iter_covariance = ["full", "tied", "diag", "spherical"]
X = data_gp[['Longitud','Latitud']].values

dict_covariance_type = {}
for c in iter_covariance:
    n_components = np.arange(1, 100)
    models = [GaussianMixture(n, covariance_type=c, random_state=3).fit(X)
              for n in n_components]
    
    dict_covariance_type[c] = models

In [None]:
fig, ax = plt.subplots()
colors = plt.cm.tab10(np.arange(0,len(dict_covariance_type)))

for i,(k,models) in enumerate(dict_covariance_type.items()):
    print(i)
    ax.plot(n_components, [-m.score(X) for m in models], label=k, color = colors[i])

plt.xlabel('Número de componentes')    
plt.legend()
plt.show()

In [None]:
fig, ax = plt.subplots()
colors = plt.cm.tab10(np.arange(0,len(dict_covariance_type)*2))

for i,(k,models) in enumerate(dict_covariance_type.items()):
    print(i)
    ax.plot(n_components[:20], [m.bic(X) for m in models[:20]], label='BIC-{}'.format(k), color=colors[i])
    ax.plot(n_components[:20], [m.aic(X) for m in models[:20]], label='AIC-{}'.format(k), color=colors[i])

plt.xlabel('Número de componentes')    
plt.legend(loc='best')
plt.show()

In [None]:
X = teatros[['lon','lat']].values
MMG_teatros = GaussianMixture(n_components=6, covariance_type='full',random_state=123)
labels = MMG_teatros.fit(X).predict(X)

(Utilice este espacio para describir el procedimiento, análisis, y conclusiones)

https://scikit-learn.org/stable/auto_examples/mixture/plot_gmm_covariances.html

#### 3.1. Visualización de los resultados

Visualice las densidades estimadas por el  mejor modelo estimado en la sección anterior usando un mapa de calor interactivo, discuta los resultados.

In [None]:
n_components = 10
best_GM = GaussianMixture(n_components, covariance_type="full", random_state=3).fit(X)

labels = best_GM.predict(X)
data_gp['cluster']=labels

colors = plt.cm.tab10(np.arange(0,n_components))
colors = ['red',
    'orange',
    'green',
    'purple',
    'cadetblue',
    'pink',
          'aqua',
          'yellow',
          'magenta',
          'lime'
         ]

def colorCall(val):
  val = int(val)
  return colors[val]

#capa clusters de teatros
for lat, lon, c in zip(data_gp['Latitud'], data_gp['Longitud'], data_gp['cluster']):
    folium.CircleMarker(
        [lat, lon],
        radius=8,
        fill_color = colorCall(c),
        fill=True,
        color=colorCall(c),
        fill_opacity=0.7
        ).add_to(map)
    


#Display el mapa
map

(Utilice este espacio para describir el procedimiento, análisis, y conclusiones)

### 4. Comparación con KDE

Estime ahora las densidades usando KDE bivariado de la librería `statsmodels` con el anchos de banda dado por `cv_ml`. Muestre los resultados usando un mapa interactivo. Compare los resultados obtenidos por el "mejor" modelo encontrado via MMG. 

In [None]:
# Utilice este espacio para escribir el código.

(Utilice este espacio para describir el procedimiento, análisis, y conclusiones)