<div style="text-align: center;">
  <img src="https://github.com/Hack-io-Data/Imagenes/blob/main/01-LogosHackio/logo_naranja@4x.png?raw=true" alt="esquema" />
</div>

# Laboratorio API's 

SetMagic Productions es una empresa especializada en la provisión de servicios integrales para la realización de rodajes cinematográficos y audiovisuales. Nos dedicamos a facilitar tanto el atrezzo necesario para las producciones como los lugares idóneos para llevar a cabo los rodajes, ya sea en entornos al aire libre o en interiores.

**Servicios Ofrecidos:**

- **Atrezzo Creativo:** Contamos con un extenso catálogo de atrezzo que abarca desde accesorios hasta muebles y objetos temáticos para ambientar cualquier tipo de  escena.

- **Locaciones Únicas:** Nuestra empresa ofrece una amplia selección de locaciones, que incluyen desde escenarios naturales como playas, bosques y montañas, hasta espacios interiores como estudios, casas históricas y edificios emblemáticos.

- **Servicios de Producción:** Además de proporcionar atrezzo y locaciones, también ofrecemos servicios de producción audiovisual, incluyendo equipos de filmación, personal técnico y servicios de postproducción.

**Herramientas y Tecnologías:**

Para recopilar información sobre nuevas locaciones y tendencias en atrezzo, utilizamos herramientas de web scraping como Beautiful Soup y Selenium para extraer datos de sitios web relevantes y redes sociales especializadas en cine y producción audiovisual. También integramos APIs de plataformas de alquiler de locaciones y bases de datos de atrezzo para acceder a información actualizada y detallada.

**Almacenamiento de Datos:**

La información recopilada mediante web scraping y APIs se almacena en una base de datos no relacional MongoDB. Esta base de datos nos permite organizar eficientemente la información sobre locaciones, atrezzo, clientes y proyectos en curso, facilitando su acceso y gestión.

**Objetivo:**

Nuestro objetivo principal es proporcionar a nuestros clientes una experiencia fluida y personalizada en la búsqueda y selección de locaciones y atrezzo para sus proyectos audiovisuales. Utilizando tecnologías avanzadas y una amplia red de contactos en la industria, nos esforzamos por ofrecer soluciones creativas y de alta calidad que satisfagan las necesidades específicas de cada producción.


# Lab: APIs y Obtención de Datos de Localizaciones para Rodajes

En este laboratorio aprenderás a utilizar APIs para obtener información sobre localizaciones de rodaje en la Comunidad de Madrid. A lo largo de este ejercicio, implementarás funciones que te permitirán extraer coordenadas, buscar lugares de interés y almacenar la información en un formato que puedas reutilizar.

## Objetivo

Obtener información geográfica y sobre posibles localizaciones para rodajes en diferentes municipios de la Comunidad de Madrid, utilizando APIs como **Geopy** y **Foursquare**.

### Paso 1: Obtener Coordenadas de los Municipios

Primero, necesitas obtener las coordenadas geográficas (latitud y longitud) de cada municipio en la Comunidad de Madrid. Para esto, utilizarás la biblioteca **Geopy** y su funcionalidad para geocodificar. La lista de los municipios de la Comunidad de Madrid es:

```python
lista_municipios = ['acebeda-la', 'ajalvir', 'alameda-del-valle', 'alamo-el', 'alcala-de-henares', 'alcobendas', 'alcorcon', 'aldea-del-fresno', 'algete', 'alpedrete', 'ambite', 'anchuelo', 'aranjuez', 'arganda-del-rey', 'arroyomolinos', 'atazar-el', 'batres', 'becerril-de-la-sierra', 'belmonte-de-tajo', 'berrueco-el', 'berzosa-del-lozoya', 'boadilla-del-monte', 'boalo-el', 'braojos', 'brea-de-tajo', 'brunete', 'buitrago-del-lozoya', 'bustarviejo', 'cabanillas-de-la-sierra', 'cabrera-la', 'cadalso-de-los-vidrios', 'camarma-de-esteruelas', 'campo-real', 'canencia', 'carabana', 'casarrubuelos', 'cenicientos', 'cercedilla', 'cervera-de-buitrago', 'chapineria', 'chinchon', 'ciempozuelos', 'cobena', 'collado-mediano', 'collado-villalba', 'colmenar-del-arroyo', 'colmenar-de-oreja', 'colmenarejo', 'colmenar-viejo', 'corpa', 'coslada', 'cubas-de-la-sagra', 'daganzo-de-arriba', 'escorial-el', 'estremera', 'fresnedillas-de-la-oliva', 'fresno-de-torote', 'fuenlabrada', 'fuente-el-saz-de-jarama', 'fuentiduena-de-tajo', 'galapagar', 'garganta-de-los-montes', 'gargantilla-del-lozoya-y-pinilla-de-buitrago', 'gascones', 'getafe', 'grinon', 'guadalix-de-la-sierra', 'guadarrama', 'hiruela-la', 'horcajo-de-la-sierra-aoslos', 'horcajuelo-de-la-sierra', 'hoyo-de-manzanares', 'humanes-de-madrid', 'leganes', 'loeches', 'lozoya', 'lozoyuela-navas-sieteiglesias', 'madarcos', 'madrid', 'majadahonda', 'manzanares-el-real', 'meco', 'mejorada-del-campo', 'miraflores-de-la-sierra', 'molar-el', 'molinos-los', 'montejo-de-la-sierra', 'moraleja-de-enmedio', 'moralzarzal', 'morata-de-tajuna', 'mostoles', 'navacerrada', 'navalafuente', 'navalagamella', 'navalcarnero', 'navarredonda-y-san-mames', 'navas-del-rey', 'nuevo-baztan', 'olmeda-de-las-fuentes', 'orusco-de-tajuna', 'paracuellos-de-jarama', 'parla', 'patones', 'pedrezuela', 'pelayos-de-la-presa', 'perales-de-tajuna', 'pezuela-de-las-torres', 'pinilla-del-valle', 'pinto', 'pinuecar-gandullas', 'pozuelo-de-alarcon', 'pozuelo-del-rey', 'pradena-del-rincon', 'puebla-de-la-sierra', 'puentes-viejas-manjiron', 'quijorna', 'rascafria', 'reduena', 'ribatejada', 'rivas-vaciamadrid', 'robledillo-de-la-jara', 'robledo-de-chavela', 'robregordo', 'rozas-de-madrid-las', 'rozas-de-puerto-real', 'san-agustin-del-guadalix', 'san-fernando-de-henares', 'san-lorenzo-de-el-escorial', 'san-martin-de-la-vega', 'san-martin-de-valdeiglesias', 'san-sebastian-de-los-reyes', 'santa-maria-de-la-alameda', 'santorcaz', 'santos-de-la-humosa-los', 'serna-del-monte-la', 'serranillos-del-valle', 'sevilla-la-nueva', 'somosierra', 'soto-del-real', 'talamanca-de-jarama', 'tielmes', 'titulcia', 'torrejon-de-ardoz', 'torrejon-de-la-calzada', 'torrejon-de-velasco', 'torrelaguna', 'torrelodones', 'torremocha-de-jarama', 'torres-de-la-alameda', 'tres-cantos', 'valdaracete', 'valdeavero', 'valdelaguna', 'valdemanco', 'valdemaqueda', 'valdemorillo', 'valdemoro', 'valdeolmos-alalpardo', 'valdepielagos', 'valdetorres-de-jarama', 'valdilecha', 'valverde-de-alcala', 'velilla-de-san-antonio', 'vellon-el', 'venturada', 'villaconejos', 'villa-del-prado', 'villalbilla', 'villamanrique-de-tajo', 'villamanta', 'villamantilla', 'villanueva-de-la-canada', 'villanueva-del-pardillo', 'villanueva-de-perales', 'villar-del-olmo', 'villarejo-de-salvanes', 'villaviciosa-de-odon', 'villavieja-del-lozoya', 'zarzalejo']
```

1. Instalar y configurar la biblioteca de Geopy para realizar la geocodificación.

2. Crear una función que reciba una lista de municipios y devuelva un DataFrame con los nombres de los municipios y sus respectivas coordenadas (latitud y longitud).

3. Validar los datos obtenidos para verificar si hay municipios sin coordenadas y resolver posibles problemas, como nombres incorrectos o faltantes.


### Paso 2: Buscar Localizaciones Relevantes con la API de Foursquare

Una vez obtenidas las coordenadas de los municipios, utilizarás la API de Foursquare para buscar servicios que pueden ser importantes en un rodaje (ej: parques, edificios históricos, plazas).

En este punto es importante que reflexiones sobre los servicios o establecimientos clave que considerarías relevantes para establecer una empresa de servicios para rodajes. No hay una única respuesta correcta, ya que depende de la estrategia y visión que tengas. Al menos deberás elegir 5 tipos de servicios que puedan influir en la decisión de ubicación. Ejemplos de estos servicios pueden incluir:

- Parques o áreas verdes para rodajes exteriores.

- Centros comerciales que faciliten acceso a diferentes necesidades logísticas.

- Bares o restaurantes para el catering del equipo.

- Tiendas especializadas en disfraces o vestuario.

- Alquileres de equipos audiovisuales.

Es crucial entender que esta selección depende de la naturaleza y enfoque de la empresa. Tal vez para algunos proyectos sea más importante estar cerca de áreas residenciales o lugares con buena conexión de transporte. Otros proyectos podrían priorizar la proximidad a tiendas especializadas o servicios de entretenimiento. Es vuestra decisión! 

1. Crear una cuenta en [Foursquare](https://location.foursquare.com/developer/) y obtener la API Key necesaria para realizar las solicitudes. Leer la documentación para entender como funciona. 

2. Definir una función para realizar búsquedas de lugares cercanos a las coordenadas de cada municipio. Esta función debe permitir filtrar los resultados por categoría y distancia.

3. Explorar las categorías disponibles en Foursquare y seleccionar aquellas que se ajusten a los servicios clave que decidáis para vuestra estrategia.

4. Aplicar la función de búsqueda a cada municipio, recopilando información sobre los lugares relevantes.

Recuerda que la elección de categorías es un punto de análisis clave en este ejercicio, ya que la información que obtendréis será fundamental para decidir la ubicación ideal para vuestra empresa. Aseguraos de justificar vuestras decisiones y considerar diferentes perspectivas. Para cada una de los municipios deberás sacar la información de todos los servicios elegidos. 

### Paso 3: Limpieza de la Información

La información obtenida de Foursquare puede incluir muchos detalles innecesarios. Tu objetivo es quedarte únicamente con los campos relevantes para tu análisis (nombre, dirección, coordenadas, tipo de lugar, etc.).


1. Explorar la estructura de los datos obtenidos para identificar los campos importantes y limpiar la información.

2. Eliminar duplicados y valores nulos para garantizar la consistencia y calidad de los datos.

### Paso 4: Almacenamiento de los Datos

Una vez que tengas la información limpia y organizada, almacénala en un archivo CSV que puedas reutilizar en futuros análisis.


## PASO 1

**Toodas las funciones que se piden en el enunciado están definidas en el archivo support.py**

In [1]:
!pip install geopy



In [2]:
from geopy.geocoders import Nominatim
import pandas as pd
import numpy as np
from src.support import obtener_df_coordenadas, buscar_lugares, obtener_servicios_municipios
# Uso de API's
# -----------------------------------------------------------------------
import requests

# Para incluir una barra de proceso en for loops
# -----------------------------------------------------------------------
from tqdm import tqdm


# Para introducir tiempo entre las llamadas
# -----------------------------------------------------------------------
from time import sleep


# Para trabajar con archivos dotenv y los tokens
# -----------------------------------------------------------------------
import os
import dotenv
dotenv.load_dotenv()

True

In [3]:
lista_municipios = ['acebeda-la', 'ajalvir', 'alameda-del-valle', 'alamo-el', 'alcala-de-henares', 'alcobendas', 'alcorcon', 'aldea-del-fresno', 'algete', 'alpedrete', 'ambite', 'anchuelo', 'aranjuez', 'arganda-del-rey', 'arroyomolinos', 'atazar-el', 'batres', 'becerril-de-la-sierra', 'belmonte-de-tajo', 'berrueco-el', 'berzosa-del-lozoya', 'boadilla-del-monte', 'boalo-el', 'braojos', 'brea-de-tajo', 'brunete', 'buitrago-del-lozoya', 'bustarviejo', 'cabanillas-de-la-sierra', 'cabrera-la', 'cadalso-de-los-vidrios', 'camarma-de-esteruelas', 'campo-real', 'canencia', 'carabana', 'casarrubuelos', 'cenicientos', 'cercedilla', 'cervera-de-buitrago', 'chapineria', 'chinchon', 'ciempozuelos', 'cobena', 'collado-mediano', 'collado-villalba', 'colmenar-del-arroyo', 'colmenar-de-oreja', 'colmenarejo', 'colmenar-viejo', 'corpa', 'coslada', 'cubas-de-la-sagra', 'daganzo-de-arriba', 'escorial-el', 'estremera', 'fresnedillas-de-la-oliva', 'fresno-de-torote', 'fuenlabrada', 'fuente-el-saz-de-jarama', 'fuentiduena-de-tajo', 'galapagar', 'garganta-de-los-montes', 'gargantilla-del-lozoya-y-pinilla-de-buitrago', 'gascones', 'getafe', 'grinon', 'guadalix-de-la-sierra', 'guadarrama', 'hiruela-la', 'horcajo-de-la-sierra-aoslos', 'horcajuelo-de-la-sierra', 'hoyo-de-manzanares', 'humanes-de-madrid', 'leganes', 'loeches', 'lozoya', 'lozoyuela-navas-sieteiglesias', 'madarcos', 'madrid', 'majadahonda', 'manzanares-el-real', 'meco', 'mejorada-del-campo', 'miraflores-de-la-sierra', 'molar-el', 'molinos-los', 'montejo-de-la-sierra', 'moraleja-de-enmedio', 'moralzarzal', 'morata-de-tajuna', 'mostoles', 'navacerrada', 'navalafuente', 'navalagamella', 'navalcarnero', 'navarredonda-y-san-mames', 'navas-del-rey', 'nuevo-baztan', 'olmeda-de-las-fuentes', 'orusco-de-tajuna', 'paracuellos-de-jarama', 'parla', 'patones', 'pedrezuela', 'pelayos-de-la-presa', 'perales-de-tajuna', 'pezuela-de-las-torres', 'pinilla-del-valle', 'pinto', 'pinuecar-gandullas', 'pozuelo-de-alarcon', 'pozuelo-del-rey', 'pradena-del-rincon', 'puebla-de-la-sierra', 'puentes-viejas-manjiron', 'quijorna', 'rascafria', 'reduena', 'ribatejada', 'rivas-vaciamadrid', 'robledillo-de-la-jara', 'robledo-de-chavela', 'robregordo', 'rozas-de-madrid-las', 'rozas-de-puerto-real', 'san-agustin-del-guadalix', 'san-fernando-de-henares', 'san-lorenzo-de-el-escorial', 'san-martin-de-la-vega', 'san-martin-de-valdeiglesias', 'san-sebastian-de-los-reyes', 'santa-maria-de-la-alameda', 'santorcaz', 'santos-de-la-humosa-los', 'serna-del-monte-la', 'serranillos-del-valle', 'sevilla-la-nueva', 'somosierra', 'soto-del-real', 'talamanca-de-jarama', 'tielmes', 'titulcia', 'torrejon-de-ardoz', 'torrejon-de-la-calzada', 'torrejon-de-velasco', 'torrelaguna', 'torrelodones', 'torremocha-de-jarama', 'torres-de-la-alameda', 'tres-cantos', 'valdaracete', 'valdeavero', 'valdelaguna', 'valdemanco', 'valdemaqueda', 'valdemorillo', 'valdemoro', 'valdeolmos-alalpardo', 'valdepielagos', 'valdetorres-de-jarama', 'valdilecha', 'valverde-de-alcala', 'velilla-de-san-antonio', 'vellon-el', 'venturada', 'villaconejos', 'villa-del-prado', 'villalbilla', 'villamanrique-de-tajo', 'villamanta', 'villamantilla', 'villanueva-de-la-canada', 'villanueva-del-pardillo', 'villanueva-de-perales', 'villar-del-olmo', 'villarejo-de-salvanes', 'villaviciosa-de-odon', 'villavieja-del-lozoya', 'zarzalejo']

    

In [4]:
df_coordenadas=obtener_df_coordenadas(lista_municipios)

100%|██████████| 179/179 [03:19<00:00,  1.11s/it]


In [5]:
df_coordenadas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 179 entries, 0 to 178
Data columns (total 3 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   Municipio  179 non-null    object 
 1   Latitud    179 non-null    float64
 2   Longitud   179 non-null    float64
dtypes: float64(2), object(1)
memory usage: 4.3+ KB


In [6]:
df_coordenadas.to_csv("coordenadas_municipios.csv", index =None)

In [7]:
df_coordenadas=pd.read_csv("coordenadas_municipios.csv")
df_coordenadas


Unnamed: 0,Municipio,Latitud,Longitud
0,acebeda-la,41.086958,-3.624399
1,ajalvir,40.534230,-3.480782
2,alameda-del-valle,40.917718,-3.843822
3,alamo-el,40.230730,-3.990589
4,alcala-de-henares,40.481840,-3.364497
...,...,...,...
174,villar-del-olmo,40.336447,-3.235562
175,villarejo-de-salvanes,40.168358,-3.273876
176,villaviciosa-de-odon,40.357379,-3.900233
177,villavieja-del-lozoya,41.006362,-3.671629


## Paso 2

Entramos en la API de foursquare seguimos la documentación, nos generamos una key, y ejecutamos el codigo de abajo para hacer nuestra primera consulta con la API

In [8]:
import os
url = "https://api.foursquare.com/v3/places/search?query=coffee&ll=40.481840,-3.364497&radius=5000&categories=63be6904847c3692a84b9bb6"

key = os.getenv("token")
headers = {
    "accept": "application/json",
    "Authorization": key
}
response = requests.request("GET", url, headers=headers)
print(response.text)


{"results":[{"fsq_id":"4bddc4070ee3a5933a8e2eb0","categories":[{"id":13036,"name":"Tea Room","short_name":"Tea Room","plural_name":"Tea Rooms","icon":{"prefix":"https://ss3.4sqi.net/img/categories_v2/food/tearoom_","suffix":".png"}},{"id":13065,"name":"Restaurant","short_name":"Restaurant","plural_name":"Restaurants","icon":{"prefix":"https://ss3.4sqi.net/img/categories_v2/food/default_","suffix":".png"}}],"chains":[],"closed_bucket":"LikelyOpen","distance":158,"geocodes":{"main":{"latitude":40.48325,"longitude":-3.365344},"roof":{"latitude":40.48325,"longitude":-3.365344}},"link":"/v3/places/4bddc4070ee3a5933a8e2eb0","location":{"address":"Calle Mayor, 6","admin_region":"Comunidad de Madrid","country":"ES","cross_street":"Corral Campaña","formatted_address":"Calle Mayor, 6 (Corral Campaña), 28801 Alcalá de Henares Comunidad de Madrid","locality":"Alcalá de Henares","postcode":"28801","region":"Comunidad de Madrid"},"name":"Tetería Guama","related_places":{},"timezone":"Europe/Madrid"}

Para nuestro proyecto elegimos las siguientes categorías:

**Parks**: Por la convencienca de estar cerca de espacios abiertos para poder rodar

**Restaurants**: Por la convenciencia de estar cerca de sitios donde pueda comer las personas involucrads en un rodaje

**Shopping Malls**: Por la convenciencia de cubrir las necesidades logísticas

**Equipment Rental Services**: Por la conveniencia de alquilar vestuario

**Hotels**: Por la necesidad de alojar al equipo de trabajo de un rodaje


In [9]:
# IDs en foursquare  de las categorias "parks", "Restaurants", "Shopping Malls", "Equipment Rental Services", "Hotels"
categorias_foursquare = ["4bf58dd8d48988d163941735", "4d4b7105d754a06374d81259", "4bf58dd8d48988d1fd941735", "63be6904847c3692a84b9b3c", "4bf58dd8d48988d1fa931735	"]

# Aplicamos la función a cada municipio
df_servicios = obtener_servicios_municipios(df_coordenadas, categorias_foursquare)




  1%|          | 1/179 [00:02<06:29,  2.19s/it]

Error en la solicitud: 400


  1%|          | 2/179 [00:05<07:37,  2.59s/it]

Error en la solicitud: 400


  2%|▏         | 3/179 [00:07<08:02,  2.74s/it]

Error en la solicitud: 400


  2%|▏         | 4/179 [00:10<07:27,  2.55s/it]

Error en la solicitud: 400


  3%|▎         | 5/179 [00:12<07:35,  2.62s/it]

Error en la solicitud: 400


  3%|▎         | 6/179 [00:16<08:25,  2.92s/it]

Error en la solicitud: 400


  4%|▍         | 7/179 [00:18<07:55,  2.76s/it]

Error en la solicitud: 400


  4%|▍         | 8/179 [00:21<07:25,  2.61s/it]

Error en la solicitud: 400


  5%|▌         | 9/179 [00:23<07:16,  2.57s/it]

Error en la solicitud: 400


  6%|▌         | 10/179 [00:26<07:05,  2.52s/it]

Error en la solicitud: 400


  6%|▌         | 11/179 [00:28<06:45,  2.41s/it]

Error en la solicitud: 400


  7%|▋         | 12/179 [00:30<06:20,  2.28s/it]

Error en la solicitud: 400


  7%|▋         | 13/179 [00:32<06:35,  2.39s/it]

Error en la solicitud: 400


  8%|▊         | 14/179 [00:35<06:45,  2.46s/it]

Error en la solicitud: 400


  8%|▊         | 15/179 [00:37<06:42,  2.45s/it]

Error en la solicitud: 400


  9%|▉         | 16/179 [00:40<06:23,  2.35s/it]

Error en la solicitud: 400


  9%|▉         | 17/179 [00:42<06:14,  2.31s/it]

Error en la solicitud: 400


 10%|█         | 18/179 [00:45<06:47,  2.53s/it]

Error en la solicitud: 400


 11%|█         | 19/179 [00:47<06:12,  2.33s/it]

Error en la solicitud: 400


 11%|█         | 20/179 [00:49<06:04,  2.29s/it]

Error en la solicitud: 400


 12%|█▏        | 21/179 [00:51<05:59,  2.27s/it]

Error en la solicitud: 400


 12%|█▏        | 22/179 [00:55<06:51,  2.62s/it]

Error en la solicitud: 400


 13%|█▎        | 23/179 [00:56<06:17,  2.42s/it]

Error en la solicitud: 400


 13%|█▎        | 24/179 [00:59<05:59,  2.32s/it]

Error en la solicitud: 400


 14%|█▍        | 25/179 [01:01<06:05,  2.38s/it]

Error en la solicitud: 400


 15%|█▍        | 26/179 [01:04<06:37,  2.60s/it]

Error en la solicitud: 400


 15%|█▌        | 27/179 [01:07<06:31,  2.57s/it]

Error en la solicitud: 400


 16%|█▌        | 28/179 [01:08<05:37,  2.24s/it]

Error en la solicitud: 400


 16%|█▌        | 29/179 [01:10<05:36,  2.25s/it]

Error en la solicitud: 400


 17%|█▋        | 30/179 [01:13<05:41,  2.29s/it]

Error en la solicitud: 400


 17%|█▋        | 31/179 [01:15<05:27,  2.21s/it]

Error en la solicitud: 400


 18%|█▊        | 32/179 [01:17<05:33,  2.27s/it]

Error en la solicitud: 400


 18%|█▊        | 33/179 [01:20<05:32,  2.28s/it]

Error en la solicitud: 400


 19%|█▉        | 34/179 [01:21<05:10,  2.14s/it]

Error en la solicitud: 400


 20%|█▉        | 35/179 [01:24<05:12,  2.17s/it]

Error en la solicitud: 400


 20%|██        | 36/179 [01:27<05:49,  2.45s/it]

Error en la solicitud: 400


 21%|██        | 37/179 [01:30<06:38,  2.81s/it]

Error en la solicitud: 400


 21%|██        | 38/179 [01:33<06:20,  2.70s/it]

Error en la solicitud: 400


 22%|██▏       | 39/179 [01:35<05:55,  2.54s/it]

Error en la solicitud: 400


 22%|██▏       | 40/179 [01:38<06:24,  2.77s/it]

Error en la solicitud: 400


 23%|██▎       | 41/179 [01:41<06:21,  2.76s/it]

Error en la solicitud: 400


 23%|██▎       | 42/179 [01:43<06:06,  2.67s/it]

Error en la solicitud: 400


 24%|██▍       | 43/179 [01:47<06:19,  2.79s/it]

Error en la solicitud: 400


 25%|██▍       | 44/179 [01:49<05:58,  2.66s/it]

Error en la solicitud: 400


 25%|██▌       | 45/179 [01:51<05:42,  2.56s/it]

Error en la solicitud: 400


 26%|██▌       | 46/179 [01:54<06:03,  2.73s/it]

Error en la solicitud: 400


 26%|██▋       | 47/179 [01:57<05:56,  2.70s/it]

Error en la solicitud: 400


 27%|██▋       | 48/179 [01:59<05:45,  2.64s/it]

Error en la solicitud: 400


 27%|██▋       | 49/179 [02:02<05:25,  2.50s/it]

Error en la solicitud: 400


 28%|██▊       | 50/179 [02:04<05:03,  2.35s/it]

Error en la solicitud: 400


 28%|██▊       | 51/179 [02:07<05:25,  2.54s/it]

Error en la solicitud: 400


 29%|██▉       | 52/179 [02:09<04:58,  2.35s/it]

Error en la solicitud: 400


 30%|██▉       | 53/179 [02:11<04:49,  2.30s/it]

Error en la solicitud: 400


 30%|███       | 54/179 [02:13<04:48,  2.31s/it]

Error en la solicitud: 400


 31%|███       | 55/179 [02:15<04:49,  2.33s/it]

Error en la solicitud: 400


 31%|███▏      | 56/179 [02:18<04:44,  2.31s/it]

Error en la solicitud: 400


 32%|███▏      | 57/179 [02:21<05:19,  2.62s/it]

Error en la solicitud: 400


 32%|███▏      | 58/179 [02:24<05:34,  2.77s/it]

Error en la solicitud: 400


 33%|███▎      | 59/179 [02:27<05:40,  2.83s/it]

Error en la solicitud: 400


 34%|███▎      | 60/179 [02:30<05:28,  2.76s/it]

Error en la solicitud: 400


 34%|███▍      | 61/179 [02:32<05:13,  2.66s/it]

Error en la solicitud: 400


 35%|███▍      | 62/179 [02:34<04:45,  2.44s/it]

Error en la solicitud: 400


 35%|███▌      | 63/179 [02:37<04:42,  2.44s/it]

Error en la solicitud: 400


 36%|███▌      | 64/179 [02:39<04:45,  2.48s/it]

Error en la solicitud: 400


 36%|███▋      | 65/179 [02:42<05:06,  2.69s/it]

Error en la solicitud: 400


 37%|███▋      | 66/179 [02:45<04:57,  2.63s/it]

Error en la solicitud: 400


 37%|███▋      | 67/179 [02:47<04:40,  2.51s/it]

Error en la solicitud: 400


 38%|███▊      | 68/179 [02:50<04:46,  2.58s/it]

Error en la solicitud: 400


 39%|███▊      | 69/179 [02:52<04:27,  2.43s/it]

Error en la solicitud: 400


 39%|███▉      | 70/179 [02:53<03:57,  2.18s/it]

Error en la solicitud: 400


 40%|███▉      | 71/179 [02:57<04:40,  2.60s/it]

Error en la solicitud: 400


 40%|████      | 72/179 [02:59<04:24,  2.48s/it]

Error en la solicitud: 400


 41%|████      | 73/179 [03:02<04:21,  2.47s/it]

Error en la solicitud: 400


 41%|████▏     | 74/179 [03:04<04:25,  2.53s/it]

Error en la solicitud: 400


 42%|████▏     | 75/179 [03:07<04:18,  2.49s/it]

Error en la solicitud: 400


 42%|████▏     | 76/179 [03:09<04:11,  2.45s/it]

Error en la solicitud: 400


 43%|████▎     | 77/179 [03:11<04:04,  2.40s/it]

Error en la solicitud: 400


 44%|████▎     | 78/179 [03:14<03:58,  2.36s/it]

Error en la solicitud: 400


 44%|████▍     | 79/179 [03:17<04:16,  2.57s/it]

Error en la solicitud: 400


 45%|████▍     | 80/179 [03:19<04:19,  2.62s/it]

Error en la solicitud: 400


 45%|████▌     | 81/179 [03:22<04:10,  2.56s/it]

Error en la solicitud: 400


 46%|████▌     | 82/179 [03:24<03:57,  2.45s/it]

Error en la solicitud: 400


 46%|████▋     | 83/179 [03:27<04:03,  2.53s/it]

Error en la solicitud: 400


 47%|████▋     | 84/179 [03:29<03:46,  2.39s/it]

Error en la solicitud: 400


 47%|████▋     | 85/179 [03:31<03:46,  2.41s/it]

Error en la solicitud: 400


 48%|████▊     | 86/179 [03:34<04:00,  2.59s/it]

Error en la solicitud: 400


 49%|████▊     | 87/179 [03:37<03:54,  2.55s/it]

Error en la solicitud: 400


 49%|████▉     | 88/179 [03:39<03:50,  2.54s/it]

Error en la solicitud: 400


 50%|████▉     | 89/179 [03:42<03:43,  2.48s/it]

Error en la solicitud: 400


 50%|█████     | 90/179 [03:44<03:35,  2.43s/it]

Error en la solicitud: 400


 51%|█████     | 91/179 [03:46<03:36,  2.46s/it]

Error en la solicitud: 400


 51%|█████▏    | 92/179 [03:49<03:29,  2.40s/it]

Error en la solicitud: 400


 52%|█████▏    | 93/179 [03:51<03:23,  2.37s/it]

Error en la solicitud: 400


 53%|█████▎    | 94/179 [03:53<03:14,  2.29s/it]

Error en la solicitud: 400


 53%|█████▎    | 95/179 [03:55<03:05,  2.21s/it]

Error en la solicitud: 400


 54%|█████▎    | 96/179 [03:57<03:02,  2.20s/it]

Error en la solicitud: 400


 54%|█████▍    | 97/179 [04:00<03:06,  2.28s/it]

Error en la solicitud: 400


 55%|█████▍    | 98/179 [04:02<03:00,  2.23s/it]

Error en la solicitud: 400


 55%|█████▌    | 99/179 [04:04<03:00,  2.25s/it]

Error en la solicitud: 400


 56%|█████▌    | 100/179 [04:07<03:01,  2.30s/it]

Error en la solicitud: 400


 56%|█████▋    | 101/179 [04:09<03:12,  2.47s/it]

Error en la solicitud: 400


 57%|█████▋    | 102/179 [04:12<03:08,  2.45s/it]

Error en la solicitud: 400


 58%|█████▊    | 103/179 [04:14<02:55,  2.30s/it]

Error en la solicitud: 400


 58%|█████▊    | 104/179 [04:16<02:50,  2.27s/it]

Error en la solicitud: 400


 59%|█████▊    | 105/179 [04:18<02:36,  2.11s/it]

Error en la solicitud: 400


 59%|█████▉    | 106/179 [04:20<02:29,  2.05s/it]

Error en la solicitud: 400


 60%|█████▉    | 107/179 [04:22<02:34,  2.15s/it]

Error en la solicitud: 400


 60%|██████    | 108/179 [04:24<02:29,  2.10s/it]

Error en la solicitud: 400


 61%|██████    | 109/179 [04:26<02:32,  2.18s/it]

Error en la solicitud: 400


 61%|██████▏   | 110/179 [04:28<02:22,  2.06s/it]

Error en la solicitud: 400


 62%|██████▏   | 111/179 [04:31<02:26,  2.16s/it]

Error en la solicitud: 400


 63%|██████▎   | 112/179 [04:33<02:26,  2.19s/it]

Error en la solicitud: 400


 63%|██████▎   | 113/179 [04:35<02:21,  2.14s/it]

Error en la solicitud: 400


 64%|██████▎   | 114/179 [04:37<02:18,  2.13s/it]

Error en la solicitud: 400


 64%|██████▍   | 115/179 [04:39<02:16,  2.13s/it]

Error en la solicitud: 400


 65%|██████▍   | 116/179 [04:42<02:21,  2.24s/it]

Error en la solicitud: 400


 65%|██████▌   | 117/179 [04:44<02:22,  2.30s/it]

Error en la solicitud: 400


 66%|██████▌   | 118/179 [04:47<02:24,  2.36s/it]

Error en la solicitud: 400


 66%|██████▋   | 119/179 [04:49<02:22,  2.37s/it]

Error en la solicitud: 400


 67%|██████▋   | 120/179 [04:51<02:22,  2.41s/it]

Error en la solicitud: 400


 68%|██████▊   | 121/179 [04:54<02:15,  2.34s/it]

Error en la solicitud: 400


 68%|██████▊   | 122/179 [04:56<02:08,  2.26s/it]

Error en la solicitud: 400


 69%|██████▊   | 123/179 [04:58<01:59,  2.14s/it]

Error en la solicitud: 400


 69%|██████▉   | 124/179 [05:00<02:03,  2.25s/it]

Error en la solicitud: 400


 70%|██████▉   | 125/179 [05:03<02:11,  2.44s/it]

Error en la solicitud: 400


 70%|███████   | 126/179 [05:05<02:06,  2.38s/it]

Error en la solicitud: 400


 71%|███████   | 127/179 [05:08<02:05,  2.41s/it]

Error en la solicitud: 400


 72%|███████▏  | 128/179 [05:10<02:04,  2.44s/it]

Error en la solicitud: 400


 72%|███████▏  | 129/179 [05:12<01:59,  2.40s/it]

Error en la solicitud: 400


 73%|███████▎  | 130/179 [05:15<01:57,  2.41s/it]

Error en la solicitud: 400


 73%|███████▎  | 131/179 [05:17<01:57,  2.46s/it]

Error en la solicitud: 400


 74%|███████▎  | 132/179 [05:20<01:52,  2.40s/it]

Error en la solicitud: 400


 74%|███████▍  | 133/179 [05:22<01:51,  2.42s/it]

Error en la solicitud: 400


 75%|███████▍  | 134/179 [05:25<01:49,  2.42s/it]

Error en la solicitud: 400


 75%|███████▌  | 135/179 [05:27<01:41,  2.30s/it]

Error en la solicitud: 400


 76%|███████▌  | 136/179 [05:29<01:35,  2.23s/it]

Error en la solicitud: 400


 77%|███████▋  | 137/179 [05:31<01:32,  2.20s/it]

Error en la solicitud: 400


 77%|███████▋  | 138/179 [05:33<01:28,  2.16s/it]

Error en la solicitud: 400


 78%|███████▊  | 139/179 [05:36<01:32,  2.32s/it]

Error en la solicitud: 400


 78%|███████▊  | 140/179 [05:38<01:26,  2.21s/it]

Error en la solicitud: 400


 79%|███████▉  | 141/179 [05:40<01:24,  2.21s/it]

Error en la solicitud: 400


 79%|███████▉  | 142/179 [05:42<01:26,  2.33s/it]

Error en la solicitud: 400


 80%|███████▉  | 143/179 [05:45<01:24,  2.35s/it]

Error en la solicitud: 400


 80%|████████  | 144/179 [05:49<01:38,  2.81s/it]

Error en la solicitud: 400


 81%|████████  | 145/179 [05:51<01:33,  2.75s/it]

Error en la solicitud: 400


 82%|████████▏ | 146/179 [05:56<01:47,  3.27s/it]

Error en la solicitud: 400


 82%|████████▏ | 147/179 [05:58<01:36,  3.01s/it]

Error en la solicitud: 400


 83%|████████▎ | 148/179 [06:00<01:26,  2.78s/it]

Error en la solicitud: 400


 83%|████████▎ | 149/179 [06:02<01:17,  2.58s/it]

Error en la solicitud: 400


 84%|████████▍ | 150/179 [06:05<01:13,  2.53s/it]

Error en la solicitud: 400


 84%|████████▍ | 151/179 [06:08<01:12,  2.58s/it]

Error en la solicitud: 400


 85%|████████▍ | 152/179 [06:09<01:03,  2.37s/it]

Error en la solicitud: 400


 85%|████████▌ | 153/179 [06:12<01:04,  2.50s/it]

Error en la solicitud: 400


 86%|████████▌ | 154/179 [06:14<00:59,  2.38s/it]

Error en la solicitud: 400


 87%|████████▋ | 155/179 [06:16<00:53,  2.23s/it]

Error en la solicitud: 400


 87%|████████▋ | 156/179 [06:19<00:51,  2.24s/it]

Error en la solicitud: 400


 88%|████████▊ | 157/179 [06:21<00:49,  2.27s/it]

Error en la solicitud: 400


 88%|████████▊ | 158/179 [06:23<00:46,  2.20s/it]

Error en la solicitud: 400


 89%|████████▉ | 159/179 [06:25<00:44,  2.22s/it]

Error en la solicitud: 400


 89%|████████▉ | 160/179 [06:27<00:42,  2.22s/it]

Error en la solicitud: 400


 90%|████████▉ | 161/179 [06:29<00:39,  2.18s/it]

Error en la solicitud: 400


 91%|█████████ | 162/179 [06:32<00:36,  2.17s/it]

Error en la solicitud: 400


 91%|█████████ | 163/179 [06:35<00:41,  2.59s/it]

Error en la solicitud: 400


 92%|█████████▏| 164/179 [06:37<00:37,  2.49s/it]

Error en la solicitud: 400


 92%|█████████▏| 165/179 [06:45<00:57,  4.13s/it]

Error en la solicitud: 400


 93%|█████████▎| 166/179 [06:48<00:46,  3.61s/it]

Error en la solicitud: 400


 93%|█████████▎| 167/179 [06:50<00:38,  3.19s/it]

Error en la solicitud: 400


 94%|█████████▍| 168/179 [06:53<00:33,  3.08s/it]

Error en la solicitud: 400


 94%|█████████▍| 169/179 [06:55<00:28,  2.85s/it]

Error en la solicitud: 400


 95%|█████████▍| 170/179 [06:57<00:23,  2.63s/it]

Error en la solicitud: 400


 96%|█████████▌| 171/179 [06:59<00:20,  2.50s/it]

Error en la solicitud: 400


 96%|█████████▌| 172/179 [07:02<00:16,  2.40s/it]

Error en la solicitud: 400


 97%|█████████▋| 173/179 [07:04<00:14,  2.48s/it]

Error en la solicitud: 400


 97%|█████████▋| 174/179 [07:06<00:11,  2.38s/it]

Error en la solicitud: 400


 98%|█████████▊| 175/179 [07:11<00:11,  2.88s/it]

Error en la solicitud: 400


 98%|█████████▊| 176/179 [07:13<00:08,  2.70s/it]

Error en la solicitud: 400


 99%|█████████▉| 177/179 [07:15<00:05,  2.61s/it]

Error en la solicitud: 400


 99%|█████████▉| 178/179 [07:17<00:02,  2.48s/it]

Error en la solicitud: 400


100%|██████████| 179/179 [07:21<00:00,  2.47s/it]

Error en la solicitud: 400





In [10]:
df_servicios

Unnamed: 0,municipio,nombre_lugar,categoria,direccion,latitud,longitud
0,acebeda-la,La Posada de los Vientos,Spanish Restaurant,"Calle Encerradero, 2",41.087080,-3.623995
1,acebeda-la,El Acebo,Restaurant,"Calle Puerto, 2",41.086306,-3.623243
2,acebeda-la,Hostal Castillo de Somosierra,Restaurant,"Carretera Nal 1, Km 81",41.045341,-3.616328
3,ajalvir,Diverjungla,Playground,"Calle Segovia, 20",40.529921,-3.484341
4,ajalvir,Parque Infantil,Park,,40.543867,-3.464773
...,...,...,...,...,...,...
2601,zarzalejo,Asador Cruz Verde,Restaurant,"Carretera Madrid-Ávila, Km 36",40.541742,-4.167070
2602,zarzalejo,El Roble,Restaurant,"Plaza del Llano del Soldado, 9",40.539899,-4.163608
2603,zarzalejo,Hotel Duque,Restaurant,"Avenida de la Estacion, 65",40.539545,-4.163218
2604,zarzalejo,Bar los Alamos,Bar,"Avenida Estación, 37",40.539738,-4.159139


In [11]:
df_servicios.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2606 entries, 0 to 2605
Data columns (total 6 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   municipio     2606 non-null   object 
 1   nombre_lugar  2606 non-null   object 
 2   categoria     2606 non-null   object 
 3   direccion     2606 non-null   object 
 4   latitud       2606 non-null   float64
 5   longitud      2606 non-null   float64
dtypes: float64(2), object(4)
memory usage: 122.3+ KB


No hay nulos y todas las columnas son relevantes para nuestro anális.

Exploremos si hay duplicados

In [12]:
df_servicios.duplicated().value_counts()

False    2604
True        2
Name: count, dtype: int64

In [13]:
#Eliminamos duplicados
df_servicios=df_servicios.drop_duplicates()

In [14]:
df_servicios

Unnamed: 0,municipio,nombre_lugar,categoria,direccion,latitud,longitud
0,acebeda-la,La Posada de los Vientos,Spanish Restaurant,"Calle Encerradero, 2",41.087080,-3.623995
1,acebeda-la,El Acebo,Restaurant,"Calle Puerto, 2",41.086306,-3.623243
2,acebeda-la,Hostal Castillo de Somosierra,Restaurant,"Carretera Nal 1, Km 81",41.045341,-3.616328
3,ajalvir,Diverjungla,Playground,"Calle Segovia, 20",40.529921,-3.484341
4,ajalvir,Parque Infantil,Park,,40.543867,-3.464773
...,...,...,...,...,...,...
2601,zarzalejo,Asador Cruz Verde,Restaurant,"Carretera Madrid-Ávila, Km 36",40.541742,-4.167070
2602,zarzalejo,El Roble,Restaurant,"Plaza del Llano del Soldado, 9",40.539899,-4.163608
2603,zarzalejo,Hotel Duque,Restaurant,"Avenida de la Estacion, 65",40.539545,-4.163218
2604,zarzalejo,Bar los Alamos,Bar,"Avenida Estación, 37",40.539738,-4.159139


In [15]:
df_servicios["categoria"].value_counts()

categoria
Park                     411
Restaurant               361
Shopping Mall            265
Bar                      248
Playground               189
                        ... 
Indian Restaurant          1
Advertising Agency         1
Venezuelan Restaurant      1
Theater                    1
Portuguese Restaurant      1
Name: count, Length: 82, dtype: int64

Vemnos que hay más categorás que las que buscabamos en el DataFrame. Esto es porque los ID que pasamos en la fucnción se corresponden a más de una categoría. Aún así, son casi todoas las categorías qeu paarecen muy similares a la princpal y nos valen, a excepción de dos "Advertising Agency" "Theater", ambas con una ocurrencia. Procedemos a eliminar las final de ambas

In [16]:
df_servicios= df_servicios[~df_servicios['categoria'].isin(['Advertising Agency', 'Theater'])]
df_servicios

Unnamed: 0,municipio,nombre_lugar,categoria,direccion,latitud,longitud
0,acebeda-la,La Posada de los Vientos,Spanish Restaurant,"Calle Encerradero, 2",41.087080,-3.623995
1,acebeda-la,El Acebo,Restaurant,"Calle Puerto, 2",41.086306,-3.623243
2,acebeda-la,Hostal Castillo de Somosierra,Restaurant,"Carretera Nal 1, Km 81",41.045341,-3.616328
3,ajalvir,Diverjungla,Playground,"Calle Segovia, 20",40.529921,-3.484341
4,ajalvir,Parque Infantil,Park,,40.543867,-3.464773
...,...,...,...,...,...,...
2601,zarzalejo,Asador Cruz Verde,Restaurant,"Carretera Madrid-Ávila, Km 36",40.541742,-4.167070
2602,zarzalejo,El Roble,Restaurant,"Plaza del Llano del Soldado, 9",40.539899,-4.163608
2603,zarzalejo,Hotel Duque,Restaurant,"Avenida de la Estacion, 65",40.539545,-4.163218
2604,zarzalejo,Bar los Alamos,Bar,"Avenida Estación, 37",40.539738,-4.159139


In [17]:
#Guardamos el archivo en un csv.
df_servicios.to_csv("servicios_municipios.csv", index =None)

In [18]:
# lo cargamos como dataframe
df_servicios=pd.read_csv("servicios_municipios.csv")
df_servicios



Unnamed: 0,municipio,nombre_lugar,categoria,direccion,latitud,longitud
0,acebeda-la,La Posada de los Vientos,Spanish Restaurant,"Calle Encerradero, 2",41.087080,-3.623995
1,acebeda-la,El Acebo,Restaurant,"Calle Puerto, 2",41.086306,-3.623243
2,acebeda-la,Hostal Castillo de Somosierra,Restaurant,"Carretera Nal 1, Km 81",41.045341,-3.616328
3,ajalvir,Diverjungla,Playground,"Calle Segovia, 20",40.529921,-3.484341
4,ajalvir,Parque Infantil,Park,,40.543867,-3.464773
...,...,...,...,...,...,...
2597,zarzalejo,Asador Cruz Verde,Restaurant,"Carretera Madrid-Ávila, Km 36",40.541742,-4.167070
2598,zarzalejo,El Roble,Restaurant,"Plaza del Llano del Soldado, 9",40.539899,-4.163608
2599,zarzalejo,Hotel Duque,Restaurant,"Avenida de la Estacion, 65",40.539545,-4.163218
2600,zarzalejo,Bar los Alamos,Bar,"Avenida Estación, 37",40.539738,-4.159139
