<div style="text-align: center;">
  <img src="https://github.com/Hack-io-Data/Imagenes/blob/main/01-LogosHackio/logo_naranja@4x.png?raw=true" alt="esquema" />
</div>

# Laboratorio API's 

SetMagic Productions es una empresa especializada en la provisión de servicios integrales para la realización de rodajes cinematográficos y audiovisuales. Nos dedicamos a facilitar tanto el atrezzo necesario para las producciones como los lugares idóneos para llevar a cabo los rodajes, ya sea en entornos al aire libre o en interiores.

**Servicios Ofrecidos:**

- **Atrezzo Creativo:** Contamos con un extenso catálogo de atrezzo que abarca desde accesorios hasta muebles y objetos temáticos para ambientar cualquier tipo de  escena.

- **Locaciones Únicas:** Nuestra empresa ofrece una amplia selección de locaciones, que incluyen desde escenarios naturales como playas, bosques y montañas, hasta espacios interiores como estudios, casas históricas y edificios emblemáticos.

- **Servicios de Producción:** Además de proporcionar atrezzo y locaciones, también ofrecemos servicios de producción audiovisual, incluyendo equipos de filmación, personal técnico y servicios de postproducción.

**Herramientas y Tecnologías:**

Para recopilar información sobre nuevas locaciones y tendencias en atrezzo, utilizamos herramientas de web scraping como Beautiful Soup y Selenium para extraer datos de sitios web relevantes y redes sociales especializadas en cine y producción audiovisual. También integramos APIs de plataformas de alquiler de locaciones y bases de datos de atrezzo para acceder a información actualizada y detallada.

**Almacenamiento de Datos:**

La información recopilada mediante web scraping y APIs se almacena en una base de datos no relacional MongoDB. Esta base de datos nos permite organizar eficientemente la información sobre locaciones, atrezzo, clientes y proyectos en curso, facilitando su acceso y gestión.

**Objetivo:**

Nuestro objetivo principal es proporcionar a nuestros clientes una experiencia fluida y personalizada en la búsqueda y selección de locaciones y atrezzo para sus proyectos audiovisuales. Utilizando tecnologías avanzadas y una amplia red de contactos en la industria, nos esforzamos por ofrecer soluciones creativas y de alta calidad que satisfagan las necesidades específicas de cada producción.


# Lab: APIs y Obtención de Datos de Localizaciones para Rodajes

En este laboratorio aprenderás a utilizar APIs para obtener información sobre localizaciones de rodaje en la Comunidad de Madrid. A lo largo de este ejercicio, implementarás funciones que te permitirán extraer coordenadas, buscar lugares de interés y almacenar la información en un formato que puedas reutilizar.

## Objetivo

Obtener información geográfica y sobre posibles localizaciones para rodajes en diferentes municipios de la Comunidad de Madrid, utilizando APIs como **Geopy** y **Foursquare**.

---

## Importar librerías

---

In [2]:
import numpy as np
import pandas as pd
from tqdm import tqdm
from geopy.geocoders import Nominatim

import os
import dotenv

# Devuelve True si hay un .env con información
dotenv.load_dotenv()

pd.set_option('display.max_columns', None) # para poder visualizar todas las columnas de los DataFrames

import warnings
warnings.filterwarnings('ignore')

import requests

import time
import random

In [3]:
api_key = os.getenv('token')

### Paso 1: Obtener Coordenadas de los Municipios

---

Primero, necesitas obtener las coordenadas geográficas (latitud y longitud) de cada municipio en la Comunidad de Madrid. Para esto, utilizarás la biblioteca **Geopy** y su funcionalidad para geocodificar. La lista de los municipios de la Comunidad de Madrid es:

## ¡IMPORTANTE! 

Ejecutar este código del paso 1 SOLO si no tenemos el DataFrame. En caso contrario podemos ir al paso 2 y cargarlo

In [4]:
lista_municipios = ['acebeda-la', 'ajalvir', 'alameda-del-valle', 'alamo-el', 'alcala-de-henares', 'alcobendas', 'alcorcon', 'aldea-del-fresno', 'algete', 'alpedrete', 'ambite', 'anchuelo', 'aranjuez', 'arganda-del-rey', 'arroyomolinos', 'atazar-el', 'batres', 'becerril-de-la-sierra', 'belmonte-de-tajo', 'berrueco-el', 'berzosa-del-lozoya', 'boadilla-del-monte', 'boalo-el', 'braojos', 'brea-de-tajo', 'brunete', 'buitrago-del-lozoya', 'bustarviejo', 'cabanillas-de-la-sierra', 'cabrera-la', 'cadalso-de-los-vidrios', 'camarma-de-esteruelas', 'campo-real', 'canencia', 'carabana', 'casarrubuelos', 'cenicientos', 'cercedilla', 'cervera-de-buitrago', 'chapineria', 'chinchon', 'ciempozuelos', 'cobena', 'collado-mediano', 'collado-villalba', 'colmenar-del-arroyo', 'colmenar-de-oreja', 'colmenarejo', 'colmenar-viejo', 'corpa', 'coslada', 'cubas-de-la-sagra', 'daganzo-de-arriba', 'escorial-el', 'estremera', 'fresnedillas-de-la-oliva', 'fresno-de-torote', 'fuenlabrada', 'fuente-el-saz-de-jarama', 'fuentiduena-de-tajo', 'galapagar', 'garganta-de-los-montes', 'gargantilla-del-lozoya-y-pinilla-de-buitrago', 'gascones', 'getafe', 'grinon', 'guadalix-de-la-sierra', 'guadarrama', 'hiruela-la', 'horcajo-de-la-sierra-aoslos', 'horcajuelo-de-la-sierra', 'hoyo-de-manzanares', 'humanes-de-madrid', 'leganes', 'loeches', 'lozoya', 'lozoyuela-navas-sieteiglesias', 'madarcos', 'madrid', 'majadahonda', 'manzanares-el-real', 'meco', 'mejorada-del-campo', 'miraflores-de-la-sierra', 'molar-el', 'molinos-los', 'montejo-de-la-sierra', 'moraleja-de-enmedio', 'moralzarzal', 'morata-de-tajuna', 'mostoles', 'navacerrada', 'navalafuente', 'navalagamella', 'navalcarnero', 'navarredonda-y-san-mames', 'navas-del-rey', 'nuevo-baztan', 'olmeda-de-las-fuentes', 'orusco-de-tajuna', 'paracuellos-de-jarama', 'parla', 'patones', 'pedrezuela', 'pelayos-de-la-presa', 'perales-de-tajuna', 'pezuela-de-las-torres', 'pinilla-del-valle', 'pinto', 'pinuecar-gandullas', 'pozuelo-de-alarcon', 'pozuelo-del-rey', 'pradena-del-rincon', 'puebla-de-la-sierra', 'puentes-viejas-manjiron', 'quijorna', 'rascafria', 'reduena', 'ribatejada', 'rivas-vaciamadrid', 'robledillo-de-la-jara', 'robledo-de-chavela', 'robregordo', 'rozas-de-madrid-las', 'rozas-de-puerto-real', 'san-agustin-del-guadalix', 'san-fernando-de-henares', 'san-lorenzo-de-el-escorial', 'san-martin-de-la-vega', 'san-martin-de-valdeiglesias', 'san-sebastian-de-los-reyes', 'santa-maria-de-la-alameda', 'santorcaz', 'santos-de-la-humosa-los', 'serna-del-monte-la', 'serranillos-del-valle', 'sevilla-la-nueva', 'somosierra', 'soto-del-real', 'talamanca-de-jarama', 'tielmes', 'titulcia', 'torrejon-de-ardoz', 'torrejon-de-la-calzada', 'torrejon-de-velasco', 'torrelaguna', 'torrelodones', 'torremocha-de-jarama', 'torres-de-la-alameda', 'tres-cantos', 'valdaracete', 'valdeavero', 'valdelaguna', 'valdemanco', 'valdemaqueda', 'valdemorillo', 'valdemoro', 'valdeolmos-alalpardo', 'valdepielagos', 'valdetorres-de-jarama', 'valdilecha', 'valverde-de-alcala', 'velilla-de-san-antonio', 'vellon-el', 'venturada', 'villaconejos', 'villa-del-prado', 'villalbilla', 'villamanrique-de-tajo', 'villamanta', 'villamantilla', 'villanueva-de-la-canada', 'villanueva-del-pardillo', 'villanueva-de-perales', 'villar-del-olmo', 'villarejo-de-salvanes', 'villaviciosa-de-odon', 'villavieja-del-lozoya', 'zarzalejo']

In [5]:
geolocator = Nominatim(user_agent="my_app")

T-Mobile, 175, 5th Avenue, Manhattan Community Board 5, Manhattan, New York County, City of New York, New York, 10010, United States
(40.7412079, -73.9895713)
{'place_id': 15468830, 'licence': 'Data © OpenStreetMap contributors, ODbL 1.0. http://osm.org/copyright', 'osm_type': 'node', 'osm_id': 10177726834, 'lat': '40.7412079', 'lon': '-73.9895713', 'class': 'shop', 'type': 'mobile_phone', 'place_rank': 30, 'importance': 9.175936522464359e-05, 'addresstype': 'shop', 'name': 'T-Mobile', 'display_name': 'T-Mobile, 175, 5th Avenue, Manhattan Community Board 5, Manhattan, New York County, City of New York, New York, 10010, United States', 'boundingbox': ['40.7411579', '40.7412579', '-73.9896213', '-73.9895213']}


In [13]:
locations = []

for municipio in tqdm(lista_municipios):

    location = geolocator.geocode(municipio)
    dc = {}
    dc['Nombre'] = municipio
    dc['Direccion'] = location.address
    dc['Latitud'] = location.latitude
    dc['Longitud'] = location.longitude

    locations.append(dc)

100%|██████████| 179/179 [01:35<00:00,  1.88it/s]


In [25]:
ok = True

for i in range(len(locations)):

    lat = locations[i]['Latitud']
    long = locations[i]['Longitud']
    if lat > 90 or lat < -90:
        ok = False
        print(f'Error en {lista_municipios[i]}')

    elif long > 180 or long < -180:
        ok = False
        print(f'Error en {lista_municipios[i]}')

if ok:
    print('Todas las coordenadas concuerdan')

Todas las coordenadas concuerdan


In [206]:
df_locations = pd.DataFrame(locations)

df_locations.head(120)

Unnamed: 0,Nombre,Direccion,Latitud,Longitud
0,acebeda-la,"La Acebeda, Comunidad de Madrid, España",41.086958,-3.624399
1,ajalvir,"Ajalvir, Comunidad de Madrid, 28864, España",40.534230,-3.480782
2,alameda-del-valle,"Alameda del Valle, Comunidad de Madrid, España",40.917718,-3.843822
3,alamo-el,"El Álamo, Comunidad de Madrid, 28607, España",40.230730,-3.990589
4,alcala-de-henares,"Alcalá de Henares, Comunidad de Madrid, España",40.481840,-3.364497
...,...,...,...,...
115,quijorna,"Quijorna, Comunidad de Madrid, 28693, España",40.429083,-4.056538
116,rascafria,"Rascafría, Comunidad de Madrid, España",40.903887,-3.880285
117,reduena,"Redueña, Comunidad de Madrid, 28721, España",40.815805,-3.603931
118,ribatejada,"Ribatejada, Comunidad de Madrid, 28815, España",40.666495,-3.391918


In [33]:
df_locations.to_csv('datos/locations.csv')

---

### Paso 2: Buscar Localizaciones Relevantes con la API de Foursquare

Una vez obtenidas las coordenadas de los municipios, utilizarás la API de Foursquare para buscar servicios que pueden ser importantes en un rodaje (ej: parques, edificios históricos, plazas).

En este punto es importante que reflexiones sobre los servicios o establecimientos clave que considerarías relevantes para establecer una empresa de servicios para rodajes. No hay una única respuesta correcta, ya que depende de la estrategia y visión que tengas. Al menos deberás elegir 5 tipos de servicios que puedan influir en la decisión de ubicación. Ejemplos de estos servicios pueden incluir:

- Parques o áreas verdes para rodajes exteriores.

- Centros comerciales que faciliten acceso a diferentes necesidades logísticas.

- Bares o restaurantes para el catering del equipo.

- Tiendas especializadas en disfraces o vestuario.

- Alquileres de equipos audiovisuales.

Es crucial entender que esta selección depende de la naturaleza y enfoque de la empresa. Tal vez para algunos proyectos sea más importante estar cerca de áreas residenciales o lugares con buena conexión de transporte. Otros proyectos podrían priorizar la proximidad a tiendas especializadas o servicios de entretenimiento. Es vuestra decisión! 

1. Crear una cuenta en [Foursquare](https://location.foursquare.com/developer/) y obtener la API Key necesaria para realizar las solicitudes. Leer la documentación para entender como funciona. 

2. Definir una función para realizar búsquedas de lugares cercanos a las coordenadas de cada municipio. Esta función debe permitir filtrar los resultados por categoría y distancia.

3. Explorar las categorías disponibles en Foursquare y seleccionar aquellas que se ajusten a los servicios clave que decidáis para vuestra estrategia.

4. Aplicar la función de búsqueda a cada municipio, recopilando información sobre los lugares relevantes.

Recuerda que la elección de categorías es un punto de análisis clave en este ejercicio, ya que la información que obtendréis será fundamental para decidir la ubicación ideal para vuestra empresa. Aseguraos de justificar vuestras decisiones y considerar diferentes perspectivas. Para cada una de los municipios deberás sacar la información de todos los servicios elegidos. 

---

In [5]:
# Cargar dataframe

df_locations = pd.read_csv(('datos/locations.csv'))

In [7]:
df_locations.head()

Unnamed: 0.1,Unnamed: 0,Nombre,Direccion,Latitud,Longitud
0,0,acebeda-la,"La Acebeda, Comunidad de Madrid, España",41.086958,-3.624399
1,1,ajalvir,"Ajalvir, Comunidad de Madrid, 28864, España",40.53423,-3.480782
2,2,alameda-del-valle,"Alameda del Valle, Comunidad de Madrid, España",40.917718,-3.843822
3,3,alamo-el,"El Álamo, Comunidad de Madrid, 28607, España",40.23073,-3.990589
4,4,alcala-de-henares,"Alcalá de Henares, Comunidad de Madrid, España",40.48184,-3.364497


Buscar lugares cercanos por coordenadas y radio para cuando obtengamos los kartings busquemos:

+ Restaurantes
+ Parking
+ Centro comercial
+ Almacenes

In [8]:
def buscar_lugares_cercanos(coordenadas, categoria=None, query=None, distancia=1000):

    url = "https://api.foursquare.com/v3/places/search"
    
    headers = {
        "accept": "application/json",
        "Authorization": api_key
    }
    
    # Parámetros: latitud, longitud y radio (en metros)
    params = {
        "ll": f"{coordenadas[0]},{coordenadas[1]}",
        "radius": distancia
    }
    
    # Agregar la categoría si está definida
    if categoria:
        params["categories"] = categoria

    elif query:
        params["query"] = query
    
    # Realizar la solicitud a Foursquare
    response = requests.get(url, headers=headers, params=params)

    # Si el código de estado es 200
    if response.status_code == 200:
        # Devolvemos la respuesta en json
        return response.json()
    
    else:
        print(f'Error {response.status_code}')

Necesitamos estar cerca de un circuito de Karts ya que estamos especializados en rodajes para motorsport. Es importante tener parking disponible cerca para dejar los vehículos de desplazamiento del equipo y tener bares o restaurantes cerca. A nuestro equipo no le gusta el 100 Montaditos ni el McDonald's por lo que debemos excluirlo de nuestra búsqueda.

Búsqueda de karting

In [9]:
# Almacenamos las coordenadas en un array
coordenadas = df_locations[['Latitud', 'Longitud']].values

In [37]:
resultados_karting = []

for i in range(df_locations.shape[0]):

    # Tiempo de espera aleatorio entre llamadas
    time.sleep(random.uniform(0.5, 1.5))  # más eficiente que randint para tiempos aleatorios en este rango

    # Hacemos la llamada a la API
    res = buscar_lugares_cercanos(coordenadas[i], categoria=None, query="karting", distancia=3000)

    # Si hay resultados, los procesamos
    for lugar in res.get('results', []):
        if lugar not in resultados_karting:  # Añadimos si no está en la lista
            resultados_karting.append(lugar)


In [136]:
df_karting = pd.DataFrame(resultados_karting)

In [42]:
df_karting.to_csv('datos/karting.csv')

### Paso 3: Limpieza de la Información

La información obtenida de Foursquare puede incluir muchos detalles innecesarios. Tu objetivo es quedarte únicamente con los campos relevantes para tu análisis (nombre, dirección, coordenadas, tipo de lugar, etc.).


1. Explorar la estructura de los datos obtenidos para identificar los campos importantes y limpiar la información.

2. Eliminar duplicados y valores nulos para garantizar la consistencia y calidad de los datos.

In [137]:
# Quitamos las columnas innecesarias
df_karting.drop(columns=['fsq_id', 'categories', 'chains', 'closed_bucket', 'link', 'related_places', 'timezone'], inplace=True)

In [138]:
# Como están ordenados por distancia nos quedamos con el primero
df_karting.drop_duplicates(['name'], keep='first', inplace=True)

In [140]:
df_karting['coordenadas'] = df_karting['geocodes'].apply(lambda x: x['main'])

In [141]:
df_karting.drop(columns='geocodes', inplace=True)

In [142]:
def sacar_valor(dc):

    try:
        return dc.get('formatted_address')
    
    except:
        return np.nan

In [144]:
# Descomprimir
df_locs_karting = df_karting['location'].apply(sacar_valor)

In [145]:
df_karting['direccion'] = df_locs_karting

In [146]:
df_coord_karting = df_karting['coordenadas'].apply(sacar_valor)

In [147]:
df_karting['latitud'] = df_karting['coordenadas'].apply(lambda x: x.get('latitude'))
df_karting['longitud'] = df_karting['coordenadas'].apply(lambda x: x.get('longitude'))

In [148]:
df_karting.drop(columns=['location', 'coordenadas'], inplace=True)

In [150]:
df_karting

Unnamed: 0,distance,name,direccion,latitud,longitud
0,133,Karting Asupark,"Carretera M-501, Km 6, Boadilla del Monte Comu...",40.391774,-3.903343
2,2766,Karting Angel Burgueño,"Carretera Burgos, Km 45,8, 28723 Pedrezuela Ma...",40.756348,-3.600688
4,793,KartingRivas,"Calle de la Fundición, 89 (La Tuerca), 28522 R...",40.34727,-3.53541
5,801,Karting Rivas,"Calle la Tuerca, 6 Bajo, 28522 Rivas-Vaciamadr...",40.347078,-3.535109
6,1690,Diver Karting,"Calle V, s/n, 28230 Las Rozas de Madrid Madrid",40.500581,-3.893405
7,1767,Karting y Paintball Madrid,"Calle Bruselas, 3, 28232 Madrid Madrid",40.500739,-3.894336
9,3810,Karting Club los Santos,"Canal de Isabel II, Km 1, 28817 Los Santos de ...",40.494251,-3.250199
11,1937,Karting Soto,"Carretera Miraflores, Km 40,4, 28791 Soto del ...",40.736011,-3.786822
12,2861,Karting Club Soto,"Carretera Colmenar Viejo, 0, 28791 Soto del Re...",40.74116,-3.756782




### Paso 4: Almacenamiento de los Datos

Una vez que tengas la información limpia y organizada, almacénala en un archivo CSV que puedas reutilizar en futuros análisis.

In [151]:
df_karting.to_csv('datos/karting_limpio.csv')