<div style="text-align: center;">
  <img src="https://github.com/Hack-io-Data/Imagenes/blob/main/01-LogosHackio/logo_naranja@4x.png?raw=true" alt="esquema" />
</div>

# Laboratorio API's 

SetMagic Productions es una empresa especializada en la provisión de servicios integrales para la realización de rodajes cinematográficos y audiovisuales. Nos dedicamos a facilitar tanto el atrezzo necesario para las producciones como los lugares idóneos para llevar a cabo los rodajes, ya sea en entornos al aire libre o en interiores.

**Servicios Ofrecidos:**

- **Atrezzo Creativo:** Contamos con un extenso catálogo de atrezzo que abarca desde accesorios hasta muebles y objetos temáticos para ambientar cualquier tipo de  escena.

- **Locaciones Únicas:** Nuestra empresa ofrece una amplia selección de locaciones, que incluyen desde escenarios naturales como playas, bosques y montañas, hasta espacios interiores como estudios, casas históricas y edificios emblemáticos.

- **Servicios de Producción:** Además de proporcionar atrezzo y locaciones, también ofrecemos servicios de producción audiovisual, incluyendo equipos de filmación, personal técnico y servicios de postproducción.

**Herramientas y Tecnologías:**

Para recopilar información sobre nuevas locaciones y tendencias en atrezzo, utilizamos herramientas de web scraping como Beautiful Soup y Selenium para extraer datos de sitios web relevantes y redes sociales especializadas en cine y producción audiovisual. También integramos APIs de plataformas de alquiler de locaciones y bases de datos de atrezzo para acceder a información actualizada y detallada.

**Almacenamiento de Datos:**

La información recopilada mediante web scraping y APIs se almacena en una base de datos no relacional MongoDB. Esta base de datos nos permite organizar eficientemente la información sobre locaciones, atrezzo, clientes y proyectos en curso, facilitando su acceso y gestión.

**Objetivo:**

Nuestro objetivo principal es proporcionar a nuestros clientes una experiencia fluida y personalizada en la búsqueda y selección de locaciones y atrezzo para sus proyectos audiovisuales. Utilizando tecnologías avanzadas y una amplia red de contactos en la industria, nos esforzamos por ofrecer soluciones creativas y de alta calidad que satisfagan las necesidades específicas de cada producción.


# Lab: APIs y Obtención de Datos de Localizaciones para Rodajes

En este laboratorio aprenderás a utilizar APIs para obtener información sobre localizaciones de rodaje en la Comunidad de Madrid. A lo largo de este ejercicio, implementarás funciones que te permitirán extraer coordenadas, buscar lugares de interés y almacenar la información en un formato que puedas reutilizar.

## Objetivo

Obtener información geográfica y sobre posibles localizaciones para rodajes en diferentes municipios de la Comunidad de Madrid, utilizando APIs como **Geopy** y **Foursquare**.

### Paso 1: Obtener Coordenadas de los Municipios

Primero, necesitas obtener las coordenadas geográficas (latitud y longitud) de cada municipio en la Comunidad de Madrid. Para esto, utilizarás la biblioteca **Geopy** y su funcionalidad para geocodificar. La lista de los municipios de la Comunidad de Madrid es:

```python
lista_municipios = ['acebeda-la', 'ajalvir', 'alameda-del-valle', 'alamo-el', 'alcala-de-henares', 'alcobendas', 'alcorcon', 'aldea-del-fresno', 'algete', 'alpedrete', 'ambite', 'anchuelo', 'aranjuez', 'arganda-del-rey', 'arroyomolinos', 'atazar-el', 'batres', 'becerril-de-la-sierra', 'belmonte-de-tajo', 'berrueco-el', 'berzosa-del-lozoya', 'boadilla-del-monte', 'boalo-el', 'braojos', 'brea-de-tajo', 'brunete', 'buitrago-del-lozoya', 'bustarviejo', 'cabanillas-de-la-sierra', 'cabrera-la', 'cadalso-de-los-vidrios', 'camarma-de-esteruelas', 'campo-real', 'canencia', 'carabana', 'casarrubuelos', 'cenicientos', 'cercedilla', 'cervera-de-buitrago', 'chapineria', 'chinchon', 'ciempozuelos', 'cobena', 'collado-mediano', 'collado-villalba', 'colmenar-del-arroyo', 'colmenar-de-oreja', 'colmenarejo', 'colmenar-viejo', 'corpa', 'coslada', 'cubas-de-la-sagra', 'daganzo-de-arriba', 'escorial-el', 'estremera', 'fresnedillas-de-la-oliva', 'fresno-de-torote', 'fuenlabrada', 'fuente-el-saz-de-jarama', 'fuentiduena-de-tajo', 'galapagar', 'garganta-de-los-montes', 'gargantilla-del-lozoya-y-pinilla-de-buitrago', 'gascones', 'getafe', 'grinon', 'guadalix-de-la-sierra', 'guadarrama', 'hiruela-la', 'horcajo-de-la-sierra-aoslos', 'horcajuelo-de-la-sierra', 'hoyo-de-manzanares', 'humanes-de-madrid', 'leganes', 'loeches', 'lozoya', 'lozoyuela-navas-sieteiglesias', 'madarcos', 'madrid', 'majadahonda', 'manzanares-el-real', 'meco', 'mejorada-del-campo', 'miraflores-de-la-sierra', 'molar-el', 'molinos-los', 'montejo-de-la-sierra', 'moraleja-de-enmedio', 'moralzarzal', 'morata-de-tajuna', 'mostoles', 'navacerrada', 'navalafuente', 'navalagamella', 'navalcarnero', 'navarredonda-y-san-mames', 'navas-del-rey', 'nuevo-baztan', 'olmeda-de-las-fuentes', 'orusco-de-tajuna', 'paracuellos-de-jarama', 'parla', 'patones', 'pedrezuela', 'pelayos-de-la-presa', 'perales-de-tajuna', 'pezuela-de-las-torres', 'pinilla-del-valle', 'pinto', 'pinuecar-gandullas', 'pozuelo-de-alarcon', 'pozuelo-del-rey', 'pradena-del-rincon', 'puebla-de-la-sierra', 'puentes-viejas-manjiron', 'quijorna', 'rascafria', 'reduena', 'ribatejada', 'rivas-vaciamadrid', 'robledillo-de-la-jara', 'robledo-de-chavela', 'robregordo', 'rozas-de-madrid-las', 'rozas-de-puerto-real', 'san-agustin-del-guadalix', 'san-fernando-de-henares', 'san-lorenzo-de-el-escorial', 'san-martin-de-la-vega', 'san-martin-de-valdeiglesias', 'san-sebastian-de-los-reyes', 'santa-maria-de-la-alameda', 'santorcaz', 'santos-de-la-humosa-los', 'serna-del-monte-la', 'serranillos-del-valle', 'sevilla-la-nueva', 'somosierra', 'soto-del-real', 'talamanca-de-jarama', 'tielmes', 'titulcia', 'torrejon-de-ardoz', 'torrejon-de-la-calzada', 'torrejon-de-velasco', 'torrelaguna', 'torrelodones', 'torremocha-de-jarama', 'torres-de-la-alameda', 'tres-cantos', 'valdaracete', 'valdeavero', 'valdelaguna', 'valdemanco', 'valdemaqueda', 'valdemorillo', 'valdemoro', 'valdeolmos-alalpardo', 'valdepielagos', 'valdetorres-de-jarama', 'valdilecha', 'valverde-de-alcala', 'velilla-de-san-antonio', 'vellon-el', 'venturada', 'villaconejos', 'villa-del-prado', 'villalbilla', 'villamanrique-de-tajo', 'villamanta', 'villamantilla', 'villanueva-de-la-canada', 'villanueva-del-pardillo', 'villanueva-de-perales', 'villar-del-olmo', 'villarejo-de-salvanes', 'villaviciosa-de-odon', 'villavieja-del-lozoya', 'zarzalejo']
```

1. Instalar y configurar la biblioteca de Geopy para realizar la geocodificación.

2. Crear una función que reciba una lista de municipios y devuelva un DataFrame con los nombres de los municipios y sus respectivas coordenadas (latitud y longitud).

3. Validar los datos obtenidos para verificar si hay municipios sin coordenadas y resolver posibles problemas, como nombres incorrectos o faltantes.


### Paso 2: Buscar Localizaciones Relevantes con la API de Foursquare

Una vez obtenidas las coordenadas de los municipios, utilizarás la API de Foursquare para buscar servicios que pueden ser importantes en un rodaje (ej: parques, edificios históricos, plazas).

En este punto es importante que reflexiones sobre los servicios o establecimientos clave que considerarías relevantes para establecer una empresa de servicios para rodajes. No hay una única respuesta correcta, ya que depende de la estrategia y visión que tengas. Al menos deberás elegir 5 tipos de servicios que puedan influir en la decisión de ubicación. Ejemplos de estos servicios pueden incluir:

- Parques o áreas verdes para rodajes exteriores.

- Centros comerciales que faciliten acceso a diferentes necesidades logísticas.

- Bares o restaurantes para el catering del equipo.

- Tiendas especializadas en disfraces o vestuario.

- Alquileres de equipos audiovisuales.

Es crucial entender que esta selección depende de la naturaleza y enfoque de la empresa. Tal vez para algunos proyectos sea más importante estar cerca de áreas residenciales o lugares con buena conexión de transporte. Otros proyectos podrían priorizar la proximidad a tiendas especializadas o servicios de entretenimiento. Es vuestra decisión! 

1. Crear una cuenta en [Foursquare](https://location.foursquare.com/developer/) y obtener la API Key necesaria para realizar las solicitudes. Leer la documentación para entender como funciona. 

2. Definir una función para realizar búsquedas de lugares cercanos a las coordenadas de cada municipio. Esta función debe permitir filtrar los resultados por categoría y distancia.

3. Explorar las categorías disponibles en Foursquare y seleccionar aquellas que se ajusten a los servicios clave que decidáis para vuestra estrategia.

4. Aplicar la función de búsqueda a cada municipio, recopilando información sobre los lugares relevantes.

Recuerda que la elección de categorías es un punto de análisis clave en este ejercicio, ya que la información que obtendréis será fundamental para decidir la ubicación ideal para vuestra empresa. Aseguraos de justificar vuestras decisiones y considerar diferentes perspectivas. Para cada una de los municipios deberás sacar la información de todos los servicios elegidos. 

### Paso 3: Limpieza de la Información

La información obtenida de Foursquare puede incluir muchos detalles innecesarios. Tu objetivo es quedarte únicamente con los campos relevantes para tu análisis (nombre, dirección, coordenadas, tipo de lugar, etc.).


1. Explorar la estructura de los datos obtenidos para identificar los campos importantes y limpiar la información.

2. Eliminar duplicados y valores nulos para garantizar la consistencia y calidad de los datos.

### Paso 4: Almacenamiento de los Datos

Una vez que tengas la información limpia y organizada, almacénala en un archivo CSV que puedas reutilizar en futuros análisis.


In [2]:
import pandas as pd
import numpy as np
import requests
from tqdm import tqdm
from time import sleep
import os
import dotenv
dotenv.load_dotenv()


from geopy.geocoders import Nominatim


In [3]:
lista_municipios = ['acebeda-la', 'ajalvir', 'alameda-del-valle', 'alamo-el', 'alcala-de-henares', 'alcobendas', 'alcorcon', 'aldea-del-fresno', 'algete', 'alpedrete', 'ambite', 'anchuelo', 'aranjuez', 'arganda-del-rey', 'arroyomolinos', 'atazar-el', 'batres', 'becerril-de-la-sierra', 'belmonte-de-tajo', 'berrueco-el', 'berzosa-del-lozoya', 'boadilla-del-monte', 'boalo-el', 'braojos', 'brea-de-tajo', 'brunete', 'buitrago-del-lozoya', 'bustarviejo', 'cabanillas-de-la-sierra', 'cabrera-la', 'cadalso-de-los-vidrios', 'camarma-de-esteruelas', 'campo-real', 'canencia', 'carabana', 'casarrubuelos', 'cenicientos', 'cercedilla', 'cervera-de-buitrago', 'chapineria', 'chinchon', 'ciempozuelos', 'cobena', 'collado-mediano', 'collado-villalba', 'colmenar-del-arroyo', 'colmenar-de-oreja', 'colmenarejo', 'colmenar-viejo', 'corpa', 'coslada', 'cubas-de-la-sagra', 'daganzo-de-arriba', 'escorial-el', 'estremera', 'fresnedillas-de-la-oliva', 'fresno-de-torote', 'fuenlabrada', 'fuente-el-saz-de-jarama', 'fuentiduena-de-tajo', 'galapagar', 'garganta-de-los-montes', 'gargantilla-del-lozoya-y-pinilla-de-buitrago', 'gascones', 'getafe', 'grinon', 'guadalix-de-la-sierra', 'guadarrama', 'hiruela-la', 'horcajo-de-la-sierra-aoslos', 'horcajuelo-de-la-sierra', 'hoyo-de-manzanares', 'humanes-de-madrid', 'leganes', 'loeches', 'lozoya', 'lozoyuela-navas-sieteiglesias', 'madarcos', 'madrid', 'majadahonda', 'manzanares-el-real', 'meco', 'mejorada-del-campo', 'miraflores-de-la-sierra', 'molar-el', 'molinos-los', 'montejo-de-la-sierra', 'moraleja-de-enmedio', 'moralzarzal', 'morata-de-tajuna', 'mostoles', 'navacerrada', 'navalafuente', 'navalagamella', 'navalcarnero', 'navarredonda-y-san-mames', 'navas-del-rey', 'nuevo-baztan', 'olmeda-de-las-fuentes', 'orusco-de-tajuna', 'paracuellos-de-jarama', 'parla', 'patones', 'pedrezuela', 'pelayos-de-la-presa', 'perales-de-tajuna', 'pezuela-de-las-torres', 'pinilla-del-valle', 'pinto', 'pinuecar-gandullas', 'pozuelo-de-alarcon', 'pozuelo-del-rey', 'pradena-del-rincon', 'puebla-de-la-sierra', 'puentes-viejas-manjiron', 'quijorna', 'rascafria', 'reduena', 'ribatejada', 'rivas-vaciamadrid', 'robledillo-de-la-jara', 'robledo-de-chavela', 'robregordo', 'rozas-de-madrid-las', 'rozas-de-puerto-real', 'san-agustin-del-guadalix', 'san-fernando-de-henares', 'san-lorenzo-de-el-escorial', 'san-martin-de-la-vega', 'san-martin-de-valdeiglesias', 'san-sebastian-de-los-reyes', 'santa-maria-de-la-alameda', 'santorcaz', 'santos-de-la-humosa-los', 'serna-del-monte-la', 'serranillos-del-valle', 'sevilla-la-nueva', 'somosierra', 'soto-del-real', 'talamanca-de-jarama', 'tielmes', 'titulcia', 'torrejon-de-ardoz', 'torrejon-de-la-calzada', 'torrejon-de-velasco', 'torrelaguna', 'torrelodones', 'torremocha-de-jarama', 'torres-de-la-alameda', 'tres-cantos', 'valdaracete', 'valdeavero', 'valdelaguna', 'valdemanco', 'valdemaqueda', 'valdemorillo', 'valdemoro', 'valdeolmos-alalpardo', 'valdepielagos', 'valdetorres-de-jarama', 'valdilecha', 'valverde-de-alcala', 'velilla-de-san-antonio', 'vellon-el', 'venturada', 'villaconejos', 'villa-del-prado', 'villalbilla', 'villamanrique-de-tajo', 'villamanta', 'villamantilla', 'villanueva-de-la-canada', 'villanueva-del-pardillo', 'villanueva-de-perales', 'villar-del-olmo', 'villarejo-de-salvanes', 'villaviciosa-de-odon', 'villavieja-del-lozoya', 'zarzalejo']

In [4]:
geolocator = Nominatim(user_agent="my_application") #Primero hice un ejemplo con uno
location = geolocator.geocode("alcobendas")
print(location.address)
print((location.latitude, location.longitude))
print(location.raw)

Alcobendas, Comunidad de Madrid, España
(40.5400082, -3.6358494)
{'place_id': 255715278, 'licence': 'Data © OpenStreetMap contributors, ODbL 1.0. http://osm.org/copyright', 'osm_type': 'relation', 'osm_id': 345878, 'lat': '40.5400082', 'lon': '-3.6358494', 'class': 'boundary', 'type': 'administrative', 'place_rank': 16, 'importance': 0.5134214038073257, 'addresstype': 'city', 'name': 'Alcobendas', 'display_name': 'Alcobendas, Comunidad de Madrid, España', 'boundingbox': ['40.5011783', '40.5888135', '-3.7009167', '-3.5494995']}


In [5]:
def convertir_df(lista_mun):
    lista_dic=[]
    for municipio in tqdm(lista_mun):
        geolocator = Nominatim(user_agent="my_application")
        location = geolocator.geocode(municipio)
        dicc=location.raw
        lista_dic.append(dicc)
    df= pd.DataFrame(lista_dic)
    return df[["name","lat","lon"]]

In [6]:
df_municipios= convertir_df(lista_municipios)
df_municipios.to_csv("datos/coordenadas.csv")

  0%|          | 0/179 [00:00<?, ?it/s]

100%|██████████| 179/179 [01:31<00:00,  1.95it/s]


In [7]:
df_municipios["lon"].isna().sum()  #No hay nulos
df_municipios["lat"].isna().sum()
df_municipios["name"].isna().sum()

np.int64(0)

In [8]:
df_municipios.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 179 entries, 0 to 178
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   name    179 non-null    object
 1   lat     179 non-null    object
 2   lon     179 non-null    object
dtypes: object(3)
memory usage: 4.3+ KB


In [9]:
df_municipios.describe()

Unnamed: 0,name,lat,lon
count,179,179.0,179.0
unique,179,179.0,179.0
top,La Acebeda,41.0869583,-3.624399
freq,1,1.0,1.0


In [10]:
df_municipios.head(3)

Unnamed: 0,name,lat,lon
0,La Acebeda,41.0869583,-3.624399
1,Ajalvir,40.5342302,-3.4807818
2,Alameda del Valle,40.9177178,-3.8438216


**Mi intención es ubicar una empresa de rodajes (especializado en series médicas)**
- Hospitales
- Zonas de almacénes
- Edificios residenciaels
- Parques
- Cafeterías

Por ello creo que tener cerca hospitales facilita la adecuación de los actores para poder ver el funcionamiento de uno real. Además, se podría llegar a acuerdos con el hospital no solo del uso de alguna instalación sino también de materiales y vestimentas (Habría que ejecutar un estudio de viabilidad por si la opción de montar sets unicamente fuera más rentable). La zona de almacenes puede ser útil no solo para el almacenaje de material de rodaje como su propio nombre indica sino también puede servir como escenario más industrial e incluso se podría optar por el alquiler o compra de algunos almacenes con el fin de ser sets de grabación.  

Los edificios residenciales, parques y cafeterías sirven no solo para su posible uso y disfrute por parte de los trabajadores sino también como garantía de conseguir un entorno realista para los rodajes que se deban desarrollar en esos ámbitos.

In [11]:
key= os.getenv("token")
key

'fsq3B6HVgQI29yTShfC/RVhww2T2U1D+gxnqcvRV1OVHXCo='

In [12]:
#Búsqueda de hospitales 15013

urlh = "https://api.foursquare.com/v3/places/search?query=15013&radius=10000"

headers = {
    "accept": "application/json",
    "Authorization": key
}

responseh = requests.get(urlh, headers=headers)

responseh.json()

{'results': [],
 'context': {'geo_bounds': {'circle': {'center': {'latitude': 40.4163,
     'longitude': -3.6934},
    'radius': 10000}}}}

In [13]:
#Búsqueda de Storage Facility 11165

urla = "https://api.foursquare.com/v3/places/search?query=11165&radius=10000"

headers = {
    "accept": "application/json",
    "Authorization": key
}

responsea = requests.get(urla, headers=headers)

responsea.json()

{'results': [],
 'context': {'geo_bounds': {'circle': {'center': {'latitude': 40.4163,
     'longitude': -3.6934},
    'radius': 10000}}}}

In [14]:
#Búsqueda de Home (private) 12123

urlc = "https://api.foursquare.com/v3/places/search?query=12123&radius=10000"

headers = {
    "accept": "application/json",
    "Authorization": key
}

responsec = requests.get(urlc, headers=headers)

responsec.json()

{'results': [],
 'context': {'geo_bounds': {'circle': {'center': {'latitude': 40.4163,
     'longitude': -3.6934},
    'radius': 10000}}}}

In [15]:
#Búsqueda de Urban Park 16039

urlp = "https://api.foursquare.com/v3/places/search?query=16039&radius=10000"

headers = {
    "accept": "application/json",
    "Authorization": key
}

responsep = requests.get(urlp, headers=headers)

dfresponsep=responsep.json()

In [16]:
df_coordenadas= df_municipios[["lat", "lon"]]
dflat=df_coordenadas["lat"]
dflon=df_coordenadas["lon"]
list_lat= list(dflat)
list_lon= list(dflon)

Lo comento porque no lo quiero eliminar para que se vea lo que intenté

In [17]:
df_coordenadas= df_municipios[["lat", "lon"]]
# def crear_df_coordenadas(listalat,listalon):
#     lista_dic= []
#     for lat in listalat:
#         for lon in listalon:
#             urlcaf = f"https://api.foursquare.com/v3/places/search?query=13034&radius=10000&ll={lat},{lon}"
#             responsecaf = requests.get(urlcaf, headers=headers)
#             responsecaf.json()
#             lista_dic.append(responsecaf)
#     return lista_dic
# crear_df_coordenadas(list_lat,list_lon)



In [18]:
#cafetería 13034
urlcaf = "https://api.foursquare.com/v3/places/search?query=13034&radius=10000&ll=41.8781,-87.6298"

headers = {
    "accept": "application/json",
    "Authorization": key
}

responsecaf = requests.get(urlcaf, headers=headers)
responsecaf.json()

{'results': [],
 'context': {'geo_bounds': {'circle': {'center': {'latitude': 41.8781,
     'longitude': -87.6298},
    'radius': 10000}}}}

*A partir de aquí usé chat porque no era capaz de sacar la función de búsqueda*

In [19]:
# print(df_municipios.head())  # Muestra las primeras filas
# print(df_municipios[["lat", "lon"]].isna().sum())  # Verifica si hay valores nulos en las coordenadas

# print(df_municipios.columns)  # Asegúrate de que "name" es una columna válida en df_municipios

# response = requests.get(url = f"https://api.foursquare.com/v3/places/search?query=coffe&radius=10000&ll=40.4818396,-3.3644973", headers=headers)
# if response.status_code == 200:
#     data = response.json()
#     print(data)  # Verifica si la API devuelve resultados
# else:
#     print(f"Error en la solicitud: {response.status_code}")


# print(df_municipios.head())
# print(df_municipios[["lat", "lon", "name"]].isna().sum())


# response = requests.get(url = f"https://api.foursquare.com/v3/places/search?query=coffe&radius=10000&ll=40.4818396,-3.3644973", headers=headers)
# if response.status_code == 200:
#     print(response.json())  # Verifica el contenido de la respuesta
# else:
#     print(f"Error en la solicitud: {response.status_code}")


# for _, row in tqdm(municipios_df.iterrows()):
#     lat, lon = row["lat"], row["lon"]
#     print(f"Buscando en: lat={lat}, lon={lon}")
#     url = f"https://api.foursquare.com/v3/places/search?query={categoria}&radius={radio}&ll={lat},{lon}"
#     response = requests.get(url, headers=headers)
#     print(response.json())  # Verifica la respuesta de la API


In [20]:
# df_municipios = df_municipios[["lat", "lon"]]  
# # Función para buscar lugares cercanos a las coordenadas de los municipios
# def buscar_lugares(categoria, radio, municipios_df, key):
#     headers = {
#         "accept": "application/json",        #El accept define que espero una respuesta en json
#         "Authorization": key
#     }
    
#     resultados = []         # Lista para almacenar resultados de las búsquedas (la info de cada municipio)

#     for index, row in tqdm(municipios_df.iterrows()):   #  Recorre cada fila del DataFrame de municipios, obteniendo las coordenadas (lat y lon) de cada municipio. Ver ejemplo 1
#         lat, lon = row["lat"], row["lon"]
#         print(f"Buscando en: lat={lat}, lon={lon}")
#         url = f"https://api.foursquare.com/v3/places/search?query={categoria}&radius={radio}&ll={lat},{lon}" #Esto si que sabía que tenía que ser algo parecido pero no fui capaz de plasmarlo

#         response = requests.get(url, headers=headers)    #Request.get Envía una solicitud GET a la API de Foursquare, usando la URL y los encabezados definidos.
        
#         if response.status_code == 200:   # Comprueba si la respuesta es exitosa porque 200 es que todo ha ido bien
#             data = response.json()               #response.json(): Convierte la respuesta JSON de la API en un objeto de Python (diccionario).
#             for place in data.get("results", []):         #results parece ser el nombre de una clave que lleva asociada una lista con hospital, cafetería etc.Además si results está vacío devuelve como valor predeterminado una lista vacía ver Ejemplo 2
#                 # Extraer la información relevante
#                 nombre = place.get("name")
#                 direccion = place.get("location", {}).get("formatted_address")
#                 distancia = place.get("distance")
#                 categoria = place.get("categories", [{}])[0].get("name")
                
#                 resultados.append({              #Añade un diccionario a la lista resultados. Este diccionario contiene:El nombre del municipio donde se realizó la búsqueda(row["name"]).El nombre del lugar encontrado, su dirección, la distancia y su categoría.
#                     "municipio": row["name"],
#                     "nombre_lugar": nombre,
#                     "direccion": direccion,
#                     "distancia_m": distancia,
#                     "categoria": categoria
#                 })
    
#     df_resultados = pd.DataFrame(resultados) # Se convierten los resultados en un DataFrame
#     return df_resultados


# df_resultados = buscar_lugares(categoria="12123", radio=10000, municipios_df=df_municipios, key=os.getenv("token"))

# # Guardar los resultados en un archivo CSV
# # df_resultados.to_csv("resultados_busqueda.csv", index=False)

# # Mostrar los primeros resultados
# print(df_resultados.head())


In [21]:
df_municipios.columns

Index(['name', 'lat', 'lon'], dtype='object')

In [22]:
# def buscar_lugares(categoria, radio, municipios_df, key):
#     headers = {
#         "accept": "application/json",
#         "Authorization": key
#     }
    
#     resultados = []

#     for _, row in tqdm(municipios_df.iterrows()):  # Eliminamos el 'index' ya que no se utiliza
#         lat, lon = row["lat"], row["lon"]

#         # Verificar si lat y lon tienen valores válidos
#         if pd.isna(lat) or pd.isna(lon):
#             print(f"Coordenadas no válidas para el municipio: {row}")
#             continue

#         # Construir la URL
#         url = f"https://api.foursquare.com/v3/places/search?query={categoria}&radius={radio}&ll={lat},{lon}"

#         try:
#             response = requests.get(url, headers=headers)

#             # Verificar si la respuesta es exitosa
#             if response.status_code == 200:
#                 data = response.json()

#                 # Revisar si 'results' está en los datos
#                 if "results" in data and len(data["results"]) > 0:
#                     for place in data.get("results", []):
#                         # Extraer la información relevante
#                         nombre = place.get("name", "Desconocido")
#                         direccion = place.get("location", {}).get("formatted_address", "Dirección no disponible")
#                         distancia = place.get("distance", "Desconocida")
#                         categoria = place.get("categories", [{}])[0].get("name", "Categoría no disponible")

#                         resultados.append({
#                             "municipio": row.get("name", "Municipio no disponible"),
#                             "nombre_lugar": nombre,
#                             "direccion": direccion,
#                             "distancia_m": distancia,
#                             "categoria": categoria
#                         })
#                 else:
#                     print(f"No se encontraron resultados para {row.get('name')}.")
#             else:
#                 print(f"Error en la solicitud para {row.get('name')}: {response.status_code}")

#         except requests.exceptions.RequestException as e:
#             print(f"Error de conexión para {row.get('name')}: {e}")

#     # Crear un DataFrame con los resultados
#     if resultados:
#         df_resultados = pd.DataFrame(resultados)
#     else:
#         df_resultados = pd.DataFrame(columns=["municipio", "nombre_lugar", "direccion", "distancia_m", "categoria"])
    
#     return df_resultados

# df_resultados = buscar_lugares(categoria="15013", radio=10000, municipios_df=df_municipios, key=os.getenv("token"))

# # Mostrar los primeros resultados
# print(df_resultados.head())


La información obtenida de Foursquare puede incluir muchos detalles innecesarios. Tu objetivo es quedarte únicamente con los campos relevantes para tu análisis (nombre, dirección, coordenadas, tipo de lugar etc). 


1. Explorar la estructura de los datos obtenidos para identificar los campos importantes y limpiar la información.

2. Eliminar duplicados y valores nulos para garantizar la consistencia y calidad de los datos.

### Paso 4: Almacenamiento de los Datos

Una vez que tengas la información limpia y organizada, almacénala en un archivo CSV que puedas reutilizar en futuros análisis.

**Ejemplo 1**  

Supongamos que municipios_df tiene las siguientes filas:

name	lat	lon  
alcobendas	40.5372	-3.6372  
madrid	40.4168	-3.7038  
Al ejecutar el iterrows():   

En la primera iteración:  

index será 0 (el índice de la fila).  
row será una Serie que contiene:  
row["name"] = "alcobendas"    
row["lat"] = 40.5372  
row["lon"] = -3.6372  
En la segunda iteración:  

index será 1 (el índice de la fila).  
row será:  
row["name"] = "madrid"  
row["lat"] = 40.4168  
row["lon"] = -3.7038  

**Ejemplo 2**  

data = {  
    "results": [  
        {"name": "Hospital 1", "location": "Location A"},  
        {"name": "Hospital 2", "location": "Location B"},  
        {"name": "Hospital 3", "location": "Location C"}  
    ]   
}  



**Ejemplo 3**  
place = {  
    "name": "Hospital 1",  
    "location": "Location A",  
    "categories": [  
        {"id": "15013", "name": "Hospital"}  
    ]  
}  

place.get("categories", [{}]) devolverá:    

[  
    {"id": "15013", "name": "Hospital"}  
]  



In [24]:


# # Filtrar el DataFrame para solo tener lat y lon
# df_municipios = df_municipios[["lat", "lon"]]

# # Función para buscar lugares cercanos a las coordenadas de los municipios
# def buscar_lugares(categoria, radio, municipios_df, key):
#     headers = {
#         "accept": "application/json",  # Esperamos una respuesta en JSON
#         "Authorization": key
#     }

#     resultados = []  # Lista para almacenar resultados de las búsquedas

#     for index, row in tqdm(municipios_df.iterrows()):
#         lat, lon = row["lat"], row["lon"]
#         print(f"Buscando en: lat={lat}, lon={lon}")
#         url = f"https://api.foursquare.com/v3/places/search?query={categoria}&radius={radio}&ll={lat},{lon}"
#         response = requests.get(url, headers=headers)

#         if response.status_code == 200:
#             data = response.json()
#             for place in data.get("results", []):
#                 # Extraer la información relevante
#                 nombre = place.get("name")
#                 direccion = place.get("location", {}).get("formatted_address")
#                 distancia = place.get("distance")
#                 categoria = place.get("categories", [{}])[0].get("name")

#                 resultados.append({
#                     "municipio": row["name"],
#                     "nombre_lugar": nombre,
#                     "direccion": direccion,
#                     "distancia_m": distancia,
#                     "categoria": categoria
#                 })

#     df_resultados = pd.DataFrame(resultados)  # Convertir los resultados en un DataFrame
#     return df_resultados

# df_resultados = buscar_lugares(categoria="cafeteria", radio=9000, municipios_df=df_municipios, key=os.getenv("token"))

# # Mostrar los primeros resultados
# print(df_resultados.head())


**SIENTO NO HABERLO HECHO. MAÑANA NO SÉ CÓMO HARÉ EL LABORATORIO SIN ESTO**