# Agrupación y Segmentación de Vecindarios en Toronto
## Parte 2

Ahora que ha creado un marco de datos del código postal de cada vecindario junto con el nombre del municipio y el nombre del vecindario, para poder utilizar los datos de ubicación de Foursquare, necesitamos obtener las coordenadas de latitud y longitud de cada vecindario.

En una versión anterior de este curso, estábamos aprovechando la API de codificación geográfica de Google Maps para obtener las coordenadas de latitud y longitud de cada vecindario. Sin embargo, recientemente Google comenzó a cobrar por su API: http://geoawesomeness.com/developers-up-in-arms-over-google-maps-api-insane-price-hike/ así que usaremos el paquete Geocoder Python en su lugar: https://geocoder.readthedocs.io/index.html.

El problema con este paquete es que a veces tiene que ser persistente para obtener las coordenadas geográficas de un código postal determinado. Entonces puede hacer una llamada para obtener las coordenadas de latitud y longitud de un código postal dado y el resultado sería Ninguno, y luego realizar la llamada nuevamente y obtendría las coordenadas. Entonces, para asegurarse de obtener las coordenadas de todos nuestros vecindarios, puede ejecutar un ciclo while para cada código postal. Tomando el código postal M5G como ejemplo, su código se vería así:

In [1]:
"""
import geocoder # import geocoder

# initialize your variable to None
lat_lng_coords = None

# loop until you get the coordinates
while(lat_lng_coords is None):
  g = geocoder.google('{}, Toronto, Ontario'.format(postal_code))
  lat_lng_coords = g.latlng

latitude = lat_lng_coords[0]
longitude = lat_lng_coords[1]
"""

"\nimport geocoder # import geocoder\n\n# initialize your variable to None\nlat_lng_coords = None\n\n# loop until you get the coordinates\nwhile(lat_lng_coords is None):\n  g = geocoder.google('{}, Toronto, Ontario'.format(postal_code))\n  lat_lng_coords = g.latlng\n\nlatitude = lat_lng_coords[0]\nlongitude = lat_lng_coords[1]\n"

Dado que este paquete puede ser muy poco confiable, en caso de que no pueda obtener las coordenadas geográficas de los vecindarios usando el paquete Geocoder, aquí hay un enlace a un archivo csv que tiene las coordenadas geográficas de cada código postal: http://cocl.us/Geospatial_data

Utilice el paquete Geocoder o el archivo csv para crear el siguiente marco de datos:

Nota importante: Hay un límite en la cantidad de veces que puede llamar a la función geocoder.google. Es 2500 veces al día. Esto debería ser más que suficiente para que se familiarice con el paquete y lo utilice para obtener las coordenadas geográficas de los vecindarios de Toronto.

In [2]:
# Importamos "Numpy" como 'np'
import numpy as np 
# Importamos "Pandas" como "pd"
import pandas as pd

# Leemos el archivo del ejercicio anterior y lo asignamos a la variable "noDuplicated"
noDuplicated = pd.read_csv("Toronto_Q1.csv")

### Cogemos los datos Geoespaciales

In [3]:
# Descargamos datos Geoespaciales
!wget http://cocl.us/Geospatial_data

URL transformed to HTTPS due to an HSTS policy
--2022-12-28 17:09:19--  https://cocl.us/Geospatial_data
Resolviendo cocl.us (cocl.us)... 104.86.111.42, 104.86.111.9
Conectando con cocl.us (cocl.us)[104.86.111.42]:443... conectado.
Petición HTTP enviada, esperando respuesta... 302 Moved Temporarily
Localización: https://ibm.box.com/shared/static/9afzr83pps4pwf2smjjcf1y5mvgb18rr.csv [siguiendo]
--2022-12-28 17:09:20--  https://ibm.box.com/shared/static/9afzr83pps4pwf2smjjcf1y5mvgb18rr.csv
Resolviendo ibm.box.com (ibm.box.com)... 74.112.186.144
Conectando con ibm.box.com (ibm.box.com)[74.112.186.144]:443... conectado.
Petición HTTP enviada, esperando respuesta... 301 Moved Permanently
Localización: /public/static/9afzr83pps4pwf2smjjcf1y5mvgb18rr.csv [siguiendo]
--2022-12-28 17:09:22--  https://ibm.box.com/public/static/9afzr83pps4pwf2smjjcf1y5mvgb18rr.csv
Reutilizando la conexión con ibm.box.com:443.
Petición HTTP enviada, esperando respuesta... 301 Moved Permanently
Localización: https:/

### Mergeamos los datos Geoespaciales con nuestro .csv del notebook anterior.

In [4]:
geo = pd.read_csv('Geospatial_data')
geo.columns = ['CódigoPostal', 'Latitud', 'Longitud']
# Mergeamos el dataFrame de no duplicados con las coordenadas 
df_merged = pd.merge(noDuplicated, geo, on='CódigoPostal', how='inner')

# Guardamos los datos en "Toronto_Q2.csv"
df_merged.to_csv("Toronto_Q2.csv", index=False)
df_merged

Unnamed: 0,CódigoPostal,Municipio,Vecindario,Latitud,Longitud
0,M3A,North York,Parkwoods,43.753259,-79.329656
1,M4A,North York,Victoria Village,43.725882,-79.315572
2,M5A,Downtown Toronto,Regent Park / Harbourfront,43.654260,-79.360636
3,M6A,North York,Lawrence Manor / Lawrence Heights,43.718518,-79.464763
4,M7A,Queen's Park,Ontario Provincial Government,43.662301,-79.389494
...,...,...,...,...,...
98,M8X,Etobicoke,The Kingsway / Montgomery Road / Old Mill North,43.653654,-79.506944
99,M4Y,Downtown Toronto,Church and Wellesley,43.665860,-79.383160
100,M7Y,East TorontoBusiness reply mail Processing Cen...,Enclave of M4L,43.662744,-79.321558
101,M8Y,Etobicoke,Old Mill South / King's Mill Park / Sunnylea /...,43.636258,-79.498509


Una vez que pueda crear el marco de datos anterior, envíe un enlace al nuevo Notebook en su repositorio de Github. (2 puntos)