In [None]:
import geopandas as gpd
import pandas as pd
from shapely.geometry import Point, LineString
import numpy as np

import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
#dos librerias nuevas que usamos en APIs
import urllib
import json



# GCBA api

In [None]:
#una forma elemental de consultar una api es usando el navegador
'https://apitransporte.buenosaires.gob.ar/ecobici/gbfs/stationInformation?client_id=02f9fb1291ef41f6bfa93b0d99779291&client_secret=F7e10670D41343E1bf0D3DFFc7aa1e7D'

In [None]:
url = 'https://apitransporte.buenosaires.gob.ar/ecobici/gbfs/stationInformation?client_id=02f9fb1291ef41f6bfa93b0d99779291&client_secret=F7e10670D41343E1bf0D3DFFc7aa1e7D'

In [None]:
#esto se descompone en varios elementos
url_base = 'https://apitransporte.buenosaires.gob.ar/ecobici/gbfs/stationInformation?'
client_id = 'client_id=02f9fb1291ef41f6bfa93b0d99779291'
client_secret = 'client_secret=F7e10670D41343E1bf0D3DFFc7aa1e7D'

In [None]:
#cada API puede ser diferente y debemos chequear su documentación, pero los diferentes parametros
#se separan en general con &
url_computesta = url_base + client_id + '&' + client_secret
url_computesta

In [None]:
url_computesta == url

En este caso los unicos dos parametros son `client_id` y `client_secret`. Normalmente las APIs piden algun tipo de _token_ o clave secreta **que debemos evitar compartir (como estoy haciendo yo aca)**. En los casos siguientes vamos a ver otros ejemplos con consultas mas complejas

In [None]:
#realizamos el request a esa url
response = urllib.request.urlopen(url)


In [None]:
#la libreria json nos permite leer esta informacion como un diccionario de Python
datos = json.loads(response.read())


In [None]:
#inspeccionemos nuestros datos
datos

In [None]:
#dado el formato en el que se 
estaciones = pd.DataFrame(datos['data']['stations'])
estaciones = estaciones.reindex(columns=['station_id', 'name', 'capacity', 'lat', 'lon'])
estaciones.head()

In [None]:
url_base = 'https://apitransporte.buenosaires.gob.ar/ecobici/gbfs/stationStatus?'
url_computesta = url_base + client_id + '&' + client_secret
url_computesta

In [None]:
#extraemos el momento en que consultamos los datos, especificando que nuestro timezone es el de Argentina
from datetime import datetime
import pytz

argentina_tz = pytz.timezone('America/Argentina/Buenos_Aires')
tiempo_consulta = datetime.now(tz=argentina_tz)

#conusltamos el status de las estaciones
response = urllib.request.urlopen(url_computesta)
status = json.loads(response.read())
status = pd.DataFrame(status['data']['stations'])

#mergeamos ambos datasets para tener para cada status, la informacion de la estacion
status = status.merge(estaciones, how='inner', on='station_id')
status['timestamp_consulta'] = tiempo_consulta
status.to_csv('../data/' + str(tiempo_consulta)[:16] + '.csv', index=False)


In [None]:
status.head()

Aca pueden ver una funcion que hace esto y se se deja corriendo consulta y guarda cada media hora

In [None]:
#https://github.com/alephcero/ecobici_un_dia
import os
import urllib.request as urllib
import json
import pandas as pd
from datetime import datetime
from time import sleep
import pytz


argentina_tz = pytz.timezone('America/Argentina/Buenos_Aires')


def consultar_y_persistir():
    url_datos = 'https://apitransporte.buenosaires.gob.ar/ecobici/gbfs/stationInformation?client_id=' + \
        os.environ['ECOBICIID'] + '&client_secret=' + \
        os.environ['ECOBICISECRET']
    response = urllib.urlopen(url_datos)
    datos = json.loads(response.read())
    estaciones = pd.DataFrame(datos['data']['stations'])
    estaciones = estaciones.reindex(
        columns=['station_id', 'name', 'capacity', 'lat', 'lon'])

    url_consulta = 'https://apitransporte.buenosaires.gob.ar/ecobici/gbfs/stationStatus?client_id=' + \
        os.environ['ECOBICIID'] + '&client_secret=' + \
        os.environ['ECOBICISECRET']
    argentina_tz = pytz.timezone('America/Argentina/Buenos_Aires')
    tiempo_consulta = datetime.now(tz=argentina_tz)
    response = urllib.urlopen(url_consulta)
    status = json.loads(response.read())
    dt = pd.DataFrame(status['data']['stations'])
    dt = dt.merge(estaciones, how='inner', on='station_id')
    dt['timestamp_consulta'] = tiempo_consulta
    dt.to_csv('data/' + str(tiempo_consulta)[:16] + '.csv', index=False)


no_es_medianoche = True
while no_es_medianoche:
    if (datetime.now(tz=argentina_tz).hour == 0) and (datetime.now(tz=argentina_tz).minute == 0):
        no_es_medianoche = False
    print("waiting", datetime.now(tz=argentina_tz))
    sleep(60 * 1)

for i in range(48):
    sleep(60 * 30)
    print(i)
    consultar_y_persistir()

# Google

In [None]:
#Primero creamos un dataset para testear
#formato google maps latlong, yx
obelisco = (-34.60377,-58.38161)
retiro = (-34.591372, -58.374261)
once = (-34.608315, -58.406169)
constitucion = (-34.627554, -58.380690)

def construir_dict(nombre,tupla_latlong):
    return {
        'nombre':nombre,
        'coordenadas':{
            'long':tupla_latlong[1],
            'lat':tupla_latlong[0],
            'x':tupla_latlong[1],
            'y':tupla_latlong[0]
        }
}
    
puntos = [construir_dict('obelisco',(-34.60377,-58.38161)),
         construir_dict('retiro',(-34.591372, -58.374261)),
         construir_dict('once',(-34.608315, -58.406169)),
         construir_dict('constitucion',(-34.627554, -58.380690))]
crs = "+proj=longlat +ellps=WGS84 +datum=WGS84 +no_defs"
geoserie = gpd.GeoSeries([Point(punto['coordenadas']['x'],punto['coordenadas']['y']) for punto in puntos],crs=crs) 
geodt = gpd.GeoDataFrame({'geometry': geoserie, 'nombre':[punto['nombre'] for punto in puntos]})
geodt.index=geodt.nombre
geodt

In [None]:
# veamos la documentacion para obtener un token 
# https://developers.google.com/maps/documentation/distance-matrix/get-api-key
# a esta documentacion le falta el paso de habilitar ENABLE
api = ''

Nuestra itencion es obtener tiempos de viaje por eso usaremos Distance Matrix API.


In [None]:
# leamos la documentacion

In [None]:
#https://developers.google.com/maps/documentation/distance-matrix/intro#DistanceMatrixRequests

In [None]:
#creamos nuestras coordenadas en el formato requerido por la API de google
origen_lat = geodt.loc['obelisco','geometry'].y
origen_long = geodt.loc['obelisco','geometry'].x
destino_lat = geodt.loc['retiro','geometry'].y
destino_long = geodt.loc['retiro','geometry'].x

In [None]:
#construimos la consulta con el mismo metodo que vimos antes
url_base = 'https://maps.googleapis.com/maps/api/distancematrix/json?'
units = 'units=metric' 
origins = 'origins=' + str(origen_lat) + ',' + str(origen_long)
destinations = 'destinations=%f,%f' % (destino_lat,destino_long)
key = 'key={0}'.format(api)

url = url_base + '&' + units + '&' + origins + '&' + destinations + '&' + key
url

In [None]:
#volvemos a realizar la consulta y leerla como diccionario de python
response = urllib.request.urlopen(url)
diccio = json.loads(response.read())
diccio

In [None]:
#podemos agregar un nuevo parametro, el modo de transporte y agregarlo a lo que ya veniamos consultando
mode = 'mode=bicycling'

url = url_base + '&' + units + '&' + origins + '&' + destinations + '&'+ mode + '&' + key
url

In [None]:
#repetimos el proceso de consulta
response = urllib.request.urlopen(url)
diccio_bici = json.loads(response.read())
diccio_bici

In [None]:
#afortunadamente la gente de google creo una libreria que hace todo esto por nosotros
#https://github.com/googlemaps/google-maps-services-python
import googlemaps

In [None]:
#documentacion
#https://github.com/googlemaps/google-maps-services-python
gmaps = googlemaps.Client(key=api)

In [None]:
#realizamos una consulta con la liberia
travel = gmaps.distance_matrix(
    origins = once,
    destinations = obelisco,
    mode='transit', traffic_model='best_guess',
    transit_routing_preference = 'fewer_transfers')

In [None]:
#vemos el resultado de nuestro consulta
travel

In [None]:
#vemos que es un diccionario
type(travel)

In [None]:
#podemos convertirlo en un pandas data frame a partir de la estructura de diccionario
data = pd.DataFrame(travel)
data

In [None]:
#como extraer la informacion que deseamos?