## Repaso día 3

Secuencia de repaso de algunos conceptos de manipulación de archivos `json` y `csv`

In [None]:
! pip install requests

In [None]:
# cogemos datos ayto

import requests

url = 'https://www.zaragoza.es/sede/servicio/urbanismo-infraestructuras/estacion-bicicleta?rf=html&srsname=wgs84&start=0&rows=150&distance=500'

# Hay que informar a la api que podemos leer un json, si no nos devuelve un html
headers = {'Accept': 'application/geo+json'}

doc = requests.get(url, headers=headers) # doc es un objeto tipo Response
type(doc)

In [None]:
# Si la respuesta es correcta, el código de estado es 200
doc.status_code

In [None]:
datos = doc.json()  # podemos convertirlo directamente a objetos python con el método json del objeto

datos.keys()  # el json que hemos leído es un diccionario

In [None]:
# Puedes guardarlo en un archivo
import json

with open('estaciones_bizi.json', 'w') as f:
    json.dump(datos, f)


In [None]:
!ls -l

In [None]:
# O puedes guardar una parte del archivo, por ejemplo la lista de features,
# que son en realidad las estaciones

with open('estaciones_bizi.json', 'w') as f:
    json.dump(datos['features'], f)

In [None]:
! ls -l

In [None]:
!head estaciones_bizi.json

In [None]:
# Para leerlo del disco
with open('estaciones_bizi.json') as f:
    estaciones = json.load(f)
type(estaciones)

In [None]:
# tenemos una lista con las 130 estaciones
len(estaciones)

In [None]:
# ahora las puedes procesar, pero tienes que estar atento a su estructura:
from pprint import pprint
pprint(estaciones[0])

In [None]:
# Imagina que necesitas guardarlo como un csv. Tendrías que "aplanar" la estructura
# para mostrarlo con una tabla con los datos que te interesen

def nueva_estacion(est):
    """Recoge los datos que necesito de la estación y los devuelve como un
    diccionario plano"""
    nueva = {}
    nueva['coordenadas'] = est['geometry']['coordinates']
    nueva['id'] = est['properties']['id']
    nueva['title'] = est['properties']['title']
    nueva['address'] = est['properties']['address']
    # etc. Sigue con los datos que necesites
    return nueva

# filtramos nuestras estaciones
nuevas = [nueva_estacion(e) for e in estaciones]

# ahora tienen este aspecto
nuevas[0]

In [None]:
# vamos a guardarla en un csv
import csv

with open('estaciones.csv', 'w') as f:
    # vamos a usar un dictwriter para facilitar el trabajo
    # al DictWriter hay que pasarle los fieldnames, que serán la cabecera del csv
    # uso las claves del primer elemento por ejemplo
    writer = csv.DictWriter(f, fieldnames = nuevas[0].keys())
    writer.writerows(nuevas)

In [None]:
!ls -l

In [None]:
! head estaciones.csv