### Práctica de Formatos de datos: CSV y JSON

#### Ejercicio 1[5 puntos]
Considerar los archivos __Terrazas.csv__ y __Locales.csv__ que contiene un censo de locales y actividades del Ayuntamiento de Madrid, clasificados según su tipo de acceso (puerta de calle o agrupado), situación (abierto, cerrado...) e indicación de la actividad económica ejercida y de las terrazas de hostelería y restauración que aparecen registradas en dicho censo. Observar que la información puede contener alguna inconsistencia.Se pide realizar funciones en Python que permitan realizar las siguientes acciones:

* Usando los dos archivos indicados, se pide crear un nuevo archivo csv denominados __NoTerrazas.csv__ el cual contenga la información de los locales que no son terrazas. Es decir, contendrá la misma información que el archivo __Locales.csv__ pero sin la información de locales que son Terrazas.

* Usando el archivo __Locales.csv__ se pide crear una nuevo archivo csv denominada __Agrupadas.csv__ el cual debe contener una línea por cada barrio conteniendo el número de locales en los que el nombre del vial del edificio en que se encuentran es diferente del nombre del vial de acceso al local. Por ejemplo el local con id 10000401 se encuentra en la Plaza de Isabel II pero el acceso al mismo se realiza desde la Calle Arenal. La información en el archivo debe aparecer en el siguiente orden:

  Código Barrio, Nombre Barrio, Número de empresas cumpliendo la condición
  


* Usando el archivo __Terrazas.csv__ crea un nuevo archivo cvs denominado TopRepeticiones.cvs. Considera el número de veces que se repite el nombre de una terraza (campo rótulo). Se pide crear un archivo csv que contenga los 20 nombres que más se repiten. La información en el archivo debe aparecer en orden descendente con los siguientes campos de información:

  Nombre terraza, Número de repeticiones

In [None]:
import csv

def foo_1():
    """Escribe en NoTerrazas.csv los locales que no sean terrazas.
    
    Variables relevantes:
    entrada_locales --- lista de locales
    entrada_terrazas --- lista de terrazas
    
    Excepciones: 
    FileNotFoundError --- los ficheros no existen en el directorio de trabajo
    
    """
    
    try:
        with open('Locales.csv', "r", encoding="utf8", errors='ignore') as locales:
            entrada_locales = list(csv.reader(locales, delimiter=";"))

        with open('Terrazas.csv', "r", encoding="utf8", errors='ignore') as terrazas:
            entrada_terrazas = list(csv.reader(terrazas, delimiter=";"))

        with open('NoTerrazas.csv', "w", encoding="utf8",errors='ignore') as no_terrazas:
            no_terrazas.write(";".join(entrada_locales[0]) + "\n")
            for i in entrada_locales[1:]:
                for j in entrada_terrazas[1:]:
                    # Comparamos con el id de los locales, si esta en Terrazas.csv lo descartamos
                    if i[0] == j[0]:  
                        break
                no_terrazas.write(";".join(i) + "\n")
    except FileNotFoundError:
        print("Ha habido un problema con los ficheros")

In [None]:
foo_1()

In [None]:
import csv

def foo_2():
    """Escribe en Agrupadas.csv el id del barrio, su nombre, y el número de locales donde el acceso
     es distinto de la localizacion del mismo.
    
    Variables relevantes:
    entrada_locales --- lista de locales
    
    Excepciones: 
    FileNotFoundError --- los ficheros no existen en el directorio de trabajo
    
    """
    try:
        with open('Locales.csv', "r", encoding="utf8", errors='ignore') as locales:
            entrada_locales = list(csv.reader(locales, delimiter=";"))
            
        with open('Agrupadas.csv', "w", encoding="utf8", errors='ignore') as agrupadas:
            agrupadas.write("Código Barrio, Nombre Barrio, Número de empresas cumpliendo la condición\n")
            dic = {}
            for i in entrada_locales[1:]:
                # i[15]+i[16] = nombre del vial del edificio, i[24]+i[25] = nombre del vial del acceso
                if (i[15] + i[16]) != (i[24] + i[25]):
                    try:
                        """ Extraemos la clave de turno con pop (si está, se borra del diccionario).
                        Si no está en el diccionario la metemos con valor (nombre barrio, cantidad 
                        empresas), si ya estaba la metemos de nuevo con setdefault incrementando 
                        la cantidad de empresas en 1. Usamos rstrip para eliminar los blancos a la
                        derecha de la informacion para facilitar la lectura del fichero de salida"""
                        name, value = dic.pop(i[3])
                        dic.setdefault(i[3], (i[4].rstrip(), value + 1))
                    except Exception:
                        dic.setdefault(i[3], (i[4].rstrip(), 1))
            for key in dic:
                agrupadas.write(", ".join([str(key), dic.get(key)[0], str(dic.get(key)[1])]) + "\n")

    except FileNotFoundError:
        print("Ha habido un problema con los ficheros")
      

In [None]:
foo_2()

In [None]:
import csv

def foo_3():
    """Escribe en TopRepeticiones.csv los nombres de las 20 terrazas mas repetidas (y la cantidad)
    en Terrazas.csv por orden decreciente de aparicion.
    
    Variables relevantes:
    estrada_terrazas --- lista de terrazas
    
    Excepciones: 
    FileNotFoundError --- los ficheros no existen en el directorio de trabajo
    
    """
    
    try:
        with open('Terrazas.csv',encoding="utf8",errors='ignore') as terrazas:
            estrada_terrazas = list(csv.reader(terrazas, delimiter=";"))

        with open('TopRepeticiones.csv', "w", encoding="utf8", errors='ignore') as repeticiones:
            repeticiones.write("Nombre terraza, Número de repeticiones\n")
            dic = {}
            for i in estrada_terrazas[1:]:
                try:
                    # Sacamos i[21] (campo rotulo) y aplicamos el mismo metodo que en el apartado anterior
                    value = dic.pop(i[21])
                    dic.setdefault(i[21], value + 1)
                except Exception:
                    dic.setdefault(i[21], 1)
            """Usamos sorted en vez de sort para indicar el parametro en base al cual ordenar la lista
            y marcamos reverse = True para tener la lista en orden decreciente por cantidad de 
            repeticiones"""
            lista_terrazas = sorted(dic.items(), key = lambda select: select[1], reverse = True)
            for (i, j) in lista_terrazas[:20]: 
                repeticiones.write(", ".join([i,str(j)]) + "\n")
    except FileNotFoundError:
        print("Ha habido un problema con los ficheros")

In [None]:
foo_3()

#### Ejercicio 2[5 puntos]
Considerar el archivo __Agenda.json__ que contiene información de actividades de carácter gratuito, para público infantil y adulto, desarrolladas por las siguientes instituciones de titularidad municipal: la red de Bibliotecas Públicas, la Biblioteca Histórica, la Biblioteca Musical Víctor Espinós, la Hemeroteca y la Imprenta. Se presentan las actividades de los próximos 60 dias. Se pide realizar funciones en Python que permitan realizar las siguientes acciones:

* El archivo contiene un campo denominado "audience" que indica el público al que va dirigido. A veces aparece y otras veces no aparece dicho campo. Se quiere procesar el archivo para obtener como resultado dos archivos de texto:el archivo __Niños.txt__ que contendrá la información de los eventos que es exclusivamente para niños y el archivo __Familias.txt__ que contendrá la información de los eventos que está dirigida a niños y familias. En los archivos debe aparecer una línea por cada evento cumpliendo las condiciones indicadas, y mostrando la información siguiente:
  
   Título del evento(campo title), inicio(campo "dtstart"), finalizacion(campo "dtend"), url(campo link)
   
   
* Se desea conocer los eventos más cercanos a un punto que viene especificado por su longitud y latitud. De manera que se quiere crear una función que tomando como entrada una longitud, una latitud y un número real que representa una distancia en kilometros, devuelva como resultado los eventos que se encuentran a una distancia menor o igual a la distancia dada como parámetro. El resultado se mostrará por la pantalla mostrando una línea por cada evento. De cada evento se mostrará:

  Título del evento(campo title), inicio(campo "dtstart"), finalizacion(campo "dtend"), url(campo link)
  
Para calcular la distancia entre dos puntos dadas sus coordenadas se utilizará la siguiente función en Python:

In [None]:
import math
import json

#Función que devuelve los datos relevantes del evento (los que pide el enunciado) en forma de cadena.
def get_data (event):
    return ",".join([event['title'], event['dtstart'], event['dtend'], event['link']])

#Función que calcula la longitud entre dos puntos.
def haversine(lat1, lon1, lat2, lon2):
    rad=math.pi/180
    dlat=lat2-lat1
    dlon=lon2-lon1
    R=6372.795477598
    a=(math.sin(rad*dlat/2))**2 + math.cos(rad*lat1)*math.cos(rad*lat2)*(math.sin(rad*dlon/2))**2
    distancia=2*R*math.asin(math.sqrt(a))
    return distancia

In [None]:
import json

#Coste O(n), siendo n el número de eventos del fichero Agenda.json
def foo_4():
    try:
        familias_write = open('Familias.txt', 'w')
        ninios_write = open('Niños.txt', 'w')
        datos = json.loads(open('Agenda.json', encoding="utf8").read())

        for x in datos['@graph']:
            result = x.get('audience',0)
            if (result!=0):
                if(result=="Niños"):
                    ninios_write.write(get_data(x)+"\n")
                elif (result=="Niños,Familias"):
                    familias_write.write(get_data(x)+"\n")
        familias_write.close()
        ninios_write.close()
    except IOError:
        print("Error con los ficheros de entrada/salida")

In [None]:
foo_4()

In [None]:
import json

#Coste 0(n), siendo n el número de eventos del fichero Agenda.json
def foo_5(latitude, longitude, distance):
    try:
        datos = json.loads(open('Agenda.json',encoding="utf8").read())
        for x in datos['@graph']:
            if(haversine(x['location']['latitude'],x['location']['longitude'], latitude, longitude)<=distance):
                print(get_data(x))    
    except IOError:
        print("Error con los ficheros de entrada/salida.")
        
try:
    latitude = int(input("Latitud: "))
    longitude = int(input("Longitud: "))
    distance = int(input("Distance: "))
    if distance < 0 or latitude < -90 or latitude > 90 or longitude < -180 or longitude > 180:
        raise ValueError
    foo_5(latitude, longitude, distance)
except ValueError:
        print("Los datos aportados son incorrectos.")
        


#### Normas de entrega

* Fecha tope de entrega: 27/10/2017
* La entrega se realizará subiendo al campus virtual un notebook de Jupyter con la solución. El archivo tendrá como nombre FormatosI_GrupoX donde X será el número de grupo correspondiente.