# Ejercicio 14

## Enunciado
Crea un programa que:

1. Obtenga los datos acerca del COVID-19 de [esta enlance](https://covid19.isciii.es/resources/serie_historica_acumulados.csv).
2. Cree una gráfica con el total de casos acumulados en tu comunidad autónoma a nivel diarío de color **rojo**.

## Extra
3. Añada a la gráfica el total diario de España en color **azul**.

### ¿Qué cosas nuevas necesitamos saber?
- Iterando sobre objetos. Las funciones **map()** y **filter()**.
- Uso de fechas. El tipo **datetime()**.
- Visualización de datos. La librería **matplotlib**.

### Iterando sobre objetos. Las funciones **map()** y **filter()**.

La función **map()** es aquella que dada una función y una colección de objetos, aplica esa función a cada elemento de la colección.

No obstante, la función map no devuelve los resultados, si no que devueleve un iterador. Para obtener los resultados, deberemos de iterar sobre el iterador (valga la redundancia).

Veamos unos ejemlos:

In [None]:
numeros = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10] # definimos nuestra lista de ejemplo

In [None]:
# y la función cuadrado, que dado un número, nos devuelve ese número al cuadrado
def cuadrado(n):
    return n*n

In [None]:
# nos ayudamos de la función map para aplicar la función a todos los elementos
numeros_al_cuadrado = map(cuadrado, numeros)

In [None]:
# como hemos comentado, esto no nos muestra los números, ya que para ello hemos de iterar sobre el resultado
print(numeros_al_cuadrado)

In [None]:
# esto, en cambio, si lo hace
for numero in numeros_al_cuadrado:
    print(numero)

Este comportamiento se debe a que la función map no calcula el resultado de aplicar la función a cada elemento de la colección hasta que no le es necesario hacerlo.

In [None]:
# si necesitamos tener los datos calculados por algo en especial, podemos hacer lo siguiente
numeros_al_cuadrado = list(map(cuadrado, numeros)) # usamos la conversión a list para que calcule cada elemento
print(numeros_al_cuadrado)

La función **filter()** es aquella que dada una función que devuelve un **bool** y una colección de objetos, filtra la colección para aquellos elementos cuya evaluación de la función es True.

De igual manera que sucede con **map()**, necesitaremos iterar sobre el resultado para comprobar el resultado.

Eso es todo a por hoy, a por ello!

In [None]:
def es_par(n):
    return n % 2 == 0

In [None]:
pares = filter(es_par, numeros)

In [None]:
print(pares)

In [None]:
for numero in pares:
    print(numero)

Hay que tener en cuenta que, en ambos casos, una vez terminada la iteración, no quedan elementos los que aplicar la función, por lo que si queremos hacer uso del elemento que hemos creado, habrá que calcularlo de nuevo.

Ilustremos esto:

In [None]:
# esto no va a hacer nada, porque ya imprimimos todos los pares antes
for numero in pares:
    print(numero)

In [None]:
# en cambio, si lo recalculamos, entonces si:
pares = filter(es_par, numeros)
for numero in pares:
    print(numero)

### Uso de fechas. El tipo **datetime()**.

El tipo datetime() nos permite crear objetos referentes a momentos en el tiempo. Para poder utilizarla, debemos importarla desde la libreria con el mismo nombre.

Podemos generar momento a partir del constructor de la clase o a partir de textos, veamos como:

In [None]:
# primero importamos la librería
from datetime import datetime

In [None]:
date1 = datetime(year=2020, month=4, day=5, hour=0, minute=0, second=0)
date2 = datetime(year=2020, month=4, day=4)
print(date1, date2)

Los distintos parámetros de la clase los podéis encontrar [aquí](https://docs.python.org/3/library/datetime.html#datetime.datetime).

Además, tambien podemos crear objetos del tipo **datetime()** a partir del tipo **str()**.

Veamos como:

In [None]:
fecha_str = "2020-06-30"
fecha = datetime.strptime(fecha_str, "%Y-%m-%d") # utilizamos la función strptime con el formato de nuestra fecha
# para convertirlo a datetime
print(type(fecha), fecha)

En [este enlance](https://docs.python.org/3/library/datetime.html#strftime-strptime-behavior) podeís encontrar que simboliza cada % que se le pasa a la función strptime dentro del parámetro.

En cualquier caso, veamos un par de ejemplos de conversión más:

In [None]:
print(datetime.strptime("2020-06-30", "%Y-%m-%d"))
print(datetime.strptime("2020-30-06", "%Y-%d-%m"))
print(datetime.strptime("2020/30/06", "%Y/%d/%m"))
print(datetime.strptime("2020/06/30 15:30", "%Y/%m/%d %H:%M"))

### Visualización de datos. La librería **matplotlib**.

Antes de poder utilizar la librería **matplotlib** debemos instalarla. Para ello, el comando es el siguiente:
```console
pip install -U matplotlib
```

**NOTA**: Recuerda ejecutar la consola como administrador en el caso de Windows o preceder el comando de **sudo** en el caso de Linux/MacOS.

In [None]:
# una vez instalada, realizaremos el siguiente import junto con la sentencia que vemos a continuación
# para poder visualizar nuestros datos en el propio notebook
from matplotlib import pyplot as plt
%matplotlib inline

Antes de comenzar, supongamos que queremos estudiar la rentabilidad de nuestro último móvil. Para ello veremos lo que nos habrá costado el movil cada día en función del tiempo que lo hayamos tenido. Para ello supondremos que el móvil nos costó 600 euros hace exactamente 730 días.

In [None]:
precio = 600
dias_de_uso = 730

In [None]:
# ahora crearemos los valores de los ejes X e Y
x = range(1, dias_de_uso + 1) # para conocer el día que estamos utilizando como referencia
y = [precio/dias for dias in x] # para calcular lo que nos ha costado el movil al día en función de los días que lo hemos usado

In [None]:
# una vez creados nuestros datos, los mostraremos visualmente
plt.figure(figsize=(13, 6)) # con esto determinamos el tamaño de nuestro gráfico
plt.title("Curva de amortización de un móvil de 600 €") # con esto añadimos título a nuestro gráfico
plt.plot(x,y) # así añadimos los valores
plt.show() # así mostramos el gráfico

In [None]:
# Como podemos comprobar, debido a las escalas de los datos, apenas apreciamos nada
# modifiquemos la escala del eje X para que en vez de ir de 1 en 1, vaya en potencias de 10
plt.figure(figsize=(13, 6)) 
plt.title("Curva de amortización de un móvil de 600 €")
plt.plot(x,y) 
plt.xscale('log') # así ponemos nuestro gráfico en escala logarítmica
plt.show()

Como podemos comprobar, ahora observamos mucho mejor que la mayor amotización se realiza entre los días 1 y 10, ya que el precio por día pasa de 600 euros al día (1 día) a 60 euros al día (10 días).

Podríamos ademas conocer la estimación del próximo año calculando los valores y añadiéndolos a nuestro gráfico en un color distinto.

Veamos como:

In [None]:
x2 = range(dias_de_uso + 1, dias_de_uso + 365 + 1)
y2 = [precio/dias for dias in x2]

In [None]:
# en vez de imprimir todos los valores de x e y, para poder obtener mayor detalle visual, imprimiremos solo los 100 últimos
plt.figure(figsize=(13, 6)) 
plt.title("Curva de amortización de un móvil de 600 €")
plt.plot(x[-100:],y[-100:], color='blue', label='pasado') # añadimos la primera parte con color azul y etiquetada como pasado
plt.plot(x2, y2, color='red', label='futuro')  # y la segunda de rojo como futuro
plt.legend() # con esto añadimos la leyenda con los valores de label
plt.xlabel("Días transcurridos") # y así añadimos etiquetas a los ejes
plt.ylabel("Precio por día") # y así añadimos etiquetas a los ejes
plt.show()

Eso es todo, a por el ejercicio!

## Solución

In [None]:
from matplotlib import pyplot as plt
%matplotlib inline

import requests
from bs4 import BeautifulSoup

from datetime import datetime

# Códigos ISO de las Comunidades Autónomas. Madrid = MD
# ISO | FECHA | CASOS | HOSPITALIZADOS | UCI | FALLECIDOS | RECUPERADOS
URL = "https://covid19.isciii.es/resources/serie_historica_acumulados.csv"

In [None]:
def es_madrid(lista):
    return lista.split(',')[0] == 'MD'

def divide(string):
    return string.split(',')

def convierte_fechas(fila):
    return datetime.strptime(fila[1], "%d/%m/%Y")

def convierte_casos(fila):
    if fila[2] == '':
        return 0
    else:
        return int(fila[2])

def suma_casos(lista_casos):
    acumulados = {}
    for item in lista_casos:
        cantidad = 0
        if item[1] in acumulados:
            if item[2] == "":
                item[2] = "0"
            cantidad = int(acumulados.get(item[1])) + int(item[2])
            acumulados[item[1]] = cantidad
            # print(f'Se acumulan {item[2]} a {item[1]} (de {item[0]}). Hay {acumulados[item[1]]}')
        else:
            acumulados[item[1]] = 0
            # print(f'Se añade {item[1]}')
    return list(acumulados.values())

In [None]:
req = requests.get(URL)
raw = req.text

lista_raw = raw.splitlines()[1:-2]

In [None]:
madrid = filter(es_madrid, lista_raw)
madrid_list = list(map(divide, madrid))

In [None]:
esp_list = list(map(divide, lista_raw))
casos_ES = suma_casos(esp_list)

In [None]:
fechas = list(map(convierte_fechas, madrid_list))
casos_MD = list(map(convierte_casos, madrid_list))

In [None]:
plt.figure(figsize = (13, 6))
plt.title("Curva de casos de Coronavirus en Madrid y España")
plt.plot(fechas, casos_MD, color = 'red', label = 'Madrid')
plt.xlabel("Fecha")
plt.ylabel("Casos")
plt.plot(fechas, casos_ES, color = 'blue', label = 'España')
plt.legend()
plt.show()