# Tratamiento de Archivos en python: `txt` y `csv`

## Leyendo el primer `txt`

Vamos a crear un archivo `txt` con Text Editor que diga

"¡Qué ilusión! Vamos a cargar por primera vez un archivo `txt` con `Python`"

y lo guardaremos en la carpeta datasets con el nombre `first_read.txt`.

A continuación, vamos a cargar el archivo que acabamos de crear en este mismo notebook. Para ello vamos a usar la función `open()` y los métodos `.read()` y `.close()`, para abrir, leer y cerrar, respectivamente, el archivo `txt`.


In [None]:
f = open("./first_read.txt")
print(f.read())
f.close()

* La función `open()` abre el archivo indicado y nos permite acceder a él. Como parámetro necesita el path del archivo que queremos abrir.
* El método `.read()` lo usamos para leer el contenido del output que nos proporciona la función `open()` al cual hemos llamado `f`
* Cuando hayamos acabado de trabajar con el archivo `f`, hay que cerrarlo. Este proceso se lleva a cabo con el método `.close()`


Otra forma de abrir el archivo y guardarlo en la variable `f` sería:

In [None]:
with open("./first_read.txt") as f:
  print(f.read())

**Observación.** Con esta nueva sintaxis ya no es necesario hacer uso del método `.close()` para cerrar el archivo `f`. El comando `with` garantiza que el objeto `file` precedente, `f`, se cerrará automáticamente después de salir del bloque de código.

### Leyendo parcialmente un archivo

Dado un archivo `txt` abierto con la función `open()`, no es necesario leerlo al completo. Si solamente nos interesase leer una parte, podríamos indicárselo por parámetro al método `.read()`

En el siguiente chunk de código vamos a leer solamente los 7 primeros caracteres del archivo `f`

In [None]:
f = open("./first_read.txt") 
print(f.read(7))
f.close()

### Leyendo un archivo línea a línea

El método `.readline()` hace que el archivo `f` sea leido línea a línea. 

* Si solamente llamamos una vez al método `.readline()` leeremos únicamente la primera línea del fichero.
* Si llamamos dos veces al método, leeremos las dos primeras líneas del fichero.
* Y así sucesivamente.

En nuestro caso solo tenemos una línea, de modo que nos sirve una llamada al método `.readline()` para leer todo el fichero. Sin embargo, podemos probar con un archivo con más de una línea como el `first_read_multiline` que hemos creado para esta clase.


In [None]:
with open("./first_read_multiline.txt") as f:
  print(f.readline())
  print(f.readline())
  print(f.readline())

In [None]:
#Forma sencilla de leer un fichero entero, línea a línea, con un bucle
with open("./first_read_multiline.txt","rt") as f:
    linea=f.readline()
    while linea!="":
        print(linea,end="")
        linea=f.readline()
        

## Escribiendo un archivo `txt`

Podemos crear y escribir un archivo `txt` desde este mismo notebook. 

Para ello, volveremos a usar la función `open()`, pero esta vez con un parámetro adicional: `mode = "w"`. Este nuevo parámetro nos permitirá acceder al archivo en modo escritura, mientras que si no indicásemos nada, por defecto accederíamos en modo lectura.

Para escribir en el fichero, tendremos que usar el método `.write()` e indicarle el string que queremos plasmar en nuestro `txt`.

Además, para crear un nuevo archivo `txt`, a la hora de introducir el path (que será el mismo que el del archivo `first_read.txt`), como nombre del archivo indicaremos `first_write.txt`.

In [None]:
f = open("./first_write.txt", mode = "w")
f.write("Este es el primer archivo txt que escribimos\ny lo estamos haciendo desde un notebook!")
f.close()

**¡Cuidado!** El archivo que creemos no debe existir. En caso de existir un archivo con el mismo nombre, lo estaríamos rescribiendo.

Comprobamos que se ha guardado el nuevo archivo `txt` llamado `first_write` en nuestra carpeta datasets. 

Una vez comprobada la existencia de este archivo `txt`, podemos leerlo desde este notebook tal cuál hemos hecho en el apartado anterior

In [None]:
# Con el método .read()
with open("./first_write.txt") as f:
  print(f.read())

In [None]:
# Con el método .readline()
with open("./first_write.txt") as f:
  print(f.readline())
  print(f.readline())

Al haber más de una línea, también podemos leer todas ellas con un bucle:

In [None]:
with open("./first_write.txt") as f:
  for line in f:
    print(line)

### Creando un `txt` vacío

Si queremos crear un `txt` vacío, indicamos `mode = "x"`.

En este caso vamos a crear un `txt` vacío llamado `first_empty`

In [None]:
f = open("./first_empty.txt", mode = "x")
f.close()

**¡Cuidado!** El archivo que creemos no debe existir. En caso de existir un archivo con el mismo nombre, nos saltaría error indicando que el archivo en cuestión ya existe.

## Sobrescribiendo un archivo `txt` existente

Al igual que podemos crear y escribir un archivo `txt` desde 0, podemos modificar un archivo `txt` ya existente.

En este caso, el parámetro `mode` debe ser igualado a `"a"`.

Vamos entonces a modificar el archivo `first_write` y vamos a añadirle al final la siguiente frase:

"\nY esta última línea se ha añadido posteriormente."

**Observación.** Añadimos el comando `\n` al principio de la frase para que ésta se considere una nueva frase tras un salto de línea.

In [None]:
f = open("./first_write.txt", mode = "a")
f.write("\nY esta última línea se ha añadido posteriormente.")
f.close()

**¡Cuidado!** Cada vez que ejecutéis la celda anterior se añadirá el string indicado. Por tanto, no la ejecutéis más de una vez u os encontraréis con la frase en cuestión repetida múltiples veces!

In [None]:
with open("./first_write.txt") as f:
  for line in f:
    print(line)

**¡Cuidado!** Si en vez de indicar `mode = "a"` indicáis `mode = "w"` eliminaréis el contenido del fichero y lo sobrescribiréis por completo por el string que indiquéis al método `.write()`

In [None]:
f = open("./first_write.txt", mode = "w")
f.write("Ups! Todo lo anterior ha sido borrado!!!\n")
f.write("Hay que ir con cuidado cuando queremos editar un archivo txt...\n")
f.write("Hay que prestar mucha atención al método con el que accedemos al fichero!")
f.close()

In [None]:
with open("./first_write.txt") as f:
  for line in f:
    print(line)

## Eliminando archivos

En este caso vamos a tener que importar el módulo `os`

In [None]:
import os

Para eliminar un archivo usaremos el método `.remove()` al que por parámetro indicaremos el path de dicho archivo.

In [None]:
os.remove("./first_empty.txt")

Podemos comprobar en la carpeta datasets que efectivamente ha dejado de existir el archivo `first_empty`.

Para evitar errores, antes de proceder a la eliminación de un archivo, podemos comprobar su existencia con el método `.path.exists()`, al que por parámetro le indicamos el path del archivo en cuestión.

Para realizar este ejemplo, vamos a volver a crear el `txt` `first_empty`. Luego comprobaremos su existencia y, de existir, lo eliminaremos. De no existir, lo indicaremos por pantalla.

In [None]:
path = "./first_empty.txt"
f = open(path, mode = "x")
f.close()

In [None]:
if os.path.exists(path):
  os.remove(path)
else:
  print("El archivo que se quiere eliminar no existe")

Si volvemos a ejecutar la celda anterior, puesto que el archivo `first_empty` se habrá eliminado, obtendremos el mensaje `"El archivo que se quiere eliminar no existe"`

In [None]:
if os.path.exists(path):
  os.remove(path)
else:
  print("El archivo que se quiere eliminar no existe")

### Eliminando carpetas

Si se deseara eliminar toda una carpeta, esto sería posible con el método `.rmdir()`.

Para ver su funcionamiento, vamos a crear una carpeta dentro de la carpeta datasets. A esta nueva carpeta la llamaremos `carpeta_temporal` y estará vacía.

**Observación.** Este métodosolo nos permite eliminar carpetas vacías.

In [None]:
path = "./carpeta_temporal"
os.rmdir(path)

Navegamos hasta la carpeta datasets de nuestro Google Drive y comprobamos que efectivamente, la carpeta vacía que acabábamos de crear, `carpeta_temporal`, ha sido eliminada.

## Leyendo `csv` con `open()`

Además de usar la función `open()`, vamos a necesitar algunos métodos del módulo `csv`.

In [None]:
import csv

Empezaremos mostrando como leer un `csv` haciendo uso del método `.reader()` del módulo `csv`.

En este caso vamos a trabajar con el archivo `csv_example.csv`. Si abrimos el archivo, veremos que todos los valores están separados por comas y cada observación se encuentra en una línea diferente.

Para leerlo, ejecutaremos el siguiente chunk de código:

In [None]:
with open("./csv_example.csv", "r") as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

Con la función `open()` hemos accedido al archivo, al cuál hemos identificado por `f`. A continuación, hemos usado el método `.reader()` para leer el archivo `f`. Dicho método nos ha devuelto el iterable `reader`, del cuál hemos mostrado todas sus filas iterando con un bucle `for`. 

### Cambiando el separador

Por defecto, los archivos `csv` tienen como delimitador la coma `,`. No obstante, algunos archivos `csv` usan otros delimitadores. Las alternativas más populares a la coma suelen ser `|` o `\t`.

Observemos el archivo `csv_delimiter_example.csv`, donde esta vez sus elementos están separados por tabuladores, `\t`.

El método `.reader()` nos permite configurar dicho separador con el parámetro `delimiter`.

In [None]:
with open("./csv_delimiter_example.csv", "r") as f:
    reader = csv.reader(f, delimiter = "|")
    for row in reader:
        print(row)

### Eliminando espacios adicionales

A veces puede ocurrir que algunos `csv` tengan un espacio en blanco tras el delimitador, cosa que se ve reflejado al leer los datos.

Para eliminar estos espacios en blanco adicionales, el método `.reader()` trae el parámetro `skipinitialspace`. Si lo igualamos a `True`, los espacios adicionales desaparecerán.

Observemos que el archivo `csv_spaces_example.csv` tiene espacios en blanco adicionales tras el separador, que es la coma. Veamos la diferencia entre igualar el parámetro `skipinitialspace` a `True` o a `False`.

In [None]:
# skipinitialspace = False (valor por defecto)
with open("./csv_spaces_example.csv", "r") as f:
    reader = csv.reader(f, skipinitialspace = False)
    for row in reader:
        print(row)

**Observación.** Salvo la primera entrada de cada fila, todas tienen un espacio inicial adicional.

In [None]:
# skipinitialspace = True
with open("./csv_spaces_example.csv", "r") as f:
    reader = csv.reader(f, skipinitialspace = True)
    for row in reader:
        print(row)

### Comillas en las entradas

Algunos archivos `csv` puede que tengan entradas entre comillas. Si no indicamos nada, por defecto aparecerán las comillas en las entradas tras haber leído el fichero.

Si en cambio queremos deshacernos de ellas, disponemos del parámetro `quoting`, que admite diferentes valores:

* `csv.QUOTE_ALL`: indica al objeto `reader` que todos los valores en el archivo `csv` están entre comillas
* `csv.QUOTE_MINIMAL`: indica al objeto `reader` que los valores en el archivo `csv` que están entre comillas son entradas que contienen caracteres como el delimitador, comillas o cualquier caracter de terminación de línea
* `csv.QUOTE_NONNUMERIC`: indica al objeto `reader` que los valores en el archivo `csv` que están entre comillas son entradas que contienen entradas no-numéricas
* `csv.QUOTE_NONE`: indica al objeto `reader` que ninguno los valores en el archivo `csv` están entre comillas

Observemos el archivo `csv_quotation_example.csv`, donde las observaciones entre comillas son aquellas que no tienen valores numéricos. En este caso, nos convendría usar la opción `csv.QUOTE_NONNUMERIC`

In [None]:
with open("./csv_quotation_example.csv", "r") as f:
    reader = csv.reader(f, quoting = csv.QUOTE_NONNUMERIC)
    for row in reader:
        print(row)

**Observación.** Las entradas numéricas han dejado de ser leídas como strings y han pasado a ser consideradas entradas de tipo `float`.

Si en cambio hubiésemos usado la opción `csv.QUOTATE_ALL`, no hubiésemos obtenido ningún error, pero las entradas numéricas habrían sido tratadas como `string`.

In [None]:
with open("./csv_quotation_example.csv", "r") as f:
    reader = csv.reader(f, quoting = csv.QUOTE_ALL)
    for row in reader:
        print(row)

### Dialectos

Hasta ahora solamente hemos usado uno de los parámetros cada vez, pero podría darse el caso de que tuviésemos un csv con un delimitador distinto a la coma, con espacios adicionales y entradas entrecomilladas a causa de contener delimitadores o finales de línea.

Una opción sería indicar todos los parámetros a la función, pero existe una alternativa que nos será muy útil en caso de no estar tratando con un solo archivo `csv` sino con múltiples con formatos similares. Es el caso de los dialectos.

Los dialectos ayudan a agrupar patrones de formato específicos como el delimitador, las comillas, los espacios adicionales tras los delimitadores...

En caso de querer usar nuestro dialecto personalizado, `.reader()` nos ofrece el parámetros `dialect` al cual podemos pasarle dicho dialecto.

Consideremos el archivo `csv_dialect_example.csv`, el cual tiene el delimitador `|`, espacios adicionales y todos sus valores no numéricos entrecomillados.

En vez de indicar todos esos parámetros al método `.reader()`, vamos a crear nuestro dialecto, `my_dialect`, con el método `.register_dialect()` y se lo vamos a pasar al parámetro `dialect` de `.reader()` 

In [None]:
csv.register_dialect("my_dialect",
                     delimiter = "|",
                     skipinitialspace = True,
                     quoting = csv.QUOTE_NONNUMERIC)

with open("./csv_dialect_example.csv", "r") as f:
    reader = csv.reader(f, dialect = "my_dialect")
    for row in reader:
        print(row)

Al método `.register_dialect()` en primer lugar le hemos dado un nombre en formato `string` y luego hemos configurado los parámetros `delimiter`, `skipinitialspace` y `quoting`. 

A continuación, al método `.reader()` le hemos pasado el nombre del dialecto, `my_dialect`, al parámetro `dialect` y se ha leído el archivo correctamente.

Una vez creado el dialecto personalizado, podemos usarlo tantas veces como queramos para abrir y leer archivos `csv` con el mismo formato, en este caso, que `csv_dialect_example.csv`.

### Diccionarios y `csv`

En este caso vamos a trabajar de nuevo con el archivo `csv_example.csv`. 

Para leerlo, usaremos el método `.DictReader()` del módulo `csv`, lo que nos devolverá un objeto `OrderedDict`, que es iterable.

In [None]:
with open("./csv_example.csv", "r") as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row)

**Observación.** Podríamos usar la función `dict()` dentro del `print()` para mostrar los objetos `OrderedDict` como diccionarios.

In [None]:
with open("./csv_example.csv", "r") as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(dict(row))

**Observación.** Si se usa una versión de `Python` 3.8 o superior, podría ser que no fuera necesario usar la función `dict()` pues el resultado de `.DictReader()` ya sería un diccionario.

## Escribiendo `csv`

Para crear y escribir un `csv` usamos la función `open()` junto al método `csv.writer()`:

In [None]:
data = [["id", "Name", "City", "Age"], 
        [1234, "Arturo", "Madrid", 22], 
        [2345, "Beatriz", "Barcelona", 25],
        [3456, "Carlos", "Sevilla", 18], 
        [4567, "Dolores", "Cuenca", 34]]

with open("./csv_write.csv", "w") as f:
  writer = csv.writer(f)
  for row in data:
    writer.writerow(row)


Si ahora vamos a la carpeta datasets, observaremos que ha aparecido un nuevo archivo llamado `csv_write.csv` el cual contiene como valores las entradas de la lista `data`, donde cada sublista corresponde a una fila del `csv` gracias al bucle `for` y al método `.writerow()`.

Podríamos haber obtenido exactamente el mismo resultado sin haber usado un bucle, lo que para ello tendríamos que haber hecho uso del método `.writerows()`.

In [None]:
with open("./csv_write_writerows.csv", "w") as f:
  writer = csv.writer(f)
  writer.writerows(data)

Si ahora vamos a la carpeta datasets, observaremos que ha aparecido un nuevo archivo llamado `csv_write_writerows.csv` el cual contiene como valores las entradas de la lista `data`, donde cada sublista corresponde a una fila del `csv` gracias al método `.writerows()`.

### Diccionarios y csv

También podemos escribir un `csv` a partir de un diccionario. Para ello tendremos que usar el método `.DictWriter()`.

In [None]:
data = [{"id": 1234, "Name": "Arturo", "City": "Madrid", "Age": 22},
        {"id": 2345, "Name": "Beatriz", "City": "Barcelona", "Age": 25},
        {"id": 3456, "Name": "Carlos", "City": "Sevilla", "Age": 18},
        {"id": 4567, "Name": "Dolores", "City": "Cuenca", "Age": 34}]

# La cabecera es la lista de las keys de cualquiera de las entradas de data
header = list(data[0].keys())

In [None]:
with open("./csv_write_dict.csv", "w") as f:
  writer = csv.DictWriter(f, fieldnames = header)
  
  writer.writeheader()
  for d in data:
    writer.writerow(d)

En este caso, los datos están guardado en una lista de diccionarios llamada `data`. A continuación guardamos la cabecera en la variable `header` como una lista de los nombres de las variables.

Abrimos (y creamos) el archivo `csv_write_dict.csv` y creamos el objeto `writer` con el método `.DictWriter()` al cual le pasamos la cabecera `header` mediante el parámetro `fieldnames`.

Finalmente, escribimos en primer lugar la cabecera con el método `.writeheader()` y luego, con la ayuda de un bucle `for`, cada observación, correspondiente a cada uno de los diccionarios de la lista `data`, en una fila diferente con el método `.writerow()`.

Podríamos haber obtenido el mismo resultado sin usar ningún bucle, pero haciendo uso del método `.writerows()`f=

In [None]:
with open("./csv_write_dict_writerows.csv", "w") as f:
  writer = csv.DictWriter(f, fieldnames = header)
  
  writer.writeheader()
  writer.writerows(data)

Observamos que efectivamente tanto el archivo `csv_write_dict.csv` como `csv_write_dict_writerows.csv` son idénticos.

# Tratamiento de fechas en Python


## Tiempo con `datetime`

Una fecha en `Python` no es un tipo de dato por si mismo, pero podemos trabajar con estos objetos tan peculiares con el módulo `datetime`

In [None]:
import datetime as dt

Para obtener la fecha y hora actual, podemos usar el método `.datetime.now()`

In [None]:
today = dt.datetime.now()
print(today)

In [None]:
type(today)

**Observación.** Dentro del módulo `datetime`, existe la clase `datetime`. Para evitar confusiones hemos renombrado al módulo `datetime` por `dt`

En el resultado anterior vemos que se nos muestra el año, mes, día, hora, minuto, segundo e incluso microsegundo.

Podemos acceder a toda esa información con los atributos

* `.year`: año
* `.month`: mes
* `.day`: día
* `.hour`: hora
* `.minute`: minuto
* `.second`: segundo


In [None]:
print("Año:", today.year)
print("Mes:", today.month)
print("Día:", today.day)
print("Hora:", today.hour)
print("Minuto:", today.minute)
print("Segundo:", today.second)
print("Microsegundo:", today.microsecond)

### Creando objetos `datetime`

Para crear objetos `datetime` podemos usar el método `.datetime()`. 

Este método toma como parámetros el año (`year`), mes (`month`), día (`day`), hora (`hour`), minuto (`minute`), segundo (`second`) y microsegundo (`microsecond`). Los 3 primeros, relacionados con la fecha, son parámetros obligatorios. Los parámetros restantes, los relacionados con el tiempo, son opcionales.

In [None]:
d = dt.datetime(2020, 9, 22, 12, 30)
print(d)

**Observación.** El método `.datetime()` toma un parámetro adicional, `tzinfo`, que también es opcional. A este parámetro se le suministra la zona horaria. Por defecto toma el valor `None`.

### Formato

El módulo `datetime` ofrece el método `.strftime()` para cambiar el formato en que mostramos la fecha y hora. En el parámetro `format` de este método podemos indicar alguna de las siguientes opciones

| Código | Descripción |
| :---: | :--- |
| `%Y` | Año, versión completa |
| `%y` | Año, versión abreviada (sin siglo) |
| `%B` | Mes, versión completa (idioma inglés) |
| `%b` | Mes, versión abreviada (idioma inglés) |
| `%m` | Mes, versión numérica |
| `%d` | Día del mes |
| `%j` | Día del año, 001-366 |
| `%A` | Día de la semana, versión completa (idioma inglés) |
| `%a` | Día de la semana, versión abreviada (idioma inglés)|
| `%w` | Día de la semana, versión numérica (0 = Domingo, 1 = Lunes, ..., 6 = Sábado) |
| `%W` | Semana del año, con lunes como primer día |
| `%U` | Semana del año, con domingo como primer día |
| `%H` | Hora, 00-23 |
| `%I` | Hora, 00-12 |
| `%p` | AM / PM |
| `%M` | Minuto, 00-59 |
| `%S` | Segundo, 00-59 |
| `%f` | Microsegundo, 000000-999999 |
| `%Z` | Zona horaria |
| `%z` | Offset de UTC |
| `%c` | Versión local de fecha y hora |
| `%x` | Versión local de fecha |
| `%X` | Versión local de hora |
| `%%` | Caracter `%` |
| `%G` | Año ISO 8601 |
| `%u` | Día de la semana ISO 8601 |
| `%V` | Semana del año ISO 8601 |



**Observación.** Cuando decimos offset de UTC, nos referimos a la cantidad de horas a las que se encuentra la zona horaria del Tiempo Universal Coordinado (UTC)

In [None]:
d = dt.datetime(2020, 9, 22, 12, 30)

In [None]:
print(d.strftime("%B %d, %Y"))

In [None]:
print(d.strftime("%d/%m/%Y"))

In [None]:
print(d.strftime("%d %b %y"))

In [None]:
print(d.strftime("%d-%m-%Y %H:%M:%S"))

In [None]:
print(d.strftime("%d %b %Y, %I:%M%p"))

Al hablar de formato de fechas, es importante estar familiarizados con el concepto ISO 8601, presente en la tabla anterior. Se trata de un estándar internacional para la representación de fechas y horas.

`Python` consta de un método que genera rápidamente una fecha formateada con ISO 8601: el método `.isoformat()`

In [None]:
d.isoformat()

Es hora de hablar del método opuesto a `.strftime()`. Se trata del método `.strptime()`, que nos permite crear un objeto `datetime` a partir de un string. No obstante, como el string puede tener cualquier formato, habrá que indicarle por parámetro a `.strptime()` cuál estamos usando.

In [None]:
dt.datetime.strptime("September 22, 2020", "%B %d, %Y")

In [None]:
dt.datetime.strptime("22/09/2020", "%d/%m/%Y")

In [None]:
dt.datetime.strptime("22 Sep 20", "%d %b %y")

In [None]:
dt.datetime.strptime("22-09-2020 12:30:00", "%d-%m-%Y %H:%M:%S")

In [None]:
dt.datetime.strptime("22 Sep 2020, 12:30PM", "%d %b %Y, %I:%M%p")

**¡Cuidado!** El patrón debe coincidir a la perfección. Eso incluye las comas, los : y los espacios en blanco.

### Zonas horarias

Las [zonas horarias](https://www.timeanddate.com/time/map/) son un poco más complejas que lo que hemos visto hasta el momento sobre objetos `datetime`.

Por defecto ya hemos visto que un objeto `datetime` no contiene información acerca de la zona horaria.

In [None]:
print(today)

Para acceder específicamente a la información sobre la zona horaria de un objeto `datetime` podemos hacer uso del atributo `.tzinfo`

In [None]:
print(today.tzinfo)

Para indicarle a un objeto `datetime` la zona horaria o el offset de UTC, podemos hacer uso del módulo `pytz`.

In [None]:
import pytz

Podemos obtener todas las zonas horarias con el atributo `.all_timezones`

In [None]:
pytz.all_timezones

El módulo `pytz` también tiene el atributo `.country_names`, que se trata de un diccionario que por claves tiene un código de 2 letras (Código ISO Alpha-2) de los paises disponibles, cuyo valor es el nombre completo.

In [None]:
for key, value in pytz.country_names.items():
  print(key, "=", value)

Por ejemplo, España se corresponde con el par de letras ES:

In [None]:
pytz.country_names["ES"]

Luego también está el atributo `.country_timezones` que también es un diccionario que por clave tiene los países en código ISO Alpha-2 y por valor las zonas horarias para cada país clave.

In [None]:
for key, value in pytz.country_timezones.items():
  print(key, "=", value)

Por ejemplo, las zonas horarias disponibles para España (ES) son:

In [None]:
print(pytz.country_timezones["ES"])

Para indicarle a un objeto `datetime` una zona horaria, usamos el método `.localize`

In [None]:
d_without_tz = dt.datetime(2020, 9, 22, 12, 30)
tz_madrid = pytz.timezone("Europe/Madrid")
d_with_tz = tz_madrid.localize(d_without_tz)
d_with_tz.strftime("%Z")

In [None]:
d_without_tz = dt.datetime(2020, 9, 22, 12, 30)
tz_nyc = pytz.timezone("America/New_York")
d_with_tz = tz_nyc.localize(d_without_tz)
d_with_tz.strftime("%Z")

### Series temporales con `matplotlib`

Ahora que ya sabemos como manipular las fechas, podemos hablar de cómo representar datos en función del tiempo.

Para representar series temporales con `matplotlib.pyplot`, usamos el método [`.plot_date()`](https://matplotlib.org/3.1.1/api/_as_gen/matplotlib.pyplot.plot_date.html)

In [None]:
dates = ["1/9/2020", "2/9/2020", "3/9/2020", "4/9/2020", "5/9/2020",
         "6/9/2020", "7/9/2020", "8/9/2020", "9/9/2020", "10/9/2020",
         "11/9/2020", "12/9/2020", "13/9/2020", "14/9/2020", "15/9/2020",
         "16/9/2020", "17/9/2020", "18/9/2020", "19/9/2020", "20/9/2020",
         "21/9/2020", "22/9/2020", "23/9/2020", "24/9/2020", "25/9/2020",
         "26/9/2020", "27/9/2020", "28/9/2020", "29/9/2020", "30/9/2020"]

x = [dt.datetime.strptime(d, "%d/%m/%Y").date() for d in dates]
y = np.random.randint(10000, 20000, len(x))

In [None]:
plt.title("Total Ventas en Septiembre 2020")
plt.xlabel("Día del mes")
plt.xticks(rotation = 90)
plt.ylabel("Total ventas")
plt.plot_date(x, y, c = "blue", ls = "--", lw = 2, tz = "Europe/Madrid")
plt.show()

# Errores y excepciones

Ahora vamos a aprender sobre los diferentes tipos de errores y excepciones que existen en `Python`. Tanto los errores como las excepciones saltan cuando el intérprete de `Python` encuentra algún error.

Es completamente normal cometer ciertos errores mientras se escribe un programa. Estos fallos conducen a errores cuando tratamos de ejecutar dicho programa. La ejecución termina al instante de encontrar alguno de esos fallos, que pueden ser de dos tipos:

1. Error de sintaxis
2. Excepción (error de lógica)

## Errores de sintaxis

**Error de sintaxis.** Ocurre cuando no se sigue la sintaxis correcta del lenguaje.

Un error de sintaxis ocurre cuando nos dejamos un paréntesis sin cerrar, los dos puntos tras la condición de un operador de decisión o iteración...

In [None]:
a = 2
if (a > 3 : 
    print(a)

Como podemos observar, ha saltado un error de sintaxis, `SintaxError`, debido a que nos hemos olvidado del paréntesis de cierre. Además, el propio error nos indica a qué es debido y dónde tenemos que modificar el código para corregir el fallo.

## Excepciones

**Excepción.** Una vez superado el test de sintaxis, si la ejecución del programa es interrumpida, entonces estamos ante una excepción o error de lógica.

Una excepción puede deberse a intentar llamar a una variable que no ha sido declarada (`NameError`), intentar abrir un archivo que no se encuentra en la dirección indicada (`FileNotFoundError`), intentar dividir un número entre cero (`ZeroDivisionError`)... Siempre que se da alguna de estas situaciones, `Python` crea un objeto excepción. Si no es manejado correctamente, imprime un rastreo del error junto a algunos detalles sobre qué ha causado dicho error.

In [None]:
a = 2
if (b > 3) : 
    print(b)

Como podemos observar, ha saltado una excepción, `NameError`, debido a que nos hemos llamado a una variable que no existe. Además, el propio error nos indica a qué es debido y dónde tenemos que modificar el código para corregir el fallo.

### Excepciones de `Python`

Existen múltiples excepciones en `Python` que se nos muestran cuando se dan los errores correspondientes. Podemos mostrar por pantalla todas las excepciones de `Python` usando la función `locals()` tal y como se muestra a continuación

In [None]:
    for i in dir(locals()['__builtins__']):
      print(i)

`locals["__builtins__"]` nos devuelve el módulo con las excepciones, funciones y atributos de `Python`. La función `dir()` nos permite listar todos esos elementos como strings.

Algunas de las excepciones de `Python` más comunes al programar son:

| Excepción | Causa |
| :---: | :--- |
| `ArithmeticError` | Cuando falla una operación numérica |
| `AssertionError` | Cuando falla una declaración `assert` |
| `AtributeError` | Cuando falla una asignación de atributo o referencia |
| `EOFError` | Cuando la función `input()` llega a la condición fin de archivo (end-of-file) |
| `FloatingPointError` | Cuando falla una operación en coma flotante |
| `ImportError` | Cuando un módulo importando no es encontrado |
| `IndentationError` | Cuando la indentación no es correcta |
| `IndexError` | Cuando el índice de una secuencia se sale del rango |
| `KeyError` | Cuando una clave de un diccionario no es encontrada |
| `KeyboardInterrupt` | Cuando el usuario pulsa la tecla de interrupción |
| `LookupError` | Cuando el error no puede ser encontrado |
| `MemoryError` | Cuando una operación se queda sin memoria |
| `NameError` | Cuando se llama a una variable que no se encuentra a nivel global ni local |
| `NotImplementedError` | Cuando un método abstracto requiere de una clase heredada para sobreescribir el método |
| `OverflowError` | Cuando el resultado de una operación aritmética es demasiado grande para ser representado |
| `RuntimeError` | Cuando un error no entra dentro de ninguna categoría |
| `TabError` | Cuando la indentación consiste de tabulaciones y espacios en blanco inconsistentes |
| `TypeError` | Cuando a una función u operación se le suministra un objeto de tipo incorrecto |
| `ValueError` | Cuando una función obtiene un argumento del tipo correcto pero de valor incorrecto |
| `ZeroDivisionError` | Cuando el divisor de una división es 0 |

### Manejo de excepciones

Como programadores, necesitamos ser lo más específicos posible. Esto implica ser conscientes de los errores que podrían ocurrir. Por suerte, `Python` permite a los programadores tratar con errores de forma eficiente.

Podemos manejar excepciones usando 5 sentencias:

1. `try / except`
2. `try / finally`
3. `assert`
4. `raise`
5. `with / as`
 

#### 1. `try / except`

* El bloque `try` permite comprobar si hay errores de código.
* El bloque `except` permite manejar el error.

En el siguiente chunk, en caso de que ocurra el error, imprimimos un mensaje por pantalla:

In [None]:
a, b = 5, 0

try:
  print(a / b)
except ZeroDivisionError:
  print("¡Has querido dividir entre 0!")

En el siguiente chunk, en caso de que ocurra el error, imprimimos el mensaje de la excepción correspondiente por pantalla:

In [None]:
a, b = 5, 0

try:
  print(a / b)
except ZeroDivisionError as message:
  print(message)

Sin `try /except`, hubiéramos obtenido

In [None]:
a, b = 5, 0
print(a / b)

Podríamos poner más de un bloque `except`

In [None]:
a, b = "a", 0

try:
  print(a / b)
except ZeroDivisionError:
  print("¡Has querido dividir entre 0!")
except:
  print("Algo más ha salido mal")

En el chunk anterior hemos intentado dividir un string entre 0. Por tanto, la execpción ya no se debe a intentar dividir entre 0, sino a otro motivo: que un string no puede ser el dividendo de la división.

También podemos combinar `try / except` con `else`:

In [None]:
a, b = 5, 2

try:
  print(a / b)
except ZeroDivisionError:
  print("¡Has querido dividir entre 0!")
else:
  print("Nada ha salido mal")

El bloque `else` se ejecutará siempre y cuando no haya excepciones, junto al bloque `try`, tal cual ocurre en el ejemplo anterior.

#### 2. `try / finally`

* El bloque `try` permite comprobar si hay errores de código.
* El bloque `finally` permite ejecutar el código a pesar del resultado de los bloques `try` y `except`.

In [None]:
a, b = 5, 0

try:
  print(a / b)
except:
  print("Algo ha salido mal")
finally:
  print("El proceso try / except ha finalizado")

In [None]:
a, b = 5, 2

try:
  print(a / b)
except:
  print("Algo ha salido mal")
finally:
  print("El proceso try / except ha finalizado")

Sea cual sea el caso, el bloque `finally` siempre se ejecuta. 

El bloque `finally` puede ser útil para cerrar objetos y limpiar recursos.

#### 3. `assert`

La palabra reservada `assert` se utiliza para depurar (debug) el código. Nos permite comprobar si una condición en nuestro código devuelve `True`. De lo contrario, el programa nos devolverá un `AssertionError`


In [None]:
x = "Hola"

# Si la condición devuelve True, no ocurre nada
assert x == "Hola"

In [None]:
# Si la condición devuelve False, salta un AssertionError
assert x == "Adiós"

En el caso de que la condición devuelva `False`, podríamos indicar un mensaje del siguiente modo:

In [None]:
# Si la condición devuelve False, salta un AssertionError
assert x == "Adiós", "x debería de contener 'Hola'"

In [None]:
import math
x = 7.5
assert x > 0, "El valor de x debe ser positivo para calcular un logaritmo"
math.log(x)

#### 4. `raise`

Como programadores, podemos elegir cuando mostrar una excepción dada una condición. Para mostrar excepciones, usamos la palabra reservada `raise`


In [None]:
radius = -7
if radius < 0:
  raise Exception("El radio no puede tomar valores menores a 0")

En el chunk anterior hemos usado `raise` para mostrar una excepción. No obstante, podemos elegir qué tipo de excepción mostrar y el texto que imprimir al usuario:

In [None]:
radius = "-5"

if not type(radius) is int and not type(radius) is float:
  raise TypeError("El radio debe ser de tipo numérico (int o float)")
elif radius < 0:
  raise Exception("El radio no puede tomar valores menores a 0")

#### 5. `with / as`

La palabra reservada `with` se utiliza para manejar excepciones y conseguir así un código más limpio y legible. Simplifica el manejo de recursos comunes tales como flujos de archivos.

En el siguiente chunk  no utilizamos la palabra reservada `with`

In [None]:
file = open("path_del_archivo", "w")
try: 
    file.write("¡Hola, caracola!") 
finally: 
    file.close() 

Mientras que en el siguiente sí que utilizamos `with / as` y observamos que el código queda mucho más limpio y legible.

In [None]:
with open("path_del_archivo", "w") as file: 
    file.write("¡Hola, caracola!") 

Ambos chunks de código darían el mismo resultado. No obstante, el segundo tiene menos líneas de código, pues entre otras cosas no le hace falta la línea `file.close()`, tal cual vimos en el tema anterior. 

La palabra reservada `with` se asegura la adquisición y liberación adecuadas de recursos. 