# Curso de Python - Parte 4

## 20. Gestión y operaciones de fechas y horas en Python

El módulo `datetime` proporciona clases y métodos para manipular fechas y horas, de formas sencillas y complejas. Aunque la aritmética de fechas y horas está soportada, el objetivo principal de la implementación está en la extracción eficiente de atributos para ser formateados y manipulados.

Existen dos tipos de objetos de fechas y hora:

- **aware**, que contiene la suficiente información para aplicar ajustes algorítmicos y políticos, como la zona horaria. Un objeto *awar* se usa para representar un momento específico en el tiempo y no está abierto a interpretación.

- **naive**, que no contiene la suficiente información para localizarse de forma relativa a otra fecha/hora. Si un objeto *naive* representa una hora en UTC, en hora local u otra zona horaria, depende enteramente de la interpretación del programa.


### Sobre las zonas horarias

Para los objetos de fecha y/o hora *aware* tienen un atributo opcional llamado `tzinfo` que puede tomar el valor de cualquier clase que herede de la clase `tzinfo`.

Esta clase `tzinfo` contiene información sobre el desplazamiento de la hora respecto a la zona UTC, el nombre de la zona horaria, cuando se aplica el horario de verano.

El módulo `datetime` sólo proporciona una clase `timezone` que herede de `tzinfo`. Esta clase representa las zonas horarias que simplemente tienen una diferencia fija con UTC, como la propia UTC, North American EST y las zonas horarias EDT.

### Tipos de fechas y horas

Todas las clases definidas en `datetime` son inmutables.

**`datetime.date`**

Fecha *naive* idealizada, asumiendo que el calendario Gregoriano siempre ha sido y será aplicado. Tiene como atributos: `year`, `month` y `day`.

**`datetime.time`**

Una hora idealizada, independiente de cualquier día en particular, asumiendo que todos los días tienen exactamente 24\*60\*60 segundos. Tiene como atributos: `hour`, `minute`, `second`, `microsecond` y `tzinfo`.

**`datetime.datetime`**

Una combinación de fecha y hora. Tiene como atributos: `year`, `month`, `day`, `hour`, `minute`, `second`, `microsecond` y `tzinfo`.

**`datetime.timedelta`**

Una duración que expresa la diferencia entre dos objetos `date`, `time` o `datetime`, con resolución de microsegundos.

**`datetime.tzinfo`**

Una clase base para representar objetos con información sobre zonas horarias. Estas se usan por las clases `datetime`y `time` para proporcionar una noción de ajuste temporal.

**`datetime.timezone`**

Una clase que implementa la clase `tzinfo` como una diferencia fija con UTC.

### `datetime.timedelta`

Representa un intervalo de tiempo, una difenrencia entre dos objetos `date`, `time` o `datetime`.

Se crea usando `datetime.timedelta(days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, hours=0, weeks=0)`.


Sólo los días, segundos y microsegundos se guardan internamente.

In [None]:
import datetime


datetime.timedelta(hours=1)

#### Métodos de `datetime.timedelta`

`timedelta.total_seconds()`

Devuelve el número total de segundos contenidos en la duración.

### `datetime.date`

Un objeto `date` representa una fecha, año, mes y día, en el calendario Gregoriano.

Se crea usando `datetime.date(year, month, day)`, donde

- Todos los atributos son obligatorios,
- han de estar en el siguiente rango:
    - MINYEAR <= year <= MAXYEAR
    - 1 <= month <= 12
    - 1 <= day <= número de días en el mes del año dado



In [None]:
import datetime


a_date = datetime.date(1955, 3, 2)
print(a_date)

#### Métodos de clase `datetime.date`

`date.today()`

Obtiene la fecha actual.

`date.fromtimestamp(timestamp)`

Obtiene una fecha a partir de un *POSIX timestamp*.

In [None]:
import time
import datetime

print(datetime.date.today())
print(datetime.date.fromtimestamp(time.time()))

#### Métodos de instancia `datetime.date`

`date.replace(year=self.year, month=self.month, day=self.day)`

Devuelve una fecha con el mismo valor, excepto por aquellos parámetros a los que se les haya dado valor, que reemplazarán los correspondientes a la fecha.

`date.strftime(format)`

Devuelve una cadena de texto con la fecha en un formato concreto, indicado en el parámetro `format`.
 
`date.weekday()`

Devuelve el día de la semana como un entero, siendo lunes el 0 y domingo el 6.

`date.isoweekday()`

Devuelve el día de la semana como un entero, siendo lunes el 1 y domingo el 7.

In [None]:
import time
from datetime import date


today = date.today()

# Cálculo de días hasta un próximo evento
my_birthday = date(today.year, 1, 27)
if my_birthday < today:
    my_birthday = my_birthday.replace(year=today.year + 1)

time_to_birthday = abs(my_birthday - today)
print(time_to_birthday.days)

### `datetime.datetime`

Un objeto `datetime` es un objeto que contiene toda la informaicón de un objeto `date` y `time`. Asume que el calendario Gregoriano se extiende en ambas direcciones de forma indefinida, y asyme que un día tiene exactamente 24\*60\*60 segundos.

`datetime.datetime(year, month, day, hour=0, minute=0, second=0, microsecond=0, tzinfo=None, *, fold=0)`

- MINYEAR <= year <= MAXYEAR,
- 1 <= month <= 12,
- 1 <= day <= número de días en el mes del año dado,
- 0 <= hour < 24,
- 0 <= minute < 60,
- 0 <= second < 60,
- 0 <= microsecond < 1000000,
- fold en [0, 1].


#### Métodos de clase `datetime.datetime`

`datetime.today()`

Devuelve la fecha y hora local, con el atributo `tzinfo` a `None`.

`datetime.now(tz=None)`

Devuelve la fecha y hora local. Si el parámetro opcional `tz` no está especificado, funciona igual que `today`, pero si se da el parámetro `tz` y es una instancia que hereda de `tzinfo`, entonces la fecha y hora local se convierten a la zona horaria `tz`.

`datetime.utcnow()`

Devuelve la fecha y hora local en UTC como un objeto *naive*.

`datetime.fromtimestamp(timestamp, tz=None)`

Devuelve la fecha y hora local correspondiente al *POSIX timestamp* dado por parámetro. Si el parámetro opcional `tz` no se especifica, el timestamp se convierte a la fecha y hora local. Si se especifica, se convierte a la fecha y hora de la zona horaria indicada.


`datetime.utcfromtimestamp(timestamp)`

Devuelve la fecha y hora UTC correspondiente al *POSIX timestamp* indicado.

`datetime.combine(date, time, tzinfo=self.tzinfo)`

Devuelve un nuevo objeto `datetime` cuyo componente de fecha es igual al objeto `date` dado por parámetro, y el componente de hora es igual al objeto `time` dado por parámetro.

Si el parámetro `tzinfo` se proporciona, se usará este para el nuevo `datetime`, si no, se tomará el del objeto `time`.

`classmethod datetime.strptime(date_string, format)`

Devuelve un objeto `datetime` resultado de analizar la cadena `date_string` con el formato `format`.


In [None]:
import datetime

print("Today", datetime.datetime.today())
print("Now", datetime.datetime.now())

print("UTC Now", datetime.datetime.now(datetime.timezone.utc))
print("UTC Now", datetime.datetime.utcnow())

#### Métodos de instancia `datetime.datetime`

`datetime.date()`

Develve un objeto `date` con el mismo año, mes y día.

`datetime.time()`

Devuelve un objeto `time` con los mismos atributos de hora, minutos, segundos y microsegundos. El campo `tzinfo` será `None`.

`datetime.timetz()`

Devuelve un objeto `time` con los mismos atributos de hora, minutos, segundos, microsegundos y `tzinfo`.



`datetime.replace(year=self.year, month=self.month, day=self.day, hour=self.hour, minute=self.minute, second=self.second, microsecond=self.microsecond, tzinfo=self.tzinfo, * fold=0)`

Devuelve un `datetime` con el mismo valor, excepto por aquellos parámetros a los que se les haya dado valor, que reemplazarán los correspondientes al `datetime`.

`datetime.astimezone(tz=None)`

Devuelve un objeto `datetime` con un atributo `tzinfo` con el valor dado en `tz`, ajustando el valor de fecha y hora a la zona horaria indicada.


`datetime.timestamp()`

Devuelve el *POSIX timestamp* correspondiente a la instancia.

`datetime.isoformat(sep='T', timespec='auto')`
    
Devuelve una cadena de texto representando el objeto `datetime` en el formato ISO 8601, YYYY-MM-DDTHH:MM:SS.mmmmmm, o si el número de microsegundos es 0, YYYY-MM-DDTHH:MM:SS.

Si el objeto tiene una zona horaria, añadirá la informacion de la diferencia respecto a UTC: YYYY-MM-DDTHH:MM:SS.mmmmmm+HH:MM o, si microsecond es 0 YYYY-MM-DDTHH:MM:SS+HH:MM

El argumento opcional `sep` (por defecto 'T') se corresponde con el carácter separador, situado entre la fecha y la hora.

El argumento opcionar `timespec` especifica el número de componentes adicionales que incluirá la hora.

- 'auto': lo mismo que 'seconds' si microsegundos es 0, y lo mismo que 'micorseconds' en cualquier otro caso.
- 'hours': incluye la hora en formato de dos dígitos.
- 'minutes': incluye la hora y los minutos en foramto HH:MM.
- 'seconds': incluye la hora, minutos y segundos en formato HH:MM:SS.
- 'milliseconds': incluye la hora completa, pero truncando la parte fraccional de los segundos a milisegundos,  en formato HH:MM:SS.sss.
- 'microseconds': incluye la hora complete en formato HH:MM:SS.mmmmmm.

`datetime.strftime(format)`

Devuelve una cadena de texto con la fecha y hora en un formato concreto, indicado en el parámetro `format`.


In [None]:
import datetime

d = datetime.datetime.now()
print(d)
print(d.astimezone(datetime.timezone.utc).strftime("%Z"))
print(d.isoformat())

### `datetime.time`

Un objeto `time` representa una hora local en un día no determinado.

`datetime.time(hour=0, minute=0, second=0, microsecond=0, tzinfo=None, *, fold=0)`


- 0 <= hour < 24,
- 0 <= minute < 60,
- 0 <= second < 60,
- 0 <= microsecond < 1000000,
- fold en [0, 1].


#### Métodos de instancia `datetime.time`


`time.replace(hour=self.hour, minute=self.minute, second=self.second, microsecond=self.microsecond, tzinfo=self.tzinfo, * fold=0)`

Devuelve un `time` con el mismo valor, excepto por aquellos parámetros a los que se les haya dado valor, que reemplazarán los correspondientes al `time`.

`time.strftime(format)`

Devuelve una cadena de texto con la hora en un formato concreto, indicado en el parámetro `format`.

`time.isoformat(timespec='auto')`

Devuelve una cadena de texto representando el objeto `time` en el formato ISO 8601, HH:MM:SS.mmmmmm, o si el número de microsegundos es 0, HH:MM:SS.

Si el objeto tiene una zona horaria, añadirá la informacion de la diferencia respecto a UTC: HH:MM:SS.mmmmmm+HH:MM o, si microsecond es 0 HH:MM:SS+HH:MM

El argumento opcionar `timespec` especifica el número de componentes adicionales que incluirá la hora.

- 'auto': lo mismo que 'seconds' si microsegundos es 0, y lo mismo que 'micorseconds' en cualquier otro caso.
- 'hours': incluye la hora en formato de dos dígitos.
- 'minutes': incluye la hora y los minutos en foramto HH:MM.
- 'seconds': incluye la hora, minutos y segundos en formato HH:MM:SS.
- 'milliseconds': incluye la hora completa, pero truncando la parte fraccional de los segundos a milisegundos,  en formato HH:MM:SS.sss.
- 'microseconds': incluye la hora complete en formato HH:MM:SS.mmmmmm.

In [None]:
from datetime import time

dt = time(hour=12, minute=34, second=56, microsecond=123456).isoformat(timespec='minutes')
print(dt)

dt = time(hour=12, minute=34, second=56, microsecond=0)
print(dt.isoformat(timespec='microseconds'))

print(dt.isoformat(timespec='auto'))


### Formato con `strftime` 

Todos los objetos que tienen el método `strftime` (y en el método de clase `strptime`) funcionan con la misma especificación de formato. Esta es una tabla de las claves más comunes, pero en [http://strftime.org/](http://strftime.org/) puedes ver una referencia completa.


Código | Significado | Ejemplo
-------|-------------|--------
`%d` | Día del mes, ajustado a dos cifras | 30
`%m` | Mes ajustado a dos cifras | 09
`%y` | Año sin siglo, ajustado a dos cifras | 18
`%Y` | Año con siglo | 2018
`%H` | Hora en reloj de 24 horas | 07
`%I` | Hora en reloj 12 horas | 07
`%p` | Equivalente local a AM o PM | AM
`%M` | Minutos ajustados a dos cifras | 06
`%S` | Segundos ajustados a dos cifras | 05
`%f` | Microsegunos, ajustados a 6 cifras | 000000
`%z` | Diferencia con UTC, en formato +HHMM o -HHMM | -0200
`%Z` | Nombre de la zona horaria | UTC

## 21. Trabajar con ficheros CSV, el módulo `csv`

El llamado formato CSV (*Comma Separated Values*) es el formato más común para la importación y exportacion de hojas de cálculo y bases de datos y fue usado durante muchos años antes de su estandarizaicón en el RFC 4180. 

El módulo `csv` implementa clases para leer y escribir datos en formato CSV. Permite a los programadores escribir en los formatos de CSV especializados de varias aplicaciones indicando los detalles de estos a las clases correspondientes.

`csv.reader(csvfile, dialect='excel', **fmtparams)`

Devuelve un objeto `reader` que iterará sobre las líneas del fichero CSV dado en `csvfile`. El parámetro `csvfile` puede ser cualquier objeto que soporta el protocolo de iteración y devuelve una cadena de texto cada que se llama al método `__next__()`.

Si este parámetro es un descriptor de fichero, este debe de ser abierto con el parámetro `newline=''`.

Se puede indicar un parámetro opcional llamado `dialect` para indicar un dialecto particular de CSV. Puede ser una instancia que sea subclase de `Dialect` o una cadena de texto que indique uno de los dialectos que se soportan por defecto.

Los parámetros por nombre dados en `fmtparams` se pueden indicar para sobreescribir los datos del dialecto indicado.

Cada fila del fichero CSV se devuelve como una lista de cadenas de texto, **sin realizar ninguna conversión de tipos**.


In [None]:
import csv


with open('addresses.csv') as csvfile:
    addresses_reader = csv.reader(csvfile)
    for row in addresses_reader:
        print(', '.join(row))

`csv.writer(csvfile, dialect='excel', **fmtparams)`

Devuelve un objeto `writer` responsable de convertir los datos del usuario a cadenals delimitadas en el objeto dado en `csvfile`. Este objeto puede ser cualquier objeto que tenga el método `write()`.

Si este parámetro es un descriptor de fichero, este debe de ser abierto con el parámetro `newline=''`.

Se puede indicar un parámetro opcional llamado `dialect` para indicar un dialecto particular de CSV. Puede ser una instancia que sea subclase de `Dialect` o una cadena de texto que indique uno de los dialectos que se soportan por defecto.

Los parámetros por nombre dados en `fmtparams` se pueden indicar para sobreescribir los datos del dialecto indicado.


In [None]:
import csv


with open('eggs.csv', 'w', newline='') as csvfile:
    spamwriter = csv.writer(csvfile, delimiter=' ', quotechar='|', quoting=csv.QUOTE_MINIMAL)
    spamwriter.writerow(['Spam'] * 5 + ['Baked Beans'])
    spamwriter.writerow(['Spam', 'Lovely Spam', 'Wonderful Spam'])

## 22. El módulo `sys`

El módulo estándar `sys` es uno de los dos módulos más importantes que tiene Python para la gestión del sistema.

En general, este módulo permite interaccionar con componentes relacionados con el interprete de Python que está ejecutando el programa o script.

### Plataforma

El módulo `sys` permite obtener la plataforma sobre la que está ejecutando el interprete.

In [None]:
import sys

sys.platform

### Variable `PYTHONPATH`

Cuando se realiza un `import` en Python, el interprete busca el paquete o el módulo en todos los directorios que están definidos en la variable de entorno `PYTHONPATH`.

El módulo `sys` permite obtener una lista de todos los directorios donde el interprete buscará los paquetes y módulos.

In [None]:
import sys

sys.path

Además de permitir mostar los directorios, también permite editarlos, y añadir nuevas rutas.

In [None]:
import sys

sys.path.append("/mydir")
sys.path

### Módulos cargados

El módulo `sys` también permite mostar los módulos cargados en el interprete. Al acceder a `sys.modules` tendremos un diccionario cuyas claves son los nombres de los módulos cargados y los valores los objetos que representan esos módulos.

In [None]:
import sys

print(sys.modules.keys())
sys.modules['sys']

### Detalles de excepciones

Otros atributos del módulo `sys` nos permiten obtener toda la información relacionada con la excepción más reciente que haya lanzado el interprete de Python.

In [None]:
import sys


try:
    raise IndexError
except:
    print(sys.exc_info())

In [None]:
import traceback, sys


def grail(x):
    raise TypeError("already got one")


try:
    grail("arthur")
except:
    exc_info = sys.exc_info()
    print(exc_info[0])
    print(exc_info[1])
    traceback.print_tb(exc_info[2])

### Argumentos en la línea de comandos

El módulo `sys` permite acceder a los argumentos que se han introducido por la línea de comandos al ejecutar un módulo como script.

Suponiendo que tienes este script:

```python
#!/usr/bin/env python
import sys


if __name__ == "__main__":
    print("argv value: ", str(sys.argv))
```

Al ejecutarlo, tendríamos lo siguiente:

```
$ ./argv.py
argv value:  ['./argv.py']
```

```
$ ./argv.py -c
argv value:  ['./argv.py', '-c']
```

```
$ ./argv.py -c foo
argv value:  ['./argv.py', '-c', 'foo']
```

### Salida

El módulo de `sys` también nos permite salir del programa o script, indicando un código de salida.

Suponiendo que tenemos el siguiente script:

```python
#!/usr/bin/env python
import sys


if __name__ == "__main__":
    sys.exit(42)
```

Al ejecutarlo, podríamos comprobar que la última salida fue 42.

```
$ echo $?
42
```

### *Streams* estándar

Los streams estándar son accesibles a través del módulo `sys`.

- `sys.stdin`
- `sys.stdout`
- `sys.stderr`

## 23. El módulo `os`

El módulo `os` es el otro módulo más importante de Python para la gestión del sistema, y el más grande de los dos. 

Este módulo contiene varibales y funciones que se traducen directamente a variables y funciones del sistema operativo en el que Python se está ejecutando.

Este módulo pretende proporcionar una interfaz portable al sistema operativo subyacente. Todas sus funciones estarán implementadas internamente de forma diferente según el sistema, pero para Python parecerán todas iguales en cualquier parte.

Tarea | Herramienta
------|------------
Varaibles de entorno | `os.environ`
Ejecutar programas | `os.system`, `os.popen`, `os.execv`, `os.spawnv`
Lanzar procesos | `os.fork`, `os.pipe`, `os.waitpid`, `os.kill`
Descriptores de ficheros | `os.open`, `os.read`, `os.write`
Proceso de ficheros | `os.remove`, `os.rename`, `os.mkfifo`, `os.mkdir`, `os.rmdir`
Herramientas administrativas | `os.getcwd`, `os.chdir`, `os.chmod`, `os.getpid`, `os.listdir`, `os.access`
Herramientas de portabilidad | `os.sep`, `os.pathsep`, `os.curdir`, `os.path.split`, `os.path.join`
Herramientas de gestión de *paths* | `os.path.exisist('path')`, `os.path.isdir('path')`, `os.path.getsize('path')`

### Herramientas administrativas

El módulo `os` permite obtener el PID del proceso actual, obtener el direcctorio de trabajo actual así como cambiar este directorio de trabajo.

In [None]:
import os

print("os.getpid()", os.getpid())
print("os.getcwd()", os.getcwd())

os.chdir("/")
print("os.getcwd()", os.getcwd())

### Constantes de portabilidad

El módulo `os` también nos permite acceder a constnates que contienen los caracteres concretos que cada sistema operativo utiliza para diferentes fines, como el separador de de rutas, o el salto de línea.

In [None]:
import os

os.pathsep, os.sep, os.pardir, os.curdir, os.linesep

- `os.pathsep` carácter que separa diferentes directorios
- `os.sep` carácter que se usa para separar componentes de directorios
- `os.pardir` ruta del directorio padre
- `os.curdir` ruta del directorio actual
- `os.linesep` separadore de líneas

### Herramientas para gestión de rutas de directorios

El submódulo `os.path` proporciona una serie de herramientas para gestionar las rutas de directorios.

- Comprobar el tipo de fichero, `os.path.isdir` y `os.path.isfile`
- Existencia de fichero, `os.path.exists`
- Obtener el tamaño de un fichero, `os.path.getsize`

In [None]:
import os.path


print(os.path.isdir("/Users"))
print(os.path.isdir("/Users/marcos/Workspace/python-course/Treasure_Island.txt"))
print(os.path.isfile("/Users/marcos/Workspace/python-course/Treasure_Island.txt"))
print(os.path.exists("/Users/marcos/Workspace/python-course/Treasure_Island.txt"))
print(os.path.exists("/Users/marcos/Workspace/python-course/foo.txt"))

print(os.path.getsize("/Users/marcos/Workspace/python-course/Treasure_Island.txt"))
print(os.path.getsize("/Users/marcos/Workspace/python-course"))

- `os.path.split` permite separar un fichero con su ruta en la ruta y el propio nombre del fichero.

In [None]:
import os.path


pathname = "/Users/marcos/Workspace/python-course/Treasure_Island.txt"
print(os.path.split(pathname))

pathname.split(os.sep)


- `os.path.join` permite unir rutas con nombres de fichero de nuevo

In [None]:
import os.path


pathname = "/Users/marcos/Workspace/python-course/Treasure_Island.txt"

os.path.join(*pathname.split(os.sep))

- `os.path.abspath` obtiene la ruta absoluta de una ruta relativa

In [None]:
import os.path


os.path.abspath('..')

### Ejecutar comandos de shell desde un script

El módulo `os` es el que nos permite ejecutar comandos de shell desde scripts de Python.

Hay dos funciones que permiten ejecutar cualquier comando que puedas ejecutar en una terminal:

- `os.system` ejecuta un comando de shell desde un script de Python.
- `os.popen` ejecuta un comando de shell y conecta a sus streams de entrada/salida.

In [None]:
import os


print(os.system('ls'))


output = os.popen('ls -l').read()
print(output)

## 24. El módulo `subprocess`


El módulo `subprocess` proporciona un control más detallado sobre los los comandos de shell que lanzamos desde Python, y puede ser usado como alternativa a las funciones del módulo `os` para lanzar procesos.

### `subprocess.run(args, *, stdin=None, input=None, stdout=None, stderr=None, shell=False, cwd=None, timeout=None, check=False, encoding=None, errors=None)`

Ejecuta el comando especificado en `args`, siendo este una lista con el comando a ejecutar y cada uno de sus comandos. Esta es la aproximación recomendada para lanzar subprocesos.

- Por defecto, `subprocess.run` no captura la salida
- Devuelve un objeto de tipo `CompletedProcess`


In [None]:
import subprocess

subprocess.run(["ls", "-l"])

Para capturar el la salida, pasamos `subprocess.PIPE` en el parámetro `stdout`.

In [None]:
subprocess.run(["ls", "-l", "/dev/null"], stdout=subprocess.PIPE)

Si el comando termina con un estado distinto de 0, lanza una excepción.

In [None]:
subprocess.run("exit 1", shell=True, check=True)

## Ejercicios

### El fichero más grande

El objetivo de este ejercicio es crear un script de Python que tome como argumento una ruta y que muestre por pantalla cual es el fichero más grande de esa ruta.

### Decorador, logger y traza de excepción

El objetivo de este ejercicio es crear un decorador que capture cualquier excepción de una función y muestre por el log la traza de la excepción.

### Análisis de logs 

El objetivo de este ejercicio es crear un script que dada la ruta de un fichero de entrada y uno de salida, siendo el fichero de entrada un log de una aplicación web de Python, escriba en el fichero de salida un CSV con las siguietes columnas:

Método | Ruta | Tiempo medio | N. De Peticiones
-------|------|--------------|-----------------
PATCH | /api/v1/pushes/all_read/ | 31 | 300

[Descargar de fichero de log](https://gist.github.com/cf2481add7e467d117a388c4be18aafe)