# Criptografía y tokens
En esta sesión, mostraremos una breve descripción general de los servicios criptográficos que ofrece la biblioteca estándar de Python. También vamos a hablar de los JSON Web Tokens, un interesante estándar para representar solicitudes de forma segura entre dos partes.

En particular, vamos a explorar lo siguiente:
- [Hashlib]()
- [HMAC]()
- [Secrets]()
- [JSON Web Tokens con PyJWT]()

Comencemos por un resumen sobre la criptografía y por qué es tan importante.

# La importancia de la criptografía
Se estima que, en 2021, más de 4 mil millones de personas en todo el mundo utilizan Internet. Cada año, más personas utilizan servicios bancarios en línea, compran en línea o simplemente hablan con amigos y familiares en las redes sociales. Todas estas personas esperan que su dinero esté seguro, sus transacciones seguras y sus conversaciones privadas.

Por lo tanto, si eres un desarrollador de aplicaciones, debes tomar la seguridad muy en serio. No importa cuán pequeña o aparentemente insignificante sea tu aplicación: la seguridad siempre debe ser una preocupación para ti.

La seguridad en la tecnología de la información se logra empleando varios métodos diferentes, pero el más importante es la criptografía. Casi todo lo que haces con tu computadora o teléfono debe incluir una capa donde se lleve a cabo la criptografía. Por ejemplo, la criptografía se utiliza para proteger los pagos en línea, para transferir mensajes a través de una red de manera que incluso si alguien los intercepta, no pueda leerlos y para cifrar tus archivos cuando los respaldas en la nube.

El propósito de esta sesión no es centrarnos en todas las complejidades de la criptografía; para ello, hay libros enteros dedicados al tema. En lugar de eso, le mostraremos cómo puede usar las herramientas que Python le ofrece para crear resúmenes, tokens y, en general, para estar más seguro cuando necesite implementar algo relacionado con la criptografía.

## Pautas útiles
Recuerde siempre las siguientes reglas:
- **Regla número uno:** no intente crear sus propias funciones de `hash` o cifrado. Simplemente no lo haga. Utilice herramientas y funciones que ya existen. Es increíblemente difícil idear un algoritmo bueno, sólido y robusto para realizar eso, por lo que es mejor dejarlo en manos de criptógrafos profesionales.
- **Regla número dos:** siga la regla número uno.

Estas son las únicas dos reglas que necesita. Aparte de ellas, es muy útil comprender la criptografía, así que intente aprender todo lo que pueda sobre este tema.

Ahora, profundicemos en el primero de los módulos de la biblioteca estándar que queremos mostrarle: `hashlib`.

# Hashlib
Este módulo proporciona acceso a una variedad de algoritmos `hash` criptográficos. Estas son funciones matemáticas que toman un mensaje de cualquier tamaño y producen un resultado de tamaño fijo, que se conoce como `hash` o resumen. Los hashes criptográficos tienen muchos usos, desde la verificación de la integridad de los datos hasta el almacenamiento y la verificación de contraseñas de forma segura.

Idealmente, los algoritmos `hash` criptográficos deben ser:
- **Determinista:** El mismo mensaje debe producir siempre el mismo `hash`.
- **Irreversible:** No debería ser factible determinar el mensaje original a partir del `hash`.
- **Resistente a colisiones:** debería ser difícil encontrar dos mensajes diferentes que produzcan el mismo `hash`.

Estas propiedades son cruciales para la aplicación segura de hashes. Por ejemplo, se considera imperativo que las contraseñas solo se almacenen en forma de `hash`. La propiedad de irreversibilidad garantiza que, incluso si se produce una violación de datos y un atacante se apodera de su base de datos de contraseñas, no sería factible que obtuviera las contraseñas originales. Tener las contraseñas almacenadas solo como hashes significa que la única forma de verificar la contraseña de un usuario cuando inicia sesión es calcular el hash de la contraseña que proporcionó y compararlo con el hash almacenado. Por supuesto, esto no funcionará si el algoritmo hash no es determinista. La resistencia a las colisiones es importante cuando se utilizan hashes para la verificación de la integridad de los datos. Si estamos usando un hash para verificar que un dato no fue manipulado, un atacante que pudiera encontrar una colisión de hash podría modificar los datos sin cambiar el hash, engañándonos para que pensemos que los datos no se cambiaron.

El conjunto exacto de algoritmos que están realmente disponibles a través de `hashlib` varía en función de las bibliotecas subyacentes utilizadas en su plataforma. Sin embargo, se garantiza que algunos algoritmos están presentes en todos los sistemas. Veamos cómo averiguar qué está disponible (tenga en cuenta que sus resultados pueden ser diferentes a los nuestros):

In [1]:
import hashlib
hashlib.algorithms_available

{'blake2b',
 'blake2s',
 'md5',
 'md5-sha1',
 'ripemd160',
 'sha1',
 'sha224',
 'sha256',
 'sha384',
 'sha3_224',
 'sha3_256',
 'sha3_384',
 'sha3_512',
 'sha512',
 'sha512_224',
 'sha512_256',
 'shake_128',
 'shake_256',
 'sm3'}

Al abrir un shell de Python, podemos obtener el conjunto de algoritmos disponibles para nuestro sistema. Sin embargo, si nuestra aplicación tiene que comunicarse con aplicaciones de terceros, siempre es mejor elegir un algoritmo del conjunto garantizado, ya que eso significa que todas las plataformas realmente los admiten. Tenga en cuenta que muchos de ellos comienzan con sha, que significa algoritmo hash seguro.

Vamos a crear un hash para la cadena de bytes b'Hash me now!':

In [3]:
h = hashlib.blake2b()
h.update(b'Hash me')
h.update(b' now!')
print(f"{h.hexdigest() = }")
print(f"{h.digest() = }")
print(f"{h.block_size = }")
print(f"{h.digest_size = }")
print(f"{h.name = }")

h.hexdigest() = '56441b566db9aafcf8cdad3a4729fa4b2bfaab0ada36155ece29f52ff70e1e9d7f54cacfe44bc97c7e904cf79944357d023877929430bc58eb2dae168e73cedf'
h.digest() = b'VD\x1bVm\xb9\xaa\xfc\xf8\xcd\xad:G)\xfaK+\xfa\xab\n\xda6\x15^\xce)\xf5/\xf7\x0e\x1e\x9d\x7fT\xca\xcf\xe4K\xc9|~\x90L\xf7\x99D5}\x028w\x92\x940\xbcX\xeb-\xae\x16\x8es\xce\xdf'
h.block_size = 128
h.digest_size = 64
h.name = 'blake2b'


Hemos utilizado la función criptográfica `blake2b()`, que es bastante sofisticada y se agregó en Python 3.6. Después de crear el objeto `hash` con el nombre h, actualizamos su mensaje en dos pasos. No es que necesitemos hacerlo aquí, pero a veces necesitamos hash de datos que no están disponibles de una sola vez, por lo que es bueno saber que podemos hacerlo en pasos.

Una vez que hemos agregado el mensaje completo, obtenemos la representación hexadecimal del resumen. Esto usará dos caracteres por byte (ya que cada carácter representa 4 bits, que es medio byte). También obtenemos la representación de bytes del resumen y luego inspeccionamos sus detalles: tiene un tamaño de bloque (el tamaño de bloque interno del algoritmo hash en bytes) de 128 bytes, un tamaño de resumen (el tamaño del hash resultante en bytes) de 64 bytes y un nombre.

Veamos qué obtenemos si, en lugar de la función `blake2b()`, usamos `sha256()`:

In [4]:
hashlib.sha256(b'Hash me now!').hexdigest()

'10d561fa94a89a25ea0c7aa47708bdb353bbb062a17820292cd905a3a60d6783'

El hash resultante es más corto (y por lo tanto menos seguro). Observe que podemos construir el objeto hash con el mensaje y calcular el resumen en una línea.

El hash es un tema muy interesante y, por supuesto, los ejemplos simples que hemos visto hasta ahora son solo el comienzo. La función `blake2b()` nos permite una gran flexibilidad gracias a una serie de parámetros que se pueden ajustar. Esto significa que se puede adaptar para diferentes aplicaciones o ajustar para proteger contra tipos particulares de ataques.

Aquí, solo analizaremos brevemente uno de estos parámetros. El parámetro `person` es bastante interesante. Se utiliza para personalizar el hash, lo que lo obliga a producir diferentes resúmenes para el mismo mensaje. Esto puede ayudar a mejorar la seguridad cuando se utiliza la misma función hash para diferentes propósitos dentro de la misma aplicación:

In [5]:
import hashlib

h1 = hashlib.blake2b(b'Important data', digest_size=16,
                     person=b'part-1')

h2 = hashlib.blake2b(b'Important data', digest_size=16,
                     person=b'part-2')

h3 = hashlib.blake2b(b'Important data', digest_size=16)

print(f"{h1.hexdigest() = }")
print(f"{h2.hexdigest() = }")
print(f"{h3.hexdigest() = }")

h1.hexdigest() = 'c06b9af95d5aa6307e7e3fd025a15646'
h2.hexdigest() = '9cb03be8f3114d0f06bddaedce2079c4'
h3.hexdigest() = '7d35308ca3b042b5184728d2b1283d0d'


Aquí también hemos utilizado el parámetro `digest_size` para obtener hashes de solo 16 bytes de longitud.

Las funciones hash de propósito general, como `blake2b()` o `sha256()`, no son adecuadas para almacenar contraseñas de forma segura. Las funciones hash de propósito general son bastante rápidas de calcular en las computadoras modernas, lo que hace que sea posible para un atacante revertir el hash por fuerza bruta (probando millones de posibilidades por segundo hasta que encuentre una coincidencia). Los algoritmos de derivación de claves como `pbkdf2_hmac()` están diseñados para ser lo suficientemente lentos como para hacer que tales ataques de fuerza bruta sean inviables. El algoritmo de derivación de claves `pbkdf2_hmac()` logra esto mediante el uso de muchas aplicaciones repetidas de una función hash de propósito general (la cantidad de iteraciones se puede especificar como un parámetro). A medida que las computadoras se vuelven más y más potentes, es importante aumentar la cantidad de iteraciones que hacemos con el tiempo, de lo contrario, la probabilidad de un ataque de fuerza bruta exitoso a nuestros datos aumenta con el paso del tiempo.

Las buenas funciones hash de contraseñas también deben usar `salt`. Este es un fragmento aleatorio de datos que se utiliza para inicializar la función hash; esto aleatoriza la salida del algoritmo y protege contra ataques en los que los hashes se comparan con tablas de hashes conocidos. La función `pbkdf2_hmac()` admite el uso de `salt` a través de un parámetro de `salt` obligatorio.

A continuación, se muestra cómo puede usar `pbkdf2_hmac()` para generar un hash de una contraseña:

In [6]:
import os

dk = hashlib.pbkdf2_hmac('sha256', b'Password123',
                         salt=os.urandom(16), iterations=100000)

print(f"{dk.hex() = }")

dk.hex() = 'fe66bf77fd951c2582a5be6fc3a73c32b801e84451165d92aff3b51908f3f5d5'


Tenga en cuenta que hemos usado `os.urandom()` para proporcionar una `sal` aleatoria de 16 bytes, como se recomienda en la documentación.

# HMAC
Este módulo implementa el algoritmo `HMAC`, tal como se describe en RFC 2104 (https://tools.ietf.org/html/rfc2104.html). `HMAC` (que significa código de autenticación de mensajes basado en hash o código de autenticación de mensajes con clave, dependiendo de a quién le pregunte) es un mecanismo ampliamente utilizado para autenticar mensajes y verificar que no hayan sido manipulados.

El algoritmo combina un mensaje con una clave secreta y genera un hash de la combinación. Este hash se conoce como código de autenticación de mensajes (MAC) o firma. La firma se almacena o transmite junto con el mensaje. Más adelante, puede verificar que el mensaje no haya sido alterado volviendo a calcular la firma utilizando la misma clave secreta y comparándola con la firma calculada anteriormente. La clave secreta debe protegerse cuidadosamente, de lo contrario, un atacante con acceso a la clave podría modificar el mensaje y reemplazar la firma, lo que anularía el mecanismo de autenticación.

Veamos un pequeño ejemplo de cómo calcular un código de autenticación de mensajes:

In [8]:
import hmac
import hashlib

def calc_digest(key, message):
    key = bytes(key, 'utf-8')
    message = bytes(message, 'utf-8')
    dig = hmac.new(key, message, hashlib.sha256)
    return dig.hexdigest()

mac = calc_digest('secret-key', 'Important Message')
print(mac)

1db5d806d73d76e779b7fd31091e026362a64177368e82e0cab91e0c2fb6435e


La función `hmac.new()` toma una clave secreta, un mensaje y el algoritmo hash que se va a utilizar y devuelve un objeto `hmac`, que tiene una interfaz similar a los objetos hash de `hashlib`. La clave debe ser un objeto bytes o bytearray y el mensaje puede ser cualquier objeto similar a bytes. Por lo tanto, convertimos nuestra clave y el mensaje en bytes antes de crear una instancia hmac (dig), que utilizamos para obtener una representación hexadecimal del hash.

# Secrets
Este pequeño módulo se agregó en Python 3.6 y se ocupa de tres cosas: números aleatorios, tokens y comparación de resúmenes. Utiliza los generadores de números aleatorios más seguros que ofrece el sistema operativo subyacente para generar tokens y números aleatorios adecuados para su uso en aplicaciones criptográficas. Echemos un vistazo rápido a lo que ofrece.

## Números aleatorios
Podemos utilizar tres funciones para tratar con números aleatorios:

In [9]:
import secrets

print(f"{secrets.choice('Choose one of these words'.split()) = }")
print(f"{secrets.randbelow(10 ** 6) = }")
print(f"{secrets.randbits(32) = }")

secrets.choice('Choose one of these words'.split()) = 'one'
secrets.randbelow(10 ** 6) = 221087
secrets.randbits(32) = 2689437701


La primera función, `choice()`, elige un elemento al azar de una secuencia no vacía. La segunda, `randbelow()`, genera un entero aleatorio entre 0 y el argumento con el que lo llamas, y la tercera, `randbits()`, genera un entero con la cantidad dada de bits aleatorios.

Debe utilizar estas funciones en lugar de las del módulo `random` siempre que necesite aleatoriedad en el contexto de la criptografía, ya que están especialmente diseñadas para esta tarea. Veamos qué nos da el módulo por `tokens`.

## Generación de tokens
De nuevo, tenemos tres funciones para generar tokens, cada una en un formato diferente. Veamos el ejemplo:

In [10]:
print(f"{secrets.token_bytes(16) = }")
print(f"{secrets.token_hex(32) = }")
print(f"{secrets.token_urlsafe(32) = }")

secrets.token_bytes(16) = b'\xeb\xd5I\xab\xe9\xc1\x9c\xd7\xbaku\t\xc3\x1d\xfe\xf0'
secrets.token_hex(32) = 'a69d86300578a04f1b3377b6447a74c0fee8eadce9cf86df0fdb15b18eedda5e'
secrets.token_urlsafe(32) = 'IB5aXSFVP7YbkoNK6SY6LyZ1XT_2zNYBfM692_0jwck'


La función `token_bytes()` simplemente devuelve una cadena de bytes aleatorios que contiene el número especificado de bytes (16, en este ejemplo). Los otros dos hacen lo mismo, pero `token_hex()` devuelve un token en formato hexadecimal y `token_urlsafe()` devuelve un token que solo contiene caracteres adecuados para ser incluidos en una URL.

Veamos cómo podemos usar estas herramientas para escribir nuestra propia generadora de contraseñas aleatorias:

In [26]:
import secrets
from string import digits, ascii_letters

def generate_pwd(length=8):
    chars = digits + ascii_letters
    return ''.join(secrets.choice(chars) for c in range(length))

def generate_secure_pwd(length=16, upper=3, digits=3):
    if length < upper + digits + 1:
        raise ValueError('Nice try!')
    while True:
        pwd = generate_pwd(length)
        if (any(c.islower() for c in pwd)
            and sum(c.isupper() for c in pwd) >= upper
            and sum(c.isdigit() for c in pwd) >= digits):
            return pwd

print(f"{generate_secure_pwd() = }")
print(f"{generate_secure_pwd(length=3, upper=1, digits=1) = }")

generate_secure_pwd() = '0kMBjIccnkuL9Wx4'
generate_secure_pwd(length=3, upper=1, digits=1) = 'T8c'


Nuestra función `generate_pwd()` simplemente genera una cadena aleatoria de una longitud dada uniendo caracteres de longitud elegidos al azar de una cadena que contiene todas las letras del alfabeto (minúsculas y mayúsculas) y los 10 dígitos decimales.

Luego, definimos otra función, `generate_secure_pwd()`, que simplemente sigue llamando a `generate_pwd()` hasta que la cadena aleatoria que obtenemos coincide con algunos requisitos simples. La contraseña debe tener caracteres largos, tener al menos un carácter en minúsculas, caracteres en mayúsculas y dígitos dígitos.

Si el número total de caracteres en mayúsculas, minúsculas y dígitos especificados por los parámetros es mayor que la longitud de la contraseña que estamos generando, nunca podremos cumplir las condiciones. Entonces, para evitar quedarse atascado en un bucle infinito, hemos puesto una cláusula de verificación en la primera línea del cuerpo y lanzamos un `ValueError` si no se pueden cumplir los requisitos.

El cuerpo del bucle `while` es sencillo: primero generamos la contraseña aleatoria y luego verificamos las condiciones mediante el uso de `any()` y `sum()`. La función `any` devuelve `True` si alguno de los elementos del iterable al que se llama se evalúa como `True`. El uso de `sum()` es en realidad un poco más complicado aquí, ya que explota el polimorfismo. Como recordarás, el tipo bool es una subclase de int, por lo tanto, al sumar en un iterable de valores `True` y `False`, la función `sum()` los interpretará automáticamente como enteros (con los valores 1 y 0). Este es un ejemplo de polimorfismo.

Un uso común de tokens aleatorios es en las URL de restablecimiento de contraseña para sitios web. Veamos un ejemplo de cómo podemos generar una URL de este tipo:

In [31]:
import secrets

def get_reset_pwd_url(token_length=16):
    token = secrets.token_urlsafe(token_length)
    return f'https://example.com/reset-pwd/{token}'
        
print(f"{get_reset_pwd_url() = }")

get_reset_pwd_url() = 'https://example.com/reset-pwd/srIO0Y4GYErcNCdlTKDsPw'


## Comparación de resúmenes
Probablemente esto sea bastante sorprendente, pero el módulo `secrets` también proporciona una función `compare_digest(a, b)`, que es el equivalente a comparar dos resúmenes simplemente haciendo a == b. Entonces, ¿por qué necesitaríamos esa función? Es porque ha sido diseñada para evitar ataques de tiempo. Este tipo de ataques pueden inferir información sobre dónde comienzan a ser diferentes los dos resúmenes, según el tiempo que tarda la comparación en fallar. Entonces, `compare_digest()` previene este ataque eliminando la correlación entre el tiempo y los fallos. Creemos que este es un ejemplo brillante de lo sofisticados que pueden ser los métodos de ataque.

# JSON Web Token
Un JSON Web Token, o JWT, es un estándar abierto basado en JSON para crear tokens que afirman una serie de notificaciones. Los JWT se utilizan con frecuencia como tokens de autenticación. En este contexto, las notificaciones suelen ser instrucciones sobre la identidad y los permisos de un usuario autenticado. Los tokens están firmados criptográficamente, lo que permite verificar que el contenido del token no se ha modificado desde su emisión. Puede obtener más información sobre esta tecnología en el sitio web (https://jwt.io/).

Este tipo de token se compone de tres secciones, separadas por un punto, en el formato `A.B.C`. `B` es la carga útil, que es donde colocamos las reclamaciones. `C` es la firma, que se utiliza para verificar la validez del token, y `A` es un encabezado, que identifica el token como un JWT e indica el algoritmo utilizado para calcular la firma. A, B y C están codificados con una codificación `Base64` segura para URL (a la que nos referiremos como `Base64URL`). La codificación `Base64URL` permite utilizar JWT como parte de las URL (normalmente como parámetros de consulta); sin embargo, los JWT también aparecen en muchos otros lugares, incluidos los encabezados HTTP.

Base64 es un esquema de codificación de binario a texto muy popular que representa datos binarios en un formato de cadena ASCII traduciéndolos a una representación de base 64. La representación de la base 64 utiliza las letras A-Z, a-z y los dígitos del 0 al 9, más los dos símbolos + y / para un total de 64 símbolos. Base64 se utiliza, por ejemplo, para codificar imágenes adjuntas en un correo electrónico. Sucede sin problemas, por lo que la gran mayoría de las personas son completamente ajenas a este hecho. Base64URL es una variante de la codificación Base64 en la que los caracteres + y / (que tienen significados específicos en el contexto de una URL) se sustituyen por - and _. El carácter = (que se usa para el relleno en Base64) también tiene un significado especial dentro de las URL y se omite en Base64URL.

La forma en que funciona este tipo de token es ligeramente diferente a lo que hemos visto hasta ahora en esta sesión. De hecho, la información que lleva el token siempre es visible. Solo hay que decodificar A y B de Base64URL para obtener el algoritmo y la carga útil. La seguridad reside en la parte C, que es una firma HMAC del encabezado y la carga útil. Si intenta modificar la parte A o B editando el encabezado o la carga útil, codificándolo de nuevo a Base64URL y reemplazándolo en el token, la firma no coincidirá y, por lo tanto, el token no será válido.

Esto significa que podemos crear una carga útil con afirmaciones como logged in as admin, o algo por el estilo, y siempre que el token sea válido, sabemos que podemos confiar en que ese usuario realmente ha iniciado sesión como administrador.

Al tratar con JWT, debe asegurarse de haber investigado cómo manejarlos de manera segura. Cosas como no aceptar tokens sin firmar o restringir la lista de algoritmos que usa para codificar y decodificar, así como otras medidas de seguridad, son muy importantes y debe tomarse el tiempo para investigarlas y aprenderlas.

Para esta sencillo ejemplo, tendrás que tener instalados los paquetes PyJWT y cryptography Python:

In [32]:
# pip install PyJWT cryptography
import jwt

data = {'payload': 'data', 'id': 123456789}

token = jwt.encode(data, 'secret-key')
algs = ['HS256', 'HS512']

data_out = jwt.decode(token, 'secret-key', algorithms=algs)

print(f"{token = }")
print(f"{data_out = }")

token = 'eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJwYXlsb2FkIjoiZGF0YSIsImlkIjoxMjM0NTY3ODl9.4l1UEd2u_i2JxzJArvDlwRVt1XtX4eyLs2TsndrwNdQ'
data_out = {'payload': 'data', 'id': 123456789}


Definimos la carga útil de datos, que contiene un ID y algunos datos de la carga útil. Creamos un token utilizando la función `jwt.encode()`, que toma la carga útil y una clave secreta. La clave secreta se utiliza para generar la firma HMAC del encabezado y la carga útil del token. A continuación, decodificamos el token nuevamente, especificando los algoritmos de firma que estamos dispuestos a aceptar. El algoritmo predeterminado utilizado para calcular el token es HS256; en este ejemplo, aceptamos HS256 o HS512 al decodificar (si el token se hubiera generado utilizando un algoritmo diferente, se rechazaría con una excepción).

Como puede ver, el token es una cadena binaria de fragmentos de datos codificados en `Base64URL`. Llamamos a `jwt.decode()`, proporcionando la clave secreta correcta. Si hubiéramos proporcionado la clave incorrecta, habríamos obtenido un error, ya que la firma solo se puede verificar con el mismo secreto que se utilizó para generarla.

Los JWT se utilizan a menudo para transmitir información entre dos partes. Por ejemplo, los protocolos de autenticación que permiten a los sitios web confiar en proveedores de identidad de terceros para autenticar a los usuarios. En estos casos, la clave secreta utilizada para firmar tokens debe compartirse entre las dos partes. Por lo tanto, a menudo se la denomina secreto compartido. Se debe tener cuidado de proteger el secreto compartido, ya que cualquiera que tenga acceso a él puede generar tokens válidos.

A veces, es posible que desee poder inspeccionar el contenido del token sin verificar primero la firma. Puede hacerlo simplemente llamando a decode() de esta manera:

In [33]:
jwt.decode(token, options={'verify_signature': False})

{'payload': 'data', 'id': 123456789}

Esto es útil, por ejemplo, cuando se necesitan valores en la carga útil del token para recuperar la clave secreta, pero esa técnica es bastante avanzada, por lo que no dedicaremos tiempo a ella en este contexto. En cambio, veamos cómo podemos especificar un algoritmo diferente para calcular la firma:

In [35]:
token512 = jwt.encode(data, 'secret-key', algorithm='HS512')
data_out = jwt.decode(token512, 'secret-key', algorithms=['HS512'])
print(f"{data_out = }")

data_out = {'payload': 'data', 'id': 123456789}


Aquí hemos utilizado el algoritmo HS512 para generar el token y, al decodificarlo, especificamos que solo aceptaríamos tokens generados con el algoritmo HS512. El resultado es nuestro diccionario de carga útil original.

Ahora bien, si bien usted es libre de poner lo que quiera en la carga útil del token, hay algunas afirmaciones que se han estandarizado y le permiten tener un gran control sobre el token.

## Reclamaciones registradas
El estándar JWT define las siguientes reclamaciones registradas oficialmente:
- **iss:** El emisor del token
- **sub:** La información del asunto sobre la parte sobre la que este token lleva información
- **aud:** La audiencia del token
- **exp:** El tiempo de expiración, después del cual se considera que el token no es válido
- **nbf:** El no antes (tiempo), o el tiempo antes del cual el token aún no se considera válido
- **iat:** La hora en la que se emitió el token
- **jti:** El ID del token

Las reclamaciones que no están definidas en la norma se pueden clasificar como públicas o privadas:
- **Público:** Créditos que se asignan públicamente para un fin determinado. Los nombres de notificaciones públicas se pueden reservar registrándolos en el Registro de notificaciones de tokens web JSON de la IANA. Alternativamente, las reivindicaciones deben nombrarse de manera que garanticen que no entren en conflicto con ningún otro nombre de reivindicación público u oficial (una forma de lograr esto podría ser anteponer un nombre de dominio registrado al nombre de reivindicación).
- **Privadas:** Cualquier otra reclamación que no se incluya en las categorías anteriores se denomina reclamación privada. El significado de tales afirmaciones se define típicamente dentro del contexto de una aplicación particular y carecen de sentido fuera de ese contexto. Para evitar ambigüedades y confusiones, se debe tener cuidado de evitar choques de nombres.

Para obtener más información sobre las reclamaciones, consulte el sitio web oficial. Ahora, veamos un par de ejemplos de código que involucran un subconjunto de estas afirmaciones.

### Reclamaciones relacionadas con el tiempo
Veamos cómo podríamos usar las afirmaciones relacionadas con el tiempo:

In [37]:
from datetime import datetime, timedelta, timezone
from time import sleep, time
import jwt

iat = datetime.now(tz=timezone.utc)
nfb = iat + timedelta(seconds=1)
exp = iat + timedelta(seconds=3)
data = {'payload': 'data', 'nbf': nfb, 'exp': exp, 'iat': iat}

def decode(token, secret):
    print(time())
    try:
        print(jwt.decode(token, secret, algorithms=['HS256']))
    except (
        jwt.ImmatureSignatureError, jwt.ExpiredSignatureError
    ) as err:
        print(err)
        print(type(err))

secret = 'secret-key'
token = jwt.encode(data, secret)

decode(token, secret)

sleep(2)
decode(token, secret)

sleep(2)
decode(token, secret)

1726458655.5977807
The token is not yet valid (nbf)
<class 'jwt.exceptions.ImmatureSignatureError'>
1726458657.5992112
{'payload': 'data', 'nbf': 1726458656, 'exp': 1726458658, 'iat': 1726458655}
1726458659.599708
Signature has expired
<class 'jwt.exceptions.ExpiredSignatureError'>


En este ejemplo, establecemos la reivindicación issued at (iat) a la hora UTC actual (UTC significa Tiempo Universal Coordinado). A continuación, establecemos la hora de no antes de (nbf) y la hora de caducidad (exp) en 1 y 3 segundos a partir de ahora, respectivamente. Definimos una función de ayuda `decode()` que reacciona ante un token que aún no es válido o que ha expirado, atrapando las excepciones apropiadas, y luego la llamamos tres veces, intercalando dos llamadas a `sleep()`.

De este modo, intentaremos descodificar el token antes de que sea válido, después cuando sea válido y, por último, después de que haya caducado. Esta función también imprime una marca de tiempo útil antes de intentar decodificar el token.

Como puedes ver, todo se ejecutó como se esperaba. Obtenemos mensajes descriptivos de las excepciones y recuperamos el payload original cuando el token es realmente válido.

### Reclamaciones relacionadas con la autenticación
Veamos otro ejemplo rápido relacionado con las declaraciones de emisor (issuer) y audiencia (audience). El código es conceptualmente muy similar al del ejemplo anterior, y vamos a ejercitarlo de la misma manera:

In [38]:
import jwt

data = {'payload': 'data', 'iss': 'hein', 'aud': 'learn-python'}
secret = 'secret-key'
token = jwt.encode(data, secret)

def decode(token, secret, issuer=None, audience=None):
    try:
        print(jwt.decode(token, secret, issuer=issuer,
                         audience=audience, algorithms=["HS256"]))
    except (
        jwt.InvalidIssuerError, jwt.InvalidAudienceError
    ) as err:
        print(err)
        print(type(err))

decode(token, secret)

# no proporcionar el emisor no se romperá
decode(token, secret, audience='learn-python')

# no proporcionar la audiencia se romperá
decode(token, secret, issuer='hein')

# ambos se romperán
decode(token, secret, issuer='wrong', audience='learn-python')
decode(token, secret, issuer='hein', audience='wrong')

decode(token, secret, issuer='hein', audience='learn-python')

Invalid audience
<class 'jwt.exceptions.InvalidAudienceError'>
{'payload': 'data', 'iss': 'hein', 'aud': 'learn-python'}
Invalid audience
<class 'jwt.exceptions.InvalidAudienceError'>
Invalid issuer
<class 'jwt.exceptions.InvalidIssuerError'>
Audience doesn't match
<class 'jwt.exceptions.InvalidAudienceError'>
{'payload': 'data', 'iss': 'hein', 'aud': 'learn-python'}


Como puede ver, esta vez hemos especificado emisor y audiencia. Resulta que si no proporcionamos el emisor al decodificar el token, no causará que la decodificación se rompa. Sin embargo, si proporcionamos el emisor incorrecto, la descodificación se romperá. Por otro lado, tanto el no proporcionar la audiencia, como el proporcionar la audiencia equivocada, romperá la decodificación.

Como en el ejemplo anterior, hemos escrito una función `decode()` personalizada que reacciona a las excepciones apropiadas.

## Utilización de algoritmos asimétricos (de clave pública)
A veces, utilizar un secreto compartido no es la mejor opción. En tales casos, es posible utilizar un par de claves asimétricas en lugar de HMAC para generar la firma JWT. En este ejemplo, vamos a crear un token (y descodificarlo) utilizando un par de claves RSA.

La criptografía de clave pública, o criptografía asimétrica, es cualquier sistema criptográfico que utiliza pares de claves: claves públicas que pueden difundirse ampliamente, y claves privadas que sólo conoce el propietario. Se puede generar una firma utilizando la clave privada, y la clave pública se puede utilizar para verificar la firma. Así, dos partes pueden intercambiar JWTs y las firmas pueden ser verificadas sin necesidad de un secreto compartido.

Ahora, vamos a crear un par de claves RSA. Vamos a utilizar la utilidad ssh-keygen de OpenSSH (https://www.ssh.com/ssh/keygen/) para hacerlo. En la carpeta donde están nuestros scripts para este capítulo, creamos una subcarpeta jwt/rsa usando `mkdir -p jwt/rsa` en el terminal; luego, ejecuta lo siguiente:
`ssh-keygen -t rsa -m PEM -f jwt/rsa/key`.

Lo que estamos haciendo es lo siguiente:
- **t rsa:** Genera un par de claves RSA.
- **m PEM:** Especifica que las claves se deben guardar en el formato PEM, que es comúnmente usado para JWT.
- **f jwt/rsa/key:** Guarda las claves en el archivo jwt/rsa/key. Este archivo será la clave privada, y el archivo jwt/rsa/key.pub será la clave pública.
- 
Cuando te pregunte por el nombre del archivo, simplemente confirma con Enter si ya has proporcionado el archivo en la opción -f y cuando te pregunte una contraseña, presiona Enter para dejarla en blanco (sin passphrase).

In [4]:
import jwt

data = {'payload': 'data'}

def encode(data, priv_filename, algorithm='RS256'):
    with open(priv_filename, 'rb') as key:
        private_key = key.read()
    return jwt.encode(data, private_key, algorithm=algorithm)

def decode(data, pub_filename, algorithm='RS256'):
    with open(pub_filename, 'rb') as key:
        public_key = key.read()
    return jwt.decode(data, public_key, algorithms=[algorithm])

token = encode(data, 'jwt/rsa/key')
data_out = decode(token, 'jwt/rsa/key.pub')
print(data_out)

{'payload': 'data'}


En este ejemplo, definimos un par de funciones personalizadas para codificar y decodificar tokens utilizando claves privadas/públicas. Como puedes ver en la función `encode()`, estamos usando el algoritmo RS256 esta vez. Observe que cuando codificamos, proporcionamos la clave privada, que se utiliza para generar la firma JWT. Cuando decodificamos el JWT, proporcionamos la clave pública, que se utiliza para verificar la firma.

# Referencias útiles
Aquí encontrará una lista de referencias útiles si desea profundizar en el fascinante mundo de la criptografía (obtenida del libro Learn Python Programming, cuyos autores son: Fabrizio Romano y Heinrich Kruger):
- Criptografía: https://en.wikipedia.org/wiki/Cryptography
- Tokens Web JSON: https://jwt.io
- RFC estándar para tokens web JSON: https://datatracker.ietf.org/doc/html/rfc7519
- Funciones hash: https://en.wikipedia.org/wiki/Cryptographic_hash_función
- HMAC: https://en.wikipedia.org/wiki/HMAC
- Servicios de criptografía (biblioteca Python STD): https://docs.python.org/es/3/library/crypto.html
- Registro IANA de reclamaciones de tokens web JSON: https://www.iana.org/assignments/jwt/jwt.xhtml
- Biblioteca PyJWT: https://pyjwt.readthedocs.io/
- Biblioteca de criptografía: https://cryptography.io/en/stable/

Hay mucha más información en la web, y un montón de libros que también puedes estudiar, pero te recomendamos que empieces por los conceptos principales y luego te sumerjas poco a poco en los aspectos específicos que quieras entender más a fondo.