# Lab 1: Tipos y Tamaños de Datos

En este laboratorio, aprenderás sobre los tipos de datos comunes utilizados para almacenar los parámetros de los modelos de aprendizaje automático.

## Introducción a los Tipos de Datos

Antes de sumergirnos en los tipos de datos en PyTorch, es importante entender algunos conceptos básicos:

### Bits y Bytes

- **Bit**: Es la unidad mínima de información en informática, puede tener un valor de 0 o 1.
- **Byte**: Es un conjunto de 8 bits. Por ejemplo, `10101100` es un byte.

### Enteros

Los enteros pueden ser con signo (signed) o sin signo (unsigned).

- **Unsigned (sin signo)**: Solo puede representar valores positivos y cero. Ejemplo: uint8 puede representar valores de 0 a 255.
- **Signed (con signo)**: Puede representar valores positivos, negativos y cero. Ejemplo: int8 puede representar valores de -128 a 127.

### Punto Flotante

Los números de punto flotante se utilizan para representar números fraccionarios. Se almacenan en una forma que incluye una parte entera y una fracción.


## ¿Qué es bfloat16?

**bfloat16** o **Brain Floating Point 16** es un formato de punto flotante de 16 bits desarrollado por Google para mejorar el rendimiento en tareas de aprendizaje automático y redes neuronales profundas. La principal diferencia entre bfloat16 y otros formatos de punto flotante radica en cómo se distribuyen los bits para representar los números.

### Estructura de bfloat16

- **Signo**: 1 bit
- **Exponente**: 8 bits
- **Mantisa (fracción)**: 7 bits

### Comparación con fp16

**fp16** o **float16** es otro formato de punto flotante de 16 bits utilizado comúnmente para reducir el uso de memoria y aumentar la velocidad de los cálculos. La estructura de fp16 es la siguiente:

- **Signo**: 1 bit
- **Exponente**: 5 bits
- **Mantisa (fracción)**: 10 bits

### Diferencias clave entre bfloat16 y fp16

1. **Rango de exponente**: bfloat16 tiene el mismo rango de exponente que float32 debido a sus 8 bits para el exponente, mientras que fp16 tiene un rango de exponente más limitado con solo 5 bits.
2. **Precisión**: fp16 tiene más bits dedicados a la mantisa (10 bits) en comparación con bfloat16 (7 bits), lo que le da a fp16 mayor precisión para representar números pequeños.
3. **Facilidad de conversión**: bfloat16 facilita la conversión de y hacia float32 sin pérdida significativa de rango, lo cual es beneficioso para tareas de aprendizaje automático que requieren precisión en una amplia gama de valores.

### ¿Por qué se usa bfloat16 en lugar de fp32?

bfloat16 se utiliza en lugar de fp32 principalmente por las siguientes razones:

- **Reducción de memoria**: bfloat16 usa la mitad de memoria en comparación con fp32, lo cual es crucial para manejar modelos grandes y conjuntos de datos extensos.
- **Mayor velocidad de cómputo**: Los cálculos con bfloat16 pueden ser significativamente más rápidos, ya que muchas unidades de procesamiento (CPUs, GPUs, TPUs) están optimizadas para operar con este formato.
- **Mantiene un buen rango de exponente**: A diferencia de fp16, bfloat16 mantiene el mismo rango de exponente que fp32, permitiendo manejar números muy grandes y muy pequeños sin desbordamientos o subdesbordamientos frecuentes.
- **Eficiencia energética**: Operar con bfloat16 consume menos energía en comparación con fp32, lo que es importante para grandes centros de datos y aplicaciones en la nube.


## Tipos de Datos en PyTorch

En PyTorch, los tipos de datos son esenciales para definir y manipular los tensores, que son las estructuras de datos fundamentales utilizadas para almacenar los parámetros de los modelos de aprendizaje automático.

In [4]:
import torch

### Enteros

In [5]:
# Información del `entero sin signo de 8 bits`
torch.iinfo(torch.uint8)

iinfo(min=0, max=255, dtype=uint8)

In [6]:
# Información del `entero de 8 bits (con signo)`
torch.iinfo(torch.int8)

iinfo(min=-128, max=127, dtype=int8)

In [7]:
# Ahora tú, muestra la información del dato tipo `entero de 64 bits (con signo)`


In [8]:
# Muestra la información del dato tipo `entero de 32 bits (con signo)`


In [9]:
# Muestra la información del dato tipo `entero de 16 bits (con signo)`


### Puntos Flotantes

In [10]:
# Por defecto, Python almacena los datos de punto flotante en fp64
value = 1/3

In [11]:
format(value, '.60f')

'0.333333333333333314829616256247390992939472198486328125000000'

In [12]:
# Punto flotante de 64 bits
tensor_fp64 = torch.tensor(value, dtype = torch.float64)

In [13]:
print(f"tensor fp64: {format(tensor_fp64.item(), '.60f')}")

tensor fp64: 0.333333333333333314829616256247390992939472198486328125000000


In [14]:
tensor_fp32 = torch.tensor(value, dtype = torch.float32)
tensor_fp16 = torch.tensor(value, dtype = torch.float16)
tensor_bf16 = torch.tensor(value, dtype = torch.bfloat16)

In [15]:
print(f"tensor fp64: {format(tensor_fp64.item(), '.60f')}")
print(f"tensor fp32: {format(tensor_fp32.item(), '.60f')}")
print(f"tensor fp16: {format(tensor_fp16.item(), '.60f')}")
print(f"tensor bf16: {format(tensor_bf16.item(), '.60f')}")

tensor fp64: 0.333333333333333314829616256247390992939472198486328125000000
tensor fp32: 0.333333343267440795898437500000000000000000000000000000000000
tensor fp16: 0.333251953125000000000000000000000000000000000000000000000000
tensor bf16: 0.333984375000000000000000000000000000000000000000000000000000


In [16]:
# Información del `punto flotante brain de 16 bits`
torch.finfo(torch.bfloat16)

finfo(resolution=0.01, min=-3.38953e+38, max=3.38953e+38, eps=0.0078125, smallest_normal=1.17549e-38, tiny=1.17549e-38, dtype=bfloat16)

In [17]:
# Información del `punto flotante de 32 bits`
torch.finfo(torch.float32)

finfo(resolution=1e-06, min=-3.40282e+38, max=3.40282e+38, eps=1.19209e-07, smallest_normal=1.17549e-38, tiny=1.17549e-38, dtype=float32)

In [18]:
# Información del `punto flotante de 16 bits`


In [19]:
# Información del `punto flotante de 64 bits`


### Reducción de Precisión (Downcasting)

In [20]:
# Tensor aleatorio de PyTorch: float32, tamaño=1000
tensor_fp32 = torch.rand(1000, dtype=torch.float32)

# Nota: Al ser aleatorio, los valores que obtendrás serán diferentes del video.


In [21]:
# Primeros 5 elementos del tensor aleatorio
tensor_fp32[:5]

tensor([0.6588, 0.2215, 0.7244, 0.9605, 0.4518])

In [22]:
# Reducción de precisión del tensor a bfloat16 usando el método "to"
tensor_fp32_to_bf16 = tensor_fp32.to(dtype=torch.bfloat16)

In [23]:
tensor_fp32_to_bf16[:5]

tensor([0.6602, 0.2217, 0.7227, 0.9609, 0.4512], dtype=torch.bfloat16)

In [24]:
# tensor_fp32 x tensor_fp32
m_float32 = torch.dot(tensor_fp32, tensor_fp32)

In [25]:
m_float32

tensor(342.1302)

In [26]:
# tensor_fp32_to_bf16 x tensor_fp32_to_bf16
m_bfloat16 = torch.dot(tensor_fp32_to_bf16, tensor_fp32_to_bf16)

In [27]:
m_bfloat16

tensor(342., dtype=torch.bfloat16)

#### Nota
- Usarás "reducción de precisión" como una forma simple de cuantización en la próxima lección.