## ¿Qué es np.memmap?

La función np.memmap de NumPy nos permite crear una matriz que está respaldada por un archivo en el disco en lugar de por la memoria del sistema. Esto puede ser útil cuando tenemos archivos de datos muy grandes que no caben en la memoria RAM del sistema, pero necesitamos acceder a ellos de manera eficiente. Con np.memmap, podemos crear una vista a un archivo y trabajar con los datos como si estuvieran almacenados en memoria.

## ¿Cómo usar np.memmap?

La sintaxis básica para crear un objeto np.memmap es la siguiente:

```python
np.memmap(filename, dtype='float32', mode='r+', shape=(M, N))
```

- filename: el nombre del archivo en el disco
- dtype: el tipo de datos de los elementos de la matriz (por defecto 'float32')
- mode: el modo en que se va a abrir el archivo ('r+' para lectura/escritura, 'r' para sólo lectura)
- shape: la forma de la matriz a crear

Una vez que hemos creado un objeto np.memmap, podemos trabajar con él como lo haríamos con cualquier otra matriz de NumPy. Por ejemplo, podemos acceder a los elementos de la matriz de la siguiente manera:

```python
# Crear un objeto np.memmap
data = np.memmap('datos.dat', dtype='float32', mode='r+', shape=(1000, 1000))

# Acceder a un elemento de la matriz
print(data[0, 0])
```

## ¿Por qué usar np.memmap?

La ventaja de usar np.memmap es que podemos trabajar con archivos de datos muy grandes sin tener que cargarlos completamente en la memoria RAM del sistema. Esto puede ser especialmente útil en aplicaciones que requieren el procesamiento de grandes conjuntos de datos, como en el caso de la ciencia de datos o el aprendizaje automático. Al utilizar np.memmap, podemos acceder a los datos de manera eficiente sin tener que preocuparnos por la limitación de la memoria RAM.

## Ejemplo de uso de np.memmap

```python
# Crear un archivo de datos de ejemplo
with open('datos.dat', 'wb') as f:
    data = np.random.rand(1000, 1000)
    data.tofile(f)

# Crear un objeto np.memmap
data = np.memmap('datos.dat', dtype='float64', mode='r+', shape=(1000, 1000))

# Sumar 1 a cada elemento de la matriz
data += 1

# Calcular la media de la matriz
print(np.mean(data))
```

En este ejemplo, creamos un archivo de datos aleatorios y lo cargamos en un objeto np.memmap. Luego, sumamos 1 a cada elemento de la matriz y calculamos la media. Como puede ver, el uso de np.memmap nos permite trabajar con archivos grandes de manera eficiente y sin tener que preocuparnos por la limitación de la memoria RAM.

# Clases y Métodos en Python

En Python, una clase es un tipo de dato que permite encapsular datos y funciones en un solo objeto. Los objetos de una clase se llaman instancias y cada instancia tiene sus propios atributos y métodos. Los atributos son variables que contienen datos y los métodos son funciones que trabajan con los datos.

## Definición de una clase

Para definir una clase en Python se utiliza la palabra clave `class`, seguida del nombre de la clase en CamelCase (la primera letra de cada palabra en mayúscula) y los dos puntos. Dentro de la clase se definen los atributos y los métodos de la siguiente forma:

```python
class NombreDeLaClase:
    
    # Atributos
    atributo1 = valor1
    atributo2 = valor2
    
    # Métodos
    def nombre_del_metodo(self, parametro1, parametro2):
        # Cuerpo del método
```

Los atributos se definen como variables dentro de la clase, con un nombre y un valor asignado. Los métodos se definen como funciones dentro de la clase, utilizando la sintaxis estándar de Python para definir una función. Todos los métodos deben tener al menos un parámetro, que se llama `self` y que hace referencia a la instancia de la clase que está utilizando el método.

## Instanciación de una clase

Para utilizar una clase es necesario crear una instancia de la misma. Para crear una instancia se utiliza el nombre de la clase seguido de los paréntesis, como si fuera una función:

```python
mi_instancia = NombreDeLaClase()
```

## Atributos

Los atributos de una instancia de una clase se pueden acceder y modificar utilizando la sintaxis de punto:

```python
mi_instancia.atributo1 = nuevo_valor1
valor = mi_instancia.atributo2
```

## Métodos

Los métodos de una clase se pueden utilizar utilizando la sintaxis de punto, pasando los parámetros necesarios:

```python
mi_instancia.nombre_del_metodo(parametro1, parametro2)
```

## Ejemplo

Veamos un ejemplo sencillo para entender mejor cómo funcionan las clases y los métodos en Python. Vamos a crear una clase que representa a una persona, con dos atributos (nombre y edad) y dos métodos (uno para imprimir el nombre y otro para incrementar la edad en uno):

```python
class Persona:
    
    # Atributos
    nombre = ''
    edad = 0
    
    # Métodos
    def imprimir_nombre(self):
        print('Mi nombre es', self.nombre)
    
    def incrementar_edad(self):
        self.edad += 1
        print('Mi edad es', self.edad)
```

Ahora vamos a crear una instancia de esta clase y utilizar sus métodos y atributos:

```python
# Creamos una instancia de la clase Persona
mi_persona = Persona()

# Modificamos los atributos de la persona
mi_persona.nombre = 'Juan'
mi_persona.edad = 25

# Utilizamos los métodos de la persona
mi_persona.imprimir_nombre()
mi_persona.incrementar_edad()
```

Este código imprimirá lo siguiente:

```
Mi nombre es Juan
Mi edad es 26
```

### **Numpy**

Numpy es una biblioteca de Python muy popular para cálculos científicos y matemáticos. Proporciona un poderoso objeto de matriz multidimensional y una gran cantidad de funciones matemáticas para operar en matrices. Es muy útil para realizar cálculos matemáticos y científicos, y se utiliza en una amplia variedad de campos, como la física, la biología y la informática.

Por otro lado, Torch es una biblioteca de aprendizaje profundo de código abierto basada en Lua. Fue creada originalmente para el procesamiento de señales y la visión por computadora, pero se ha expandido para incluir muchas otras áreas del aprendizaje profundo. Torch proporciona una API para construir redes neuronales y entrenar modelos, así como un conjunto de herramientas para trabajar con datos, como transformaciones de datos y cargadores de datos.

A diferencia de Numpy, que se enfoca principalmente en el cálculo numérico, Torch se enfoca específicamente en el aprendizaje profundo y proporciona herramientas para entrenar y evaluar modelos de aprendizaje profundo. También tiene una estructura de red neuronal integrada y una serie de herramientas para el procesamiento de datos, lo que lo hace más conveniente para tareas de aprendizaje profundo que Numpy.


In [None]:
import numpy as np
import torch

# crear un array en numpy
x_np = np.array([[1, 2], [3, 4]])

# convertir a tensor en PyTorch
x_torch = torch.tensor(x_np)

print("Array en numpy:")
print(x_np)

print("Tensor en PyTorch:")
print(x_torch)

### **Cuda vs CPU?**

In [None]:
import numpy as np
import torch
import time

# Creamos dos matrices de 1000x1000
a_np = np.random.rand(1000, 1000)
b_np = np.random.rand(1000, 1000)

a_torch = torch.from_numpy(a_np)
b_torch = torch.from_numpy(b_np)

# Multiplicación de matrices con NumPy
start_np = time.time()
c_np = np.dot(a_np, b_np)
end_np = time.time()

# Multiplicación de matrices con Torch + CUDA
start_torch = time.time()
a_cuda = a_torch.cuda()
b_cuda = b_torch.cuda()
c_torch = torch.mm(a_cuda, b_cuda)
c_np = c_torch.cpu().numpy()
end_torch = time.time()

print(f"Tiempo con NumPy: {end_np - start_np} segundos")
print(f"Tiempo con Torch + CUDA: {end_torch - start_torch} segundos")

Tiempo con NumPy: 0.07703661918640137 segundos
Tiempo con Torch + CUDA: 0.03894352912902832 segundos


## **¿Que es un dataloader?**

Un DataLoader en el contexto del aprendizaje profundo es una utilidad que ayuda a cargar y procesar grandes conjuntos de datos en el entrenamiento de redes neuronales.

En lugar de cargar todo el conjunto de datos en memoria, el DataLoader carga y procesa los datos de forma iterativa en lotes (batches). Esto significa que sólo se cargan y procesan los datos que se necesitan en cada momento, lo que hace que el entrenamiento sea más eficiente en cuanto al uso de la memoria y al rendimiento.

Un DataLoader típicamente toma un conjunto de datos (p. ej., imágenes, texto) y realiza las siguientes tareas:

- Cargar los datos del disco en la memoria.

- Aplicar transformaciones a los datos (p. ej., normalización, aumento de datos).

- Mezclar aleatoriamente los datos.

- Agrupar los datos en lotes (batches) de un tamaño determinado.

- Preparar los datos para su uso en la red neuronal.

En resumen, los DataLoaders son una herramienta esencial en el entrenamiento de modelos de aprendizaje profundo, ya que permiten el procesamiento eficiente de grandes conjuntos de datos, lo que a su vez conduce a una mejor generalización del modelo.


```python
import torch
from torch.utils.data import Dataset

class MyDataset(Dataset):
    def __init__(self, images, labels):
        self.images = images
        self.labels = labels
    
    def __len__(self):
        return len(self.images)
    
    def __getitem__(self, idx):
        image = self.images[idx]
        label = self.labels[idx]
        
        # Realizamos aquí cualquier preprocesamiento necesario para la imagen
        
        return image, label
```

En el método `__init__` de MyDataset, inicializamos los datos images y labels. En el método `__len__` definimos la longitud del conjunto de datos. En el método `__getitem__` obtenemos los datos de una muestra en particular, realizamos cualquier preprocesamiento necesario en la imagen y devolvemos la imagen y su etiqueta.

A continuación, creamos una instancia de MyDataset y lo pasamos al DataLoader.


```python
from torch.utils.data import DataLoader

# Definimos los datos
images = # array de imágenes
labels = # array de etiquetas

# Creamos la instancia del dataset
dataset = MyDataset(images, labels)

# Creamos el DataLoader
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)
```

En este ejemplo, definimos los datos images y labels. Creamos una instancia de MyDataset y lo pasamos al DataLoader. Especificamos el tamaño del batch como 32 y shuffle=True para que los datos se mezclen aleatoriamente en cada epoch.

Finalmente, podemos iterar a través del DataLoader para obtener los batches de datos.

```python
for batch_images, batch_labels in dataloader:
    # Entrenamos nuestro modelo utilizando los batches de datos
```

En cada iteración del loop, obtenemos un batch de imágenes y sus etiquetas. Podemos utilizar estos batches para entrenar nuestro modelo.
