# Introducción

## Redes Neuronales

Las redes neuronales son un modelo matemático que nos permite aproximar una función. Tienen similitud a las neuronas del cerebro en el sentido que ambas reciben varias entradas, realizan un cálculo y determinan una salida la cual es entrada para otras neuronas. 

En la siguiente imagen encontrarás una neurona simple, también conocida como perceptrón.

<img src="archivos/simple_neuron.png">
Imagen tomada de [Udacity]


Podemos ver la salida del perceptrón como una secuencia de operaciones, primero se calcula $h$ a partir del producto punto, entre las entradas $X$ y los pesos $W$, sumado a el sesgo $b$, es decir

$$h = MX + b$$

despúes se 'pasa' $h$ por una función de activación que transforma el valor,

$$y = f(h)$$






## Tensores en Pytorch

Los tensores son una generalización de los vectores y matrices. Cuando hablamos de un tensor de una dimensión nos estamos refierendo a un vector que puede tener $n$ elementos. Podemos tener tensores de varias dimensiones, por ejemplo una matriz 2D sería un tensor 2D y así sucesivamente. Los tensores son la base de muchos paquetes de para programar deep learning, debido a que las redes neuronales son ¡un montón de operaciones matriciales!, además mantienen la conección en el grafo y permiten la implementación del gradiente descendiente. Asi que es indispensable tener una representación adecuada para reducir el tiempo de entrenamiento. 

Sin más preámbulo vayamos a la programación.

In [18]:
# Primero importemos los paquetes necesarios

%matplotlib inline
%config InlineBackend.figure_format = 'retina'

import numpy as np
print(np.__version__)
import torch
print(torch.__version__)

1.21.5
1.13.1


Comenzemos a explorar los tensores. Creemos unos tensores y realizemos algunas opereaciones entre ellos.

In [19]:
# Tensor de 4 por 2 elementos relleno de unos
y = torch.ones(4,2)

r = torch.ones(3,3)

print(y)
print(r)

tensor([[1., 1.],
        [1., 1.],
        [1., 1.],
        [1., 1.]])
tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]])


In [20]:
# operación entre tensores

z = y + y + y
print(z)

tensor([[3., 3.],
        [3., 3.],
        [3., 3.],
        [3., 3.]])


In [21]:
# acceder a los elementos de un tensor
z[1][1]

tensor(3.)

In [22]:
z[:,1:]

tensor([[3.],
        [3.],
        [3.],
        [3.]])

### Reshape

Una de las cosas más comunes que realizaŕas con los tensores es consultar su 'forma' es decir, la cantidad de elementos que hay en él, para tal función existe *.size()* 

Si deseamos cambiar la forma del tensor entonces utilizaremos *.resize_()* Observa que el guión bajo indica que se va a modificar el tensor en sí, si no utilizamos el guión bajo se creará un nuevo tensor.

In [23]:
z.size()

torch.Size([4, 2])

In [24]:
z.resize_(3,3)

tensor([[3.0000e+00, 3.0000e+00, 3.0000e+00],
        [3.0000e+00, 3.0000e+00, 3.0000e+00],
        [3.0000e+00, 3.0000e+00, 5.8451e-36]])

### Pasando Tensores a Numpy

Antes de hacer el entrenamiento de una red es muy probable que tengamos que hacer un preprocesamiento de los datos. Usualmente, el procesamiento se hace en numpy por facilidad además que tenemos muchísimas herramientas disponibles. Afortunadamente, pytorch provee una funciones para poder convertir entre formatos de forma casi directa. Para convetir de numpy a tensor usamos *torch.from_numpy()* y para retornar de torch a numpy utilizamos el método *.numpy()*

In [25]:
# generemos un array en numpy
a = np.random.rand(4,3)
print(a)


[[0.4377701  0.33680366 0.60851603]
 [0.2469644  0.27644237 0.24265467]
 [0.05666639 0.67005403 0.85289563]
 [0.68112643 0.20200113 0.08391637]]


In [26]:
# convertir a pytorch
A = torch.from_numpy(a)
print(A)

tensor([[0.4378, 0.3368, 0.6085],
        [0.2470, 0.2764, 0.2427],
        [0.0567, 0.6701, 0.8529],
        [0.6811, 0.2020, 0.0839]], dtype=torch.float64)


In [27]:
# convertir a numpy
b = A.numpy()
print(b)

[[0.4377701  0.33680366 0.60851603]
 [0.2469644  0.27644237 0.24265467]
 [0.05666639 0.67005403 0.85289563]
 [0.68112643 0.20200113 0.08391637]]


Advertencia! Ten cuidado por que resulta que las variables convertidas de pytorch a numpy comparte memoria asi que si modificas uno se modificará el otro!

In [28]:
print(A)

tensor([[0.4378, 0.3368, 0.6085],
        [0.2470, 0.2764, 0.2427],
        [0.0567, 0.6701, 0.8529],
        [0.6811, 0.2020, 0.0839]], dtype=torch.float64)


In [29]:
# multipliquemos el tensor
A.mul_(2)
print(A)

tensor([[0.8755, 0.6736, 1.2170],
        [0.4939, 0.5529, 0.4853],
        [0.1133, 1.3401, 1.7058],
        [1.3623, 0.4040, 0.1678]], dtype=torch.float64)


ahora observemos el array

In [30]:
a

array([[0.8755402 , 0.67360732, 1.21703206],
       [0.4939288 , 0.55288474, 0.48530935],
       [0.11333279, 1.34010805, 1.70579126],
       [1.36225285, 0.40400226, 0.16783275]])

### Perceptrón

Ejercicio: implementa un perceptrón utilizando funciones de PyTorch

In [31]:
# Implementa un perceptrón
x_np = np.array([2.0, 3.0, 4.0])
w_np = np.array([0.1, 0.1, 0.2])
b_np = np.array([1.0])

# en numpy seria
h_np = None
print(h_np)

# Convierte los vectores a tensores de pytorch
X = torch.from_numpy(x_np)
print(X)
W = torch.from_numpy(w_np)
print(W)
B = torch.from_numpy(b_np)
print(B)

None
tensor([2., 3., 4.], dtype=torch.float64)
tensor([0.1000, 0.1000, 0.2000], dtype=torch.float64)
tensor([1.], dtype=torch.float64)


In [32]:
# realiza las operaciones necesarias y calcula la combinación lineal h
# algunas funciones útiles son torch.add() y torch.dot()
H =  torch.add(torch.dot(W,X),B)
print(H)


tensor([2.3000], dtype=torch.float64)


In [33]:
# Pasa h por la función de activación segmoide torch.sigmoid()
Y = torch.sigmoid(H)
print(Y)

tensor([0.9089], dtype=torch.float64)


In [34]:
# Finalmente regresamos el tensor a un array de numpy
y_np = Y.numpy()
print(y_np)

[0.90887704]
