## Explicit Implementation Of Dropout

In [80]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import numpy as np

In [2]:
#definimos la probabilidad de mantener los nodos en cada epoch
prob = 0.5

dropout = nn.Dropout(p=prob) #0.5% por defecto

In [72]:
#creamos unos datos de ejemplo
x = torch.ones(10)

#aplicamos a estos valores dropout (imaginemos que estos son los pesos de 10 nodos)
y = dropout(x)

In [73]:
x

tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

Recordamos que, PyTorch implementa la "2da solución" dentro de la implementación de dropout, ya que, aquellos nodos cuyos pesos no han sido "abandonados/inhibidos", serán escalados hacia arriba por el factor `1/(1-prob)`

In [74]:
1/(1-prob) #entonces, multiplicará los pesos que no sean inhibidos por este factor

2.0

**Para cada peso, se decide aleatoriamente con un 0.5% de probabilidad, si será inhibido o no durante la epoch actual**

In [75]:
torch.mean(y)

tensor(1.6000)

In [76]:
y

tensor([2., 2., 2., 2., 0., 0., 2., 2., 2., 2.])

In [19]:
#si multiplicamos el vector resultante del dropout, por el inverso de la ecuación de escalamiento
#obtendremos el vector original

#y*(1-prob)

Vemos, que en estos datos de prueba, que simulamos que eran 10 pesos de 10 nodos de una red, (todos valiendo 1), y con una probabilidad de dropout del 0.5%, ahora han sido transformados en lo que se esperaba. **Esto simularía una epoch de entrenamiento aplicando dropout**

- De los 10 "pesos" de nodos que teníamos simulados, se inhibieron aleatoriamente algunos con una probabilidad de 0.5%

- Los nodos que no fueron abandonados, fueron incrementados por el factor implementado (el cual se implementa en entrenamiento). Si el factor resulta ser de 2, y todos los pesos valían 1, efectivamente vemos aquellos nodos no inhibidos que son 2

In [77]:
dropout.eval() #activamos el modo evaluación (finaliza los procesos como dropout...etc)

Dropout(p=0.5, inplace=False)

Activando el modo `eval()`, finalizará los procesos de dropout...etc

In [81]:
y = dropout(x)
print(y)
print(torch.mean(y))

tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
tensor(1.)


Efectivamente, ahora no aplica ningún tipo de dropout, el vector de "pesos" simulados permanece igual

**Sin embargo, usando `F.dropout()`, veremos que esta función no tiene en cuenta el modo eval()**

In [83]:
dropout.eval()
y = F.dropout(x)
print(y)
print(torch.mean(y))

tensor([0., 2., 2., 0., 2., 2., 2., 2., 0., 2.])
tensor(1.4000)


Dicha función, `F.dropout()` puede ser también desactivada para testing de esta forma:

In [84]:
dropout.eval()
y = F.dropout(x, training=False) #así
print(y)
print(torch.mean(y))

tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
tensor(1.)


Si volvemos a activar el modo entrenamiento usando `train()` sobre el objeto dropout, dicha operación volverá a realizarse

In [85]:
dropout.train() #con dropout
y = dropout(x)
print(f"train() mode ON {y}")

dropout.eval() #sin dropout
y = dropout(x)
print(f"train() mode OFF {y}")

y = dropout(x)
print(f"train() mode remains OFF {y}")

train() mode ON tensor([0., 0., 2., 2., 2., 2., 0., 2., 2., 0.])
train() mode OFF tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
train() mode remains OFF tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
