In [1]:
%load_ext autoreload
%autoreload 2

from simplenn import utils
import simplenn as sn
import numpy as np

# Capa MultiplyConstant

En este ejercicio debés implementar la capa `MultiplyConstant`,  que multiplica a cada una de sus entradas por un valor constante para generar su salida. Funciona de forma similar a `AddConstant`, pero en este caso multiplica en lugar de sumar, y por ende sus derivadas son ligeramente más complicadas.

Por ejemplo, si la entrada `x` es `[3.5,-7.2,5.3]` y la capa `MultiplyConstant` se crea con la constante `2`, `y` será `[7.0,-14.4,10.6]`.

Tu objetivo es implementar los métodos `forward` y `backward` de esta capa, de modo de poder utilizarla en una red neuronal.



# Método forward

El método `forward` calcula la salida `y` en base a la entrada `x`, como explicamos antes. En términos formales,  si la constante a sumar es $C$ y la entrada a la capa es $x = [x_1,x_2,...,x_n] $, entonces la salida $y$ es:

$
y([x_1,x2,...,x_n])= [x_1*C,x_2*C,...,x_n*C]
$

Comenzamos con el método `forward` de la clase `MultiplyConstant`, que podrás encontrar en el archivo `activations.py` de la carpeta `simplenn/models`. Debés completar el código entre los comentarios:

````### COMPLETAR INICIO ###````

y

````### COMPLETAR FIN ###````

Y luego verificar con la siguiente celda una capa que multiplica por 2 y otra que multiplica por -2. Si ambos chequeos son correctos, verás dos mensajes de <span style='background-color:green;color:white; '>éxito (success)</span>.

In [2]:
x = np.array([[3.5,-7.2,5.3],
             [-3.5,7.2,-5.3]])

layer=sn.MultiplyConstant(2)
y = np.array([[  7.,  -14.4,  10.6,],
              [ -7.,   14.4, -10.6]])
utils.check_same(y,layer.forward(x))

layer=sn.MultiplyConstant(-2)
y = -np.array([[  7.,  -14.4,  10.6,],
              [ -7.,   14.4, -10.6]])
utils.check_same(y,layer.forward(x))

[42m[30mSUCCESS :)[0m Arrays are equal (tolerance 1e-12)
[42m[30mSUCCESS :)[0m Arrays are equal (tolerance 1e-12)


# Método backward

Además del cálculo de la salida de la capa, la misma debe poder propagar hacia atrás el gradiente del error de la red. Para eso, debés implementar el método `backward` que recibe $\frac{δE}{δy}$, es decir, las derivadas parciales del error respecto a la salida (gradiente) de esta capa , y devolver $\frac{δE}{δx}$, las derivadas parciales del error respecto de las entradas de esta capa. 

Para la capa `AddConstant` el cálculo del gradiente es fácil, ya que como:

$
y(x_1,x_2,...,x_n)= (x_1*C,x_2*C,...,x_n*C)
$

Entonces

$y_i(x)=x_i*C$

Y entonces

$\frac{δE}{δx_i} = \frac{δE}{δy} * \frac{δy}{δx_i}$

Como $y_i$ solo depende de $x_i$, podemos reescribir lo anterior como

$ \frac{δE}{δx_i} = \frac{δE}{δy} * \frac{δy}{δx_i} = \frac{δE}{δy_i} * \frac{δy_i}{δx_i} $

Dado que $y_i(x)=x_i*C$, entonces $\frac{δy_i}{δx_i} = C$ y por ende:
$ \frac{δE}{δx_i} = \frac{δE}{δy} * \frac{δy}{δx_i} = \frac{δE}{δy_i} * C $

Escribiendo entonces en forma vectorial para el vector x:

$ \frac{δE}{δx} = [ \frac{δE}{δy_1} *C, \frac{δE}{δy_2} *C, ..., \frac{δE}{δy_n}*C ] = \frac{δE}{δy}*C $

Con lo cual la capa simplemente propaga los gradientes de la capa siguiente, pero multiplicados por C.

Completar el código en la función `backward` de la capa `MultiplyConstant` y verificar con la celda de abajo:


In [3]:
from simplenn.utils import check_gradient


# number of random values of x and δEδy to generate and test gradients
samples = 100

input_shape=(5,2)

layer=sn.MultiplyConstant(3)
check_gradient.common_layer(layer,input_shape,samples=samples)

layer=sn.MultiplyConstant(-4)
check_gradient.common_layer(layer,input_shape,samples=samples)

[104m[30mMultiplyConstant_2 layer:[0m
[42m[30mSUCCESS[0m 1000 partial derivatives checked (100 random input samples)
[104m[30mMultiplyConstant_3 layer:[0m
[42m[30mSUCCESS[0m 1000 partial derivatives checked (100 random input samples)
