# Neural Networks con Flux 

Flux es un paquete muy importante en Julia para machine learning.
Dispone de la velocidad de TensorFlow y una interfaz simple como Keras.

You can read more about it here: https://fluxml.ai/Flux.jl/stable/ 

In [1]:
# ] add Flux

In [2]:
using Flux 

## Elementos matemáticos (Core) de Flux 

In [3]:
f(x) = 3x^2 + 2x + 1;      # gradiente 6x+2

In [4]:
gradient(f, 2)

(14.0,)

In [5]:
df(x) = gradient(f, x)[1];

In [6]:
df(2)

14.0

## Multiples Parametros para Funciones 

In [7]:
f(x, y) = sum((x .- y) .^ 2);        # lo pasamos como vectores 

In [8]:
w = [2, 1];
b = [2, 0]; 

In [9]:
gradient(f, w, b)                    # se necesitan 2 vectores 

([0.0, 2.0], [-0.0, -2.0])

In [10]:
gs = gradient(params(w, b)) do       # calcular el gradiente de estos 2 parametros
         f(w, b)                     
     end

LoadError: UndefVarError: params not defined

In [11]:
gs.grads

LoadError: UndefVarError: gs not defined

In [12]:
gs[w]

LoadError: UndefVarError: gs not defined

In [13]:
gs[b]

LoadError: UndefVarError: gs not defined

## Modelado basico con Flux 

In [14]:
W = rand(2, 5)         # Weights
b = rand(2)            # biases 

2-element Vector{Float64}:
 0.8017014556797041
 0.05739906395553884

In [15]:
predict(x) = W*x .+ b      # forward pass

predict (generic function with 1 method)

In [16]:
function loss(x, y)
  ŷ = predict(x)           # escrito como y\hat [tab]
  sum((y .- ŷ).^2)
end

loss (generic function with 1 method)

In [17]:
x, y = rand(5), rand(2) # Dummy data

([0.19277366139550767, 0.4034014117401761, 0.7671113314410825, 0.9151545728965353, 0.9033253348056207], [0.39727160448667886, 0.15558694438897425])

In [18]:
loss(x, y)       

6.194740984414782

In [19]:
gs = gradient(params(W, b)) do       
        loss(x, y)                  
     end 

LoadError: UndefVarError: params not defined

In [20]:
# Tambien se puede escribir asi:  
gs = gradient(() -> loss(x, y), params(W, b))

LoadError: UndefVarError: params not defined

In [21]:
gs.grads

LoadError: UndefVarError: gs not defined

In [22]:
W̄ = gs[W]               # \bar 

LoadError: UndefVarError: gs not defined

In [23]:
# Actualicemos los weights y biases con gradientes

In [24]:
W .-= 0.1 .* W̄

LoadError: UndefVarError: W̄ not defined

In [25]:
loss(x, y)     # la pérdida disminuye

6.194740984414782

In [26]:
# se puede actualizar el bias
b̄ = gs[b]
b .-= 0.1 .* b̄

LoadError: UndefVarError: gs not defined

In [27]:
loss(x, y)     # aun mejor

6.194740984414782

Esto fue una manera sencilla de construir una red neuronal de 1 capa (o perceptron). Es como TensorFlow pero sin todo el codigo necesario. Vamos a agregar más capas.

In [28]:
W = rand(2, 5)         # Weights
b = rand(2)            # biases 

predict(x) = W*x .+ b  

function loss(x, y)
  ŷ = predict(x)           # y\hat [tab]
  sum((y .- ŷ).^2)
end

x, y = rand(5), rand(2) # Dummy data
loss(x, y) 

4.857633786918436

In [29]:
gs = gradient(() -> loss(x, y), params(W, b))
W̄ = gs[W] 
W .-= 0.1 .* W̄

b̄ = gs[b]

b .-= 0.1 .* b̄
loss(x, y) 

LoadError: UndefVarError: params not defined