# Backpropagation through Back substitution with a Backslash
Notebook per il seminario d'esame per il corso di Metodi di Approssimazione 

## Algebra degli operatori

Definiamo il tipo di dato custom che rappresenta la funzione lineare

In [1]:
using LinearAlgebra

struct Operator  # Linear Matrix Operators from Matrices to Matrices (and the operator adjoint)
    op
    adj
    sym
end

## Operators
‚Ñí(A::Matrix)  = Operator(X->A*X   , X->A'*X, "‚Ñí$(size(A))"  )   # left multiply by A (X ‚Üí AX)
‚Ñõ(A::Matrix)  = Operator(X->X*A   , X->X*A', "‚Ñõ$(size(A))")     # right multiply by A (X ‚Üí XA)
‚Ñã(A::Matrix)  = Operator(X->X.*A  , X->X.*A, "‚Ñã$(size(A))")    # Hadamard product (elementwise product)
‚Ñê()  =          Operator(X->X      ,    X->X,    "I")     # identity operator
ùí™()  =           Operator(X->zero(X) , X->zero(X),"ùí™")# zero operator

ùí™ (generic function with 1 method)

Dobbiamo anche fare *overloading* delle operazioni

In [2]:
import Base:  zero, show, adjoint, *, \, ‚àò, +, -
show(io::IO, M::Operator) = print(io, M.sym)  # pretty printing
zero(::Any) = ùí™() # Let's make any undefined zero the ùí™ operator
adjoint(A::Operator) = Operator(A.adj, A.op,  "("*A.sym*")'")
adjoint(B::Bidiagonal) = Bidiagonal(adjoint.(B.dv),adjoint.(B.ev),(B.uplo == 'U') ? :L : :U) # lower to upper

-(A::Operator) = Operator(X->-A.op(X), X->-A.adj(X),"-"*A.sym)
-(::typeof(ùí™), X::Matrix) = -X # ùí™ - X should be -X
*(A::Operator, X::Matrix) = A.op(X)
\(‚Ñê::typeof(‚Ñê()), A::Matrix) = A
‚àò(A::Operator, B::Operator) = Operator(A.op ‚àò B.op, B.adj ‚àò A.adj, A.sym*"‚àò"*B.sym)
# We need [A;B]*C to somehow magically be [AC;BC]
*(M::Adjoint{Operator, Matrix{Operator}},v::Array) = M .* [v]
+(A::Array,x::Number)=A.+x

+ (generic function with 192 methods)

## Esempi

Vediamo qualche esempio.

In [4]:
# Basic Test
B = [ 1 2; 3 4]
M = [10 1;1 10]
C = [ 2 5;4 6]

LM = ‚Ñí(M)

‚Ñí(2, 2)

### `Operator * Matrix`

A parte la negazione `-`, la prima regola che abbiamo scritto √®
```
*(A::Operator, X::Matrix) = A.op(X)
```
Ossia, il prodotto tra un operatore e una matrice consiste nell'applicare l'operatore alla matrice. 

Iniziamo guardando la moltiplicazione a sinistra

In [9]:
typeof(LM), typeof(I(2))

(Operator, Diagonal{Bool, Vector{Bool}})

In [6]:
LM * [1 0; 0 1]

2√ó2 Matrix{Int64}:
 10   1
  1  10

Osserviamo che abbiamo definito il prodotto *a destra* per una matrice. Se moltiplichiamo a sinistra per una matrice, le cose non tornano 

In [53]:
try
    [1 0; 0 1] * LM
catch e
    print("Non si pu√≤ fare questa moltiplicazione. Ecco l'errore che d√†:\n\n")
    showerror(stdout, e)
end

Non si pu√≤ fare questa moltiplicazione. Ecco l'errore che d√†:

MethodError: no method matching *(::Matrix{Int64}, ::Operator)
The function `*` exists, but no method is defined for this combination of argument types.

[0mClosest candidates are:
[0m  *(::Any, ::Any, [91m::Any[39m, [91m::Any...[39m)
[0m[90m   @[39m [90mBase[39m [90m[4moperators.jl:642[24m[39m
[0m  *(::AbstractMatrix, [91m::LinearAlgebra.AbstractQ[39m)
[0m[90m   @[39m [35mLinearAlgebra[39m [90m~/.julia/juliaup/julia-1.12.4+0.x64.linux.gnu/share/julia/stdlib/v1.12/LinearAlgebra/src/[39m[90m[4mabstractq.jl:201[24m[39m
[0m  *(::AbstractMatrix, [91m::LinearAlgebra.AbstractRotation[39m)
[0m[90m   @[39m [35mLinearAlgebra[39m [90m~/.julia/juliaup/julia-1.12.4+0.x64.linux.gnu/share/julia/stdlib/v1.12/LinearAlgebra/src/[39m[90m[4mgivens.jl:20[24m[39m
[0m  ...


... e ci sono altri piccoli problemini per il fatto che abbiamo usato `Matrix` 

In [54]:
try
    LM .* I(2)
catch e
    print("No, non si pu√≤ fare:\n\n")
    showerror(stdout, e)
end

No, non si pu√≤ fare:

MethodError: no method matching length(::Operator)
The function `length` exists, but no method is defined for this combination of argument types.

[0mClosest candidates are:
[0m  length([91m::Compiler.MethodLookupResult[39m)
[0m[90m   @[39m [90mBase[39m [90m~/.julia/juliaup/julia-1.12.4+0.x64.linux.gnu/share/julia/Compiler/src/[39m[90m[4mmethodtable.jl:10[24m[39m
[0m  length([91m::Compiler.NewNodeStream[39m)
[0m[90m   @[39m [90mBase[39m [90m../usr/share/julia/Compiler/src/ssair/[39m[90m[4mir.jl:366[24m[39m
[0m  length([91m::Profile.HeapSnapshot.Edges[39m)
[0m[90m   @[39m [33mProfile[39m [90m~/.julia/juliaup/julia-1.12.4+0.x64.linux.gnu/share/julia/stdlib/v1.12/Profile/src/[39m[90m[4mheapsnapshot_reassemble.jl:24[24m[39m
[0m  ...


Ma torniamo alle cose che funzionano

In [17]:
LM * B

2√ó2 Matrix{Int64}:
 13  24
 31  42

E in effetti √® la stessa cosa che fare...

In [18]:
LM.op(B)

2√ó2 Matrix{Int64}:
 13  24
 31  42

Vediamo ora la moltiplicazione a destra

In [22]:
‚Ñõ(M) * B # i.e. ‚Ñõ(M).op(B) 

2√ó2 Matrix{Int64}:
 12  21
 34  43

In [20]:
B * M # right multiply by M

2√ó2 Matrix{Int64}:
 12  21
 34  43

La notazione appare controintuitiva, ma ha senso in realt√†: `‚Ñõ(M) * B ` denota l'applicazione dell'operatore `‚Ñõ(M)` a `B`, ovvero `‚Ñõ(M).op(B)`.

Per completezza, vediamo il prodotto di Hadamard

In [23]:
[‚Ñã(M) * B M .* B]

2√ó4 Matrix{Int64}:
 10   2  10   2
  3  40   3  40

Ricordiamo che in Julia `.*` vuol dire moltiplicazione *pointwise*

### Trasposizione di operatori

Tra le varie cose, abbiamo scritto
```
adjoint(A::Operator) = Operator(A.adj, A.op,  "("*A.sym*")'")
```
Ovvero abbiamo definito la trasposizione tra operatori. Infatti ricordiamo che in Julia `A'` essenzialmente viene tradotto in `adjoint(A)`.

Ricordiamo inoltre **finire: ' √® involutorio e ricorsivo**

Verifichiamo che la trasposizione di operatori faccia il suo dovere, ossia che 
$$\langle B, \mathcal{L}\,C\rangle=\langle\mathcal{L}'\,B, C\rangle$$
dove $\mathcal{L}'$ denota l'operatore aggiunto $\mathcal{L}^{\top}$

In [43]:
print("<B,‚ÑíC> = $(tr( B'*(‚Ñí(M)*C) )),\t <‚Ñí'B,C> = $(tr( (‚Ñí(M)'*B)' * C ))")   # <‚Ñí'B,C>

<B,‚ÑíC> = 522,	 <‚Ñí'B,C> = 522

In termini un po' pi√π "espliciti"

In [44]:
tr(B' * ‚Ñí(M).op(C)), tr( ‚Ñí(M).adj(B)' * C)

(522, 522)

### `Operator ‚àò Operator`

Un'altra importante regola che abbiamo scritto √®
```
‚àò(A::Operator, B::Operator) = Operator(A.op ‚àò B.op, B.adj ‚àò A.adj, A.sym*"‚àò"*B.sym)
```
Che definisce la composizione tra operatori

La composizione fa da prodotto nell'algebra degli endomorfismi di uno spazio vettoriale. 

Quindi potrebbe essere ragionevole denotare la composizione con `*`

In [55]:
try
    comp = ‚Ñí(M) * ‚Ñí(M)
catch e
    print("Errore!\n\n")
    showerror(stdout, e)
    println()
end

Errore!

MethodError: no method matching *(::Operator, ::Operator)
The function `*` exists, but no method is defined for this combination of argument types.

[0mClosest candidates are:
[0m  *(::Any, ::Any, [91m::Any[39m, [91m::Any...[39m)
[0m[90m   @[39m [90mBase[39m [90m[4moperators.jl:642[24m[39m
[0m  *(::Operator, [91m::Matrix[39m)
[0m[90m   @[39m [36mMain[39m [90m~/Scrivania/MA Lab/MA-project/Codice/test/[39m[90m[4mjl_notebook_cell_df34fa98e69747e1a8f8a730347b8e2f_W5sZmlsZQ==.jl:9[24m[39m
[0m  *([91m::BitMatrix[39m, [91m::UniformScaling[39m)
[0m[90m   @[39m [35mLinearAlgebra[39m [90m~/.julia/juliaup/julia-1.12.4+0.x64.linux.gnu/share/julia/stdlib/v1.12/LinearAlgebra/src/[39m[90m[4muniformscaling.jl:264[24m[39m
[0m  ...



In [None]:
comp1 = ‚Ñí(M) ‚àò ‚Ñí(M)

‚Ñí(2, 2)‚àò‚Ñí(2, 2)

In [None]:
comp1 * [1 0; 0 1]

2√ó2 Matrix{Int64}:
 101   20
  20  101

fa ci√≤ che ci si aspetta:

In [56]:
(M * M) * [1 0; 0 1]

2√ó2 Matrix{Int64}:
 101   20
  20  101

Vediamo un altro esempio

In [57]:
comp2 = ‚Ñí(M) ‚àò ‚Ñõ(C)

‚Ñí(2, 2)‚àò‚Ñõ(2, 2)

In [61]:
comp2 * B       # (‚Ñí(M) ‚àò ‚Ñõ(C))[B]

2√ó2 Matrix{Int64}:
 122  209
 230  407

Sarebbe

In [59]:
‚Ñí(M).op(‚Ñõ(C).op(B))

2√ó2 Matrix{Int64}:
 122  209
 230  407

ovvero

In [60]:
M * B * C

2√ó2 Matrix{Int64}:
 122  209
 230  407