# <font color=darkblue>Fatoração de Matrizes para Sistemas de Classificação de Machine Learning</font>
> __Trabalho para a disciplina CCM0218 (2020.2)__ <br>
Fernando Valls Yoshida (11246714) e Lucas de Sousa Rosa (11296717)

Para a realização deste trabalho, nos reunimos periodicamente para ler o material fornecido, acompanhando as passagens e discutindo os pseudo-códigos. Enquanto isso, foi elaborado este Jupyter Notebook, em que constam os códigos que escrevemos, as considerações sobre eles e o relatório das tarefas exigidas. Na ordem natural em que aparecem no texto fornecido, os temas abordados virão neste documento.

__Seção para importação das bibliotecas__

In [1]:
import numpy as np
import math

## Primeira tarefa

> Observação: em Álgebra Linear, é natural contar as posições de matrizes começando em 1, mas Numpy o faz começando em 0. Em face disso, aqui optou-se por manter a contagem da Álgebra sempre que possível. Em caso contrário, são feitas intervenções diretas no sistema de contagem, ou como ajuste geral (fazendo, e.g., $i = i - 1$ no início de um trecho de código) ou como ajuste de indexação no uso de um elemento da matriz (e.g., $W[i - 1, j - 1]$ para fazer $W_{i,j}$). Sempre que conveniente, tais medidas são apontadas no corpo do código.

__Determina os valores de cos(θ) e sin(θ), em conformidade com (3) e (4)__

In [2]:
def cos_sin(W, i, j, k):
    # ajuste de contagem
    i = i - 1
    j = j - 1
    k = k - 1
    
    if abs(W[i,k]) > abs(W[j,k]):
        t = -W[j,k]/W[i,k]
        c = 1/math.sqrt(1 + t**2)
        s = c*t
    else:
        t = -W[i, k]/W[j, k]
        s = 1/math.sqrt(1 + t**2)
        c = s*t    
    return c, s

__Rotação de Givens Q(i, j, θ) a ser aplicada em $W_{n \times m}$__

In [3]:
def rot_Givens(W, n, m, i, j, c, s):
    # ajuste de contagem
    i = i - 1
    j = j - 1
    
    for r in range(m):
        aux = c*W[i,r] - s*W[j,r]
        W[j,r] = s*W[i,r] + c*W[j,r]
        W[i,r] = aux

__Resolução de sistemas sobredeterminados__

In [4]:
eps = 10e-10
def solve(W, b, n, m):
    for k in range(1, m + 1):
        for j in range(n, k, -1):
            i = j - 1
            if abs(W[j - 1, k - 1]) > eps:
                cos, sin = cos_sin(W, i, j, k)
                rot_Givens(W, n, m, i, j, cos, sin)
                rot_Givens(b, n, 1, i, j, cos, sin)
    
    #print(W)
    for k in range(m, 0, -1):
        soma = 0
        for j in range(k + 1, m + 1):
            soma += W[k - 1, j - 1]*b[j - 1, 0]
        b[k - 1, 0] = (b[k - 1, 0] - soma)/W[k - 1, k - 1]

__Vários sistemas simultâneos__

In [5]:
eps = 10e-10
def solve_multi(W, A, n, m, p):
    for k in range(1, p + 1):
        for j in range(n, k, -1):
            i = j - 1
            if abs(W[j - 1, k - 1]) > eps:
                cos, sin = cos_sin(W, i, j, k)
                rot_Givens(W, n, p, i, j, cos, sin)
                rot_Givens(A, n, m, i, j, cos, sin)
    
    #print(W)
    for k in range(p, 0, -1):
        for j in range(1, m + 1):
            soma = 0
            for i in range(k+1,p+1):
                soma += W[k-1,i-1]*A[i-1,j-1]
            A[k-1,j-1] = (A[k-1,j-1] - soma)/W[k-1,k-1]

## Segunda tarefa

__Determina o erro quadrático $E = \| A - WH  \|^2 $__

In [6]:
def erro(A,W,H,n,m):
    E = 0
    prod = W.dot(H)
    for i in range(1,n+1):
        for j in range(1,m+1):
            E += (A[i-1,j-1] - prod[i-1,j-1])**2
    return E

__Normaliza W de tal modo que $w_{i,j} = \frac{w_{i,j}}{s_{j}}$, com $s_{j} = \sqrt{\sum_{i=1}^{n}w_{i,j}^2}$__

In [7]:
def norm(W,n,p):
    for j in range(1,p+1):
        s = 0
        for i in range(1,n+1):
            s += (W[i-1,j-1])**2
        s = math.sqrt(s)
        for i in range(1,n+1):
            W[i-1,j-1] = W[i-1,j-1]/s

__Define $H_{p \times m}$ a partir de $A_{n \times m}$. H é definido a partir da porção superior (p primeiras linhas e todas as m colunas) de A, sendo ainda que $h_{i,j} = a_{i,j}$, se e somente se $a_{i,j} \geq 0$, do contrário $h_{i,j} = 0$__

In [8]:
def set_matrix(A,p,m):
    B = np.zeros((p,m))
    for i in range(1,p+1):
        for j in range(1,m+1):
            if A[i-1,j-1] > 0:
                B[i-1,j-1] = A[i-1,j-1]
    Bt = np.transpose(B)
    return Bt

In [12]:
eps = 10e-5
it_max = 100
def NMF(A,n,m,p):
    W = np.random.rand(n,p)
    A_copia = np.copy(A)
    At_copia = np.transpose(A)
    # convenção: iteração ímpar e1, iteração par e2
    e1 = 0
    e2 = 0
    t = 0
    while ((abs(e1 - e2) < eps and t > 2) or t < it_max):
        print("e1 = {}\n e2 = {}".format(e1, e2))
        norm(W,n,p)                # normalização de W
        solve_multi(W, A, n, m, p)
        At = np.copy(At_copia)
        Ht = set_matrix(A,p,m)
        solve_multi(Ht, At, m, n, p)
        W = set_matrix(At, p, n)
        
        # erro
        if t % 2 != 0:
            e1 = erro(A_copia, W, np.transpose(Ht), n, m)
        else:
            e2 = erro(A_copia, W, np.transpose(Ht), n, m)
        
        t += 1
        if t > it_max:
            break
    
    return np.transpose(Ht), W

In [9]:
matrix = np.array([[1,2,3,-4], [5,6,-7,8],[0,17,0,0],[0,5,0,3]])
matrixt = set_matrix(matrix, 2, 4)

print("{}\n{}".format(matrix, matrixt))

[[ 1  2  3 -4]
 [ 5  6 -7  8]
 [ 0 17  0  0]
 [ 0  5  0  3]]
[[1. 5.]
 [2. 6.]
 [3. 0.]
 [0. 8.]]


In [13]:
def teste():
    A = np.array([[3.0/10, 3/5,0],[1.0/2,0,1],[4.0/10,4.0/5,0]])
    n = 3
    m = 3
    p = 2
    #I = np.identity(3)
    #print(A.dot(I))
    W, H = NMF(A, n, m, p)
    print("{}\n{}".format(W,H))
teste()

e1 = 0
 e2 = 0
e1 = 0
 e2 = 8.743724590958761
e1 = 9.580776245085302
 e2 = 8.743724590958761
e1 = 9.580776245085302
 e2 = 8.924278364573276
e1 = 8.854299262679344
 e2 = 8.924278364573276
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.854299262679344
 e2 = 8.854299262679344
e1 = 8.8542992

## Exemplos para teste (tipo um Apêndice?)

__Teste do cos_sin___

In [None]:
W = np.array([[1.0,2.0], 
              [3.0,4.0]])
c, s = cos_sin(W, 1, 2, 1)

print("sin: {} \ncos: {}".format(s,c))

rot_Givens(W, 2, 2, 1, 2, c, s)
print(W)

__Teste do rot_Givens__

In [None]:
A = np.array([[2.0, 1.0, 1.0,-1.0, 1.0],
              [0.0, 3.0, 0.0, 1.0, 2.0],
              [0.0, 0.0, 2.0, 2.0,-1.0],
              [0.0, 0.0,-1.0, 1.0, 2.0],
              [0.0, 0.0, 0.0, 3.0, 1.0]])

cos, sin = cos_sin(A, 3, 4, 3)

rot_Givens(A, 5, 5, 3, 4, cos, sin)
print(A)

__Teste do resolvedor de sistemas sobredeterminados__

In [None]:
W = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
b = np.array([[1.0], [1.0]])

solve(W, b, 2, 2)

print("final \n{}".format(b))

__Teste do resolvedor de sistemas simultâneos__

In [None]:
W = np.array([[1.0, 2.0], [2.0, 1.0]])
A = np.array([[1.0,2.0,3.0],[4.0,5.0,6.0]])

solve_multi(W, A, 2, 3, 2)
print("final\n{}".format(A))