### <b> Trabalho Final - Inteligência Computacional Aplicada (TIP7077) </b>
#### <b> Aluno: Carlos Eduardo Sousa Lima </b>
#### <b> Prof. Guilherme de Alencar Barreto </b>
***

#### <b>Questão 01 - Classificação de Padrões - MNIST database of handwritten digits </b>

<div style='text-align: justify;'>
As classes e funções apresentadas no bloco de código abaixo foram comuns a todos os classificadores implementados. Nelas, estão implementadas a leitura dos dados, adequação da codificação do vetor de saída (alvo) e normalização dos dados. A seguir, cada uma delas é melhor descrita:
</div>

- MNIST_data:<br>
    <div style='text-align: justify;'>
    
    Essa classe foi criada para conter as funções de aquisição dos dados de treino <b>get_train_data()</b> e dados de teste <b>get_test_data()</b>. Essas funções utilizam a biblioteca mnist (#https://pypi.org/project/python-mnist/#description), a qual, a partir dos dados obtidos em http://yann.lecun.org/exdb/mnist/index.html, descomprime e transforma-os em um objeto Numpy Array (np.array). Cada uma dessas funções retornam dois objetos np.array, um com os dados de entrada e o outro com seus respectivos labels. Os dados de entrada são retornados de forma vetorizada, ou seja, a matriz $28{\times}28$ é empilhada dando origem a um vetor $784{\times}1$. Os labels são o valor inteiro entre 0 e 9 que esse vetor representa.

    Cabe destacar que a base de dados de treino possuem 60.000 elementos e a de teste 10.000 elementos. Dessa forma, os dados de entrada formam uma matriz $60.000{\times}738$, para a base de treino, e $10.000{\times}738$, para a base de teste. Os labels, por sua vez, forma um vetor de $60.000{\times}1$, para a base de treino, e $10.000{\times}1$, para a base de teste</div>

    <div style='text-align: justify;' class="alert alert-block alert-info">
    
    Nota-se que cada elemento representa uma linha e suas características são ordenadas ao longo de suas colunas, o que diverge da ordenação empregada ao longo da disciplina. Optou-se por manter essa ordenação, assim, algumas operações matriciais podem apresentar uma ordem contrária à apresentada nas notas de aula, por exemplo:

    $\vec{y} = \tilde{W} \cdot \vec{x}$ (notas de aula)<br> 
    $\vec{y} = \vec{x} \cdot \tilde{W}$ (seguindo a notação adotada no trabalho)
    </div>


- one_hot_enconding():
    <div style='text-align: justify;'>
        
    Essa função altera o formato do vetor labels. Para cada elemento da base de dados de entrada do MNIST, seja a de treino ou de teste, existirá um label que representará o valor associado a esse elemento da base de dados. Tomando como exemplo os dados de treino, sua base de dados terá dimensão $60.000{\times}738$, visto que o procedimento de obtenção dos dados retorna esses dados de forma vetorizada. No caso dos seu respectivo vetor de label ($\vec{y}$), ele terá dimensão $60.000{\times}1$.

    Os possíveis valores de cada um dos elementos contidos no vetor de labels são representados por $x \in [0,9]$, tal que $x \in \Z$. A função aqui descrita, portanto, cria uma nova codificação para os labels baseada na codificação one-hot. Como $x$ pode assumir 10 valores (classes), cada elemento do vetor de labels dará origem a um vetor de cardinalidade igual 10. Portanto, após a aplicação dessa função, o vetor de label $\vec{y}$ passará a ter dimensão $60.000{\times}10$, para a base de treino, e $10.000{\times}10$, para a base de teste. 

    Esse vetor terá valor igual a 1 no índice que coincide com o valor representando no respectivo elemento do vetor de labels original, nos demais índices receberá o valor 0. Exemplificando, após a utilização da função one_hot_enconding(): <br>
    
    - $0 \rightarrow [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]$ <br>
    - $1 \rightarrow [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]$ <br>
    - $ \,\vdots \rightarrow \quad\quad\quad\quad\,\, \vdots$ <br>
    - $9 \rightarrow [0, 0, 0, 0, 0, 0, 0, 0, 0, 1]$ <br>
    
    A utilização dessa codificação é interessante, pois assume que os vetores que representam cada classe são ortogonais entre si, ou seja, mutuamente exclusivos. 
    </div>


- norm_data():
    <div style='text-align: justify;'>

    A MNIST *database of handwritten digits* consiste na representação matricial de imagens de caracteres cursivos. Nessa representação, utiliza-se matrizes quadradas de dimensão $28{\times}28$, ou seja, cada imagem contém 784 pixels. Em cada um desses pixels, representasse uma tonalidade de cinza, considerando uma escala em que zero é totalmente branco e 255 totalmente preto.

    Como supracitado, cada uma dessas matrizes de dados são vetorizadas nas presente analises, dando origem a um vetor de dimensão $1{\times}p$. Agrupando esses vetores em linhas, obtém-se a matriz de dados de dimensão $n{\times}p$ utilizada nesse trabalho, sendo $n$ o número de imagens disponibilizadas para treino ou teste e $p = 784$. 

    A função nomr_data() atua normalizando os valores da escala de tons de cinza associados aos pixels das imagens de caracteres cursivos. Em outras palavras, para cada $n$ elemento da matriz de dados, seja de treino ou de teste, essa função varia intervalo de variação dos valores de $[0,255]$ para $[0,1]$. O processo de normalização é amplamente recomendado para algoritmos de classificação baseado em aprendizado, pois dados de entrada com elevados valores, ou que suas variáveis apresentem grandes diferença na magnitude dos seus valores, podem prejudicar o processo de aprendizado. Para normalização desses dados, adotou-se a seguinte equação:

    $$
        x^{norm}_{j} = \frac{x_{j} - x^{max}_{j}}{x^{max}_{j} - x^{min}_{j}}
    $$
    </div>
    


    


<p style="page-break-after:always;"></p>

In [1]:
import numpy as np
from mnist import MNIST #https://pypi.org/project/python-mnist/#description
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")

class MNIST_data():

    def __init__(self):
        pass
    
    def get_train_data():
        
        mndata = MNIST("./")
        mndata.gz = True
        x, y = mndata.load_training()

        return (np.array(x), np.array(y))
    
    def get_test_data():
        
        mndata = MNIST("./")
        mndata.gz = True
        x, y = mndata.load_testing()

        return (np.array(x), np.array(y))

def one_hot_enconding(y, n):

    y_enc = np.zeros((y.shape[0], n))
    for i in range(y.shape[0]):
        y_enc[i, y[i]] = 1

    return y_enc

def norm_data(df):
    df_std = np.zeros(df.shape)

    for i in range(df.shape[0]):
        # df_std[i,:] = (df[i,:] - df[i,:].mean())/(df[i,:].std(ddof = std_ddof))
        df_std[i,:] = (df[i,:] - df[i,:].min())/(df[i,:].max() - df[i,:].min())
    return df_std

##### Classificador Linear de Mínimos Quadrados

In [2]:
# O código está utilizando a orientação nxp
# n é o número de amostras, p o número de característica
# As operações matriciais apresentam ordem contrária ao apresentando nas notas de aula
# Y = W*X (Nota de Aula) - Y = X*W (Presente Código)

Nr = 10
X, Y = MNIST_data.get_train_data()
X_test, Y_test = MNIST_data.get_test_data()
    
if np.linalg.matrix_rank(X) == min(X.shape):
    print("Matrix de dados de Posto Completo")
else:
    print("Matriz de dados de Posto Incompleto")

Y = one_hot_enconding(Y, 10)
Y_test = one_hot_enconding(Y_test, 10)

X = norm_data(X)
X_test = norm_data(X_test)

tx_ok = np.zeros(Nr)
for i in range(Nr):
    rand_index = np.random.permutation(X.shape[0])
    X = X[rand_index,:]
    Y = Y[rand_index,:]

    if X.shape[0] != X.shape[1]:
        W = np.linalg.lstsq(X,Y)[0]
    else:
        W = np.linalg.solve(X,Y)[0]

    Y_mod = np.dot(X_test, W)

    count_ok = 0

    for j in range(Y_mod.shape[0]):
        if Y_mod[j,:].argmax() == Y_test[j,:].argmax():
            count_ok += 1
    
    tx_ok[i] = count_ok/Y_mod.shape[0]

print('''
Taxa de acerto Média = {:.2%} \n
Taxa de erro Média = {:.2%} \n
Melhor Taxa de Acerto = {:.2%} \n
Pior Taxa de Acerto = {:.2%} \n
Desv. Pad. Taxa de Acerto = {:.2%}
'''.format(tx_ok.mean(), 1-tx_ok.mean(),
    tx_ok.max(), tx_ok.min(), tx_ok.std()))


Matriz de dados de Posto Incompleto

Taxa de acerto Média = 85.34% 

Taxa de erro Média = 14.66% 

Melhor Taxa de Acerto = 85.41% 

Pior Taxa de Acerto = 85.32% 

Desv. Pad. Taxa de Acerto = 0.03%



<div class="alert alert-block alert-warning">
S2
</div>

<div class="alert alert-block alert-info">
S2
</div>

<div class="alert alert-block alert-success">
S2
</div>

<div class="alert alert-block alert-danger">
S2
</div>