# <center>__MÉTODOS NUMÉRICOS__</center>
## <center>__PROJETO DA UNIDADE 2__</center>

#### <center>__ALUNO: Rafaela Borba Falcão Cirino__</center>

<div class="alert alert-block alert-info">
1. INTRODUÇÃO
</div>

<p> PCA é um procedimento matemático que utiliza uma transformação ortogonal (ortogonalização de vetores) para converter um conjunto de observações de variáveis possivelmente correlacionadas num conjunto de valores de variáveis linearmente não correlacionadas chamadas de componentes principais. PCA (Principal Component Analysis) robusto é um método que foi abordado na estatística substituindo a estimativa padrão da matriz de covariância por um estimador robusto. Por outro lado, em redes neurais PCA tem deixado robusto designando uma rede neural que dependia em regras auto-organizadas baseadas em física estatística. Mas todos esses métodos robustos ainda são limitados para dados relativamente de baixa dimensão e, portanto, eles não são aplicáveis para aplicações de visão computacional com dados de alta dimensão.</p>
<p> PCA tem sido usado com o intuito de modelar o plano de fundo reduzindo significativamente a dimensão dos dados. Para executar o PCA, diferentes PCA robustos têm sido desenvolvidos recentemente. A sequência de plano de fundo é então modelada por um subespaço de baixa classificação que pode mudar gradualmente ao longo do tempo, enquanto os objetos em primeiro plano em movimento constituem os outliers esparsos correlacionados.</p>
<p>PCA robusto foi aplicado com grande sucesso em:
    <ul>
        <li>Imagens e análises de baixo nível;</li>
        <li>Imagens médicas, como reconstrução de imagens, análises de imagens do cérebro, imagens cardíacas, entre outras;</li>
        <li>Imagens para visão computacional em 3D: requer medição mecânica nas posições da câmera ou alinhamento manual de vistas parciais de uma cena em 3D. Dessa forma, o PCA robusto também pode ser usado para reduzir outliers e ruído em algoritmo como Structure from Motion (SfM), 3D motion recovery e reconstrução em 3D.</li>
    </ul>
</p>

<div class="alert alert-block alert-info">
2. DESCRIÇÃO DO PROBLEMA
</div>

<p>A utilização do uso de PCA robusto, deve-se ao estudo sobre algoritmos para detecção de objetos em movimento em uma cena com fundo estático. Estas cenas, geralmente, estão sob a influência de mudanças na iluminação e sujeitas a presença de sombras. O objetivo do PCA robusto é detectar e segmentar uma mão em movimento sobre um fundo qualquer a partir de uma sequência de imagens em cores, capturadas por uma câmera.</p>
<p> A capacidade de detectar objetos em movimento a partir de sequências de vídeo é fundamental em muitos sistemas de visão computacional. Tal capacidade, permite que os sistemas foquem a atenção nos objetos que estão em movimento e que possivelmente são cruciais na execução da tarefa para a qual foram programados. A ideia da subtração de fundo é subtrair da imagem atual uma imagem de referência, a qual é adquirida e modelada a partir de um fundo estático durante certo período de tempo, o que é conhecido como tempo de treinamento. Dessa forma, o fundo pode ser qualquer um, desde que permaneça razoavelmente estático.</p>
<p>Desde que a técnica de subtração de fundo foi reconhecida como método de detcção de objetos em movimento, alguns métodos apareceram. alguns algoritmos exploram a dferença estatística e/ou probabilística de cor entre a imagem atual e a imagem de referência, a qual é treinada durante um período de tempo com base em um número determinado de imagens. Outros baseiam-se na análise de movimento dos objetos, nas características das imagens em estéreo, em transformações logarítmicas e no aprendizado por markov e bayesianas.</p>

<div class="alert alert-block alert-info">
3. MÉTODOS APLICADOS À SOLUÇÃO
</div>

<p>Os métodos que serão usados para aplicação de remoção de undo de imagem, encontram-se a seguir com importações necessárias e funções respectivas.</p>

<p>Primeiro passo: definir uma matriz de dados a partir do vídeo:</p>
<p>def create_data_matrix_from_video(clip, k=5, scale=50):</p>

<p>Em seguida, mudar as cores do vídeo para escala de cinza:</p>
<p>def rgb2gray(rgb):</p>

<p>Há dois métodos de plotagem de imagens:</p>
<p>def plt_images(M, A, E, index_array, dims, filename=None):</p>
<p>def plots(ims, dims, figsize=(15,20), rows=1, interp=False, titles=None):</p>

In [1]:
def create_data_matrix_from_video(clip, k=5, scale=50):
    return np.vstack([rescale(rgb2gray(clip.get_frame(i/float(k))).astype(int), 
                      scale).flatten() for i in range(k * int(clip.duration))]).T

In [2]:
def create_data_matrix_from_video(clip, k, scale):
    frames = []
    for i in range(k * int(clip.duration)):
        frame = clip.get_frame(i / float(k))
        frame = rgb2gray(frame).astype(int)
        image = Image.fromarray(frame)
        size = tuple((np.array(image.size) * scale).astype(int))
        scaled_image = np.array(image.resize(size)).flatten()
        frames.append(scaled_image)
    return np.vstack(frames).T # stack images horizontally

In [3]:
def create_data_matrix_from_video(clip, k, scale):
    frames = []
    for i in range(k * int(clip.duration)):
        frame = clip.get_frame(i / float(k))
        frame = rgb2gray(frame).astype(int)
        image = Image.fromarray(frame)
        size = tuple((np.array(image.size) * scale).astype(int))
        scaled_image = np.array(image.resize(size)).flatten()
        frames.append(scaled_image)
    return np.vstack(frames).T # stack images horizontally

In [4]:
def rgb2gray(rgb):
    return np.dot(rgb[...,:3], [0.299, 0.587, 0.114])

In [5]:
def plt_images(M, A, E, index_array, dims, filename=None):
    f = plt.figure(figsize=(15, 10))
    r = len(index_array)
    pics = r * 3
    for k, i in enumerate(index_array):
        for j, mat in enumerate([M, A, E]):
            sp = f.add_subplot(r, 3, 3*k + j + 1)
            sp.axis('Off')
            pixels = mat[:,i]
            if isinstance(pixels, scipy.sparse.csr_matrix):
                pixels = pixels.todense()
            plt.imshow(np.reshape(pixels, dims), cmap='gray')
    return f

In [6]:
def plots(ims, dims, figsize=(15,20), rows=1, interp=False, titles=None):
    if type(ims[0]) is np.ndarray:
        ims = np.array(ims)
    f = plt.figure(figsize=figsize)
    for i in range(len(ims)):
        sp = f.add_subplot(rows, len(ims)//rows, i+1)
        sp.axis('Off')
        plt.imshow(np.reshape(ims[i], dims), cmap="gray")

<div class="alert alert-block alert-info">
4. IMPLEMENTAÇÃO
</div>

In [7]:
pip install moviepy

Note: you may need to restart the kernel to use updated packages.


In [8]:
pip install scikit-image

Note: you may need to restart the kernel to use updated packages.


In [9]:
import moviepy.editor as mpe
# from IPython.display import display
from glob import glob

import sys, os
import numpy as np
import scipy

import matplotlib.pyplot as plt
%matplotlib inline

In [10]:
# MAX_ITERS = 10
TOL = 1.0e-8

In [12]:
video = mpe.VideoFileClip("http://backgroundmodelschallenge.eu/")

OSError: MoviePy error: failed to read the duration of file http://backgroundmodelschallenge.eu/.
Here are the file infos returned by ffmpeg:

ffmpeg version 4.2.2-static https://johnvansickle.com/ffmpeg/  Copyright (c) 2000-2019 the FFmpeg developers
  built with gcc 8 (Debian 8.3.0-6)
  configuration: --enable-gpl --enable-version3 --enable-static --disable-debug --disable-ffplay --disable-indev=sndio --disable-outdev=sndio --cc=gcc --enable-fontconfig --enable-frei0r --enable-gnutls --enable-gmp --enable-libgme --enable-gray --enable-libaom --enable-libfribidi --enable-libass --enable-libvmaf --enable-libfreetype --enable-libmp3lame --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenjpeg --enable-librubberband --enable-libsoxr --enable-libspeex --enable-libsrt --enable-libvorbis --enable-libopus --enable-libtheora --enable-libvidstab --enable-libvo-amrwbenc --enable-libvpx --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxml2 --enable-libdav1d --enable-libxvid --enable-libzvbi --enable-libzimg
  libavutil      56. 31.100 / 56. 31.100
  libavcodec     58. 54.100 / 58. 54.100
  libavformat    58. 29.100 / 58. 29.100
  libavdevice    58.  8.100 / 58.  8.100
  libavfilter     7. 57.100 /  7. 57.100
  libswscale      5.  5.100 /  5.  5.100
  libswresample   3.  5.100 /  3.  5.100
  libpostproc    55.  5.100 / 55.  5.100
http://backgroundmodelschallenge.eu/: Invalid data found when processing input


In [None]:
video.subclip(0,50).ipython_display(width=300)

In [None]:
video.duration

<div class="alert alert-block alert-info">
5. CASOS DE USO
</div>

In [None]:
scale = 25   # Adjust scale to change resolution of image
dims = (int(240 * (scale/100)), int(320 * (scale/100)))

In [None]:
M = create_data_matrix_from_video(video, 100, scale)
# M = np.load("high_res_surveillance_matrix.npy")

In [None]:
print(dims, M.shape)

In [None]:
plt.imshow(np.reshape(M[:,140], dims), cmap='gray');plt.imshow(np.reshape(M[:,140], dims), cmap='gray');

<p>De acordo com [3], como a função</p>

def create_data_matrix_from_video(clip, k=5, scale=50):
<p>é um pouco lenta, salvaremos nossa matriz. Em geral, sempre que houver etapas lentas de pré-processamento, é uma boa idéia salvar os resultados para uso futuro.</p>

In [None]:
np.save("low_res_surveillance_matrix.npy", M)

In [None]:
plt.figure(figsize=(12, 12))
plt.imshow(M, cmap='gray')

## Usando SVD

In [None]:
pip install -U scikit-learn

In [None]:
from sklearn import decomposition

In [None]:
u, s, v = decomposition.randomized_svd(M, 2)

In [None]:
u.shape, s.shape, v.shape

In [None]:
low_rank = u @ np.diag(s) @ v

In [None]:
low_rank.shape

In [None]:
plt.figure(figsize=(12, 12))
plt.imshow(low_rank, cmap='gray')

In [None]:
plt.imshow(np.reshape(low_rank[:,140], dims), cmap='gray');

<p>Nesse Caso, pode-se perceber apenas o Background.</p>

In [None]:
plt.imshow(np.reshape(M[:,550] - low_rank[:,550], dims), cmap='gray');

<p>Podem ser visualizados apenas carros, ou figuras em movimento. A análise de componentes principais é útil para eliminar dimensões. O PCA clássico busca a melhor estimativa de classificação desta forma, será usada a biblioteca Fast Randomized PCA do Facebook.</p>

In [None]:
pip install fbpca

In [None]:
from scipy import sparse
from sklearn.utils.extmath import randomized_svd
import fbpca

In [None]:
TOL=1e-9
MAX_ITERS=3

In [None]:
def converged(Z, d_norm):
    err = np.linalg.norm(Z, 'fro') / d_norm
    print('error: ', err)
    return err < TOL

In [None]:
def shrink(M, tau):
    S = np.abs(M) - tau
    return np.sign(M) * np.where(S>0, S, 0)

In [None]:
def _svd(M, rank): return fbpca.pca(M, k=min(rank, np.min(M.shape)), raw=True)


In [None]:
def norm_op(M): return _svd(M, 1)[1][0]

In [None]:
def svd_reconstruct(M, rank, min_sv):
    u, s, v = _svd(M, rank)
    s -= min_sv
    nnz = (s > 0).sum()
    return u[:,:nnz] @ np.diag(s[:nnz]) @ v[:nnz], nnz

In [None]:
def pcp(X, maxiter=10, k=10): # refactored
    m, n = X.shape
    trans = m<n
    if trans: X = X.T; m, n = X.shape
        
    lamda = 1/np.sqrt(m)
    op_norm = norm_op(X)
    Y = np.copy(X) / max(op_norm, np.linalg.norm( X, np.inf) / lamda)
    mu = k*1.25/op_norm; mu_bar = mu * 1e7; rho = k * 1.5
    
    d_norm = np.linalg.norm(X, 'fro')
    L = np.zeros_like(X); sv = 1
    
    examples = []
    
    for i in range(maxiter):
        print("rank sv:", sv)
        X2 = X + Y/mu
        
        # update estimate of Sparse Matrix by "shrinking/truncating": original - low-rank
        S = shrink(X2 - L, lamda/mu)
        
        # update estimate of Low-rank Matrix by doing truncated SVD of rank sv & reconstructing.
        # count of singular values > 1/mu is returned as svp
        L, svp = svd_reconstruct(X2 - S, sv, 1/mu)
        
        # If svp < sv, you are already calculating enough singular values.
        # If not, add 20% (in this case 240) to sv
        sv = svp + (1 if svp < sv else round(0.05*n))
        
        # residual
        Z = X - L - S
        Y += mu*Z; mu *= rho
        
        examples.extend([S[140,:], L[140,:]])
        
        if m > mu_bar: m = mu_bar
        if converged(Z, d_norm): break
    
    if trans: L=L.T; S=S.T
    return L, S, examples

## Resultados Obtidos

In [None]:
m, n = M.shape
round(m * .05)

In [None]:
L, S, examples =  pcp(M, maxiter=5, k=10)

In [None]:
f = plt_images(M, S, L, [140], dims)

In [None]:
np.save("high_res_L.npy", L)
np.save("high_res_S.npy", S)

In [None]:
f = plt_images(M, S, L, [0, 100, 1000], dims)