# Relatório GPU

Supercomputação: Cicero Tiago

### Algoritmo de Smith-Waterman + Busca Exaustiva

Uma cálculo simples do _score_ utilizando o algoritmo de Smith-Waterman pode ser 
definido como a seguir, sendo $S_{i,j}$ o _score_ do elemento posicionado na linha 
$i$ e coluna $j$ da matriz utilizada para o cálculo:

$$ 
S_{i,j} = max\begin{Bmatrix}
S_{i-1, j-1} + 2, & a_i = b_j \\ 
S_{i-1, j-1} - 1,  & a_i \neq b_j\\ 
S_{i-1, j} - 1 &  b_j = -\\
S_{i, j-1} - 1 &  a_i = -\\ 
0 & 
\end{Bmatrix}
$$ 

Como podemos ver, o cálculo do score de um elemento só depende do score de elementos 
imediatamente anteriores. Com isso, esse cálculo pode ser dividido em duas etapas:

**Primeira Etapa:**  depende apenas do score dos elementos na **linha** anterior.

$$ 
S_{temp}(i,j) = max\begin{Bmatrix}
S_{i-1, j-1} + 2, & a_i = b_j \\ 
S_{i-1, j-1} - 1,  & a_i \neq b_j\\ 
S_{i, j-1} - 1 &  b_j = -\\
0 & 
\end{Bmatrix}
$$ 

**Segunda Etapa:** depende apenas do cálculo da etapa anterior e do score do elemento na coluna anterior.

$$ 
S_{i,j} = max\begin{Bmatrix}
S_{temp}(i,j) & \\ 
S_{temp}(i-1, j) - 1 &  \\
0 & 
\end{Bmatrix}
$$

### Implementação

#### Leitura do aqruivo

Ler o arquivo de entrada que segue um padrão de acordo com a descrição a seguir:\
**L1**: inteiro N representando o tamanho da primeira sequência \
**L2**: inteiro M representando o tamanho da segunda sequência \
**L3**: sequencia 1 de tamanho N \
**L4**: sequencia 2 tamanho M

Cada sequência do arquivo de entrada pode então ser guardada em um `std::vector<char>`. Chamaremos a sequência de tamanho N de A e a de tamanho M de B.

#### Gerar subsequências

Uma vez que cada subsequência representa um conjunto sequencial de caracteres contidos na sequência maior, cada uma delas pode ser definida por dois números inteiros, aqui chamados de `start` e `length`. 

Sendo assim, pode ser definida uma função que recebe 3 argumentos (sequência, ponto de início e tamanho) e devolve a subsequência do tipo `std::string`.

```cpp
std::string get_subsequence(std::string String, int start, int length) {
  return String.substr(start, length);
}
```

Agora que é possível gerar subsequências, podemos gerar todas as subsequências de A, todas as subsequências de B e cruzar todas contra todas. Analisando quantitativamente, o número de comparações cresce bem rápidamente:

Seja A uma sequência de 4 bases nitrogenadas: ACCA;\
Seja B uma sequência de 4 bases nitrogenadas: GTGT;

As subsequências de A são 10: A C C A AC CC CA ACC CCA ACCA;\
As subsequências de B são 10: G T G T GT TG GT GTG TGT GTGT;

Com isso, para realizara busca exaustiva entre A e B, cada uma de tamanho 4, seriam necessárias 10 vezes 10 comparações. Para oti
