# [Rosalind - Complementing a Strand of DNA](https://rosalind.info/problems/revc/)
Renato, 16 de março de 2022

## Enunciado

In DNA strings, symbols 'A' and 'T' are complements of each other, as are 'C' and 'G'.

The **reverse complement** of a DNA string *s* is the string s<sup>c</sup> formed by reversing the symbols of *s*, then taking the complement of each symbol (e.g., the reverse complement of "GTCA" is "TGAC").

**Given**: A DNA string *s* of length at most 1000 bp.

Return: The reverse complement *s*<sup>c</sup> of *s*.

### Sample Dataset

```AAAACCCGGT```

### Sample Output

```ACCGGGTTTT```

## Resoluções

Guardando a sequência de DNA em uma variável:

In [1]:
sample_data = "AAAACCCGGT"

"AAAACCCGGT"

In [2]:
length(sample_data)

10

Estamos trabalhando com strings:

In [3]:
typeof(sample_data)

String

Formas diferentes de imprimir nossa string:

In [4]:
println(sample_data)

AAAACCCGGT


In [5]:
println("$sample_data")

AAAACCCGGT


No exemplo seguinte, nós temos que importar `Printf`:

In [6]:
using Printf
@printf("%s\n", sample_data) # %s pode substituir strings, números ...

AAAACCCGGT


"AAAACCCGGT"

Vamos iterar em cada caractere de nossa string usando o laço `for`:

In [13]:
for base in sample_data print("$base") end

AAAACCCGGT

Após criar a variável `rev_dna` vazia, faço a iteração na string original e vou concatenando os caracteres observados (usando o operador `*`):

In [19]:
rev_dna = ""

for base in sample_data
    rev_dna = base * rev_dna
    print("$base")
end

AAAACCCGGT

In [20]:
rev_dna

"TGGCCCAAAA"

Mas Julia tem uma função nativa para realizar esta tarefa (`reverse`):

In [21]:
reverse(sample_data)

"TGGCCCAAAA"

Como as strings são imutáveis e precisaremos alterar os nucleotídeos em cada uma das posições nesta cadeia de caracteres, podemos usar a função `collect` para converter nossa `string` em um `array de caracteres` (que, por sua vez, permite a alteração dos elementos):

In [22]:
rev_dna_array = collect(reverse(sample_data))

10-element Vector{Char}:
 'T': ASCII/Unicode U+0054 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)

In [23]:
rev_dna_array

10-element Vector{Char}:
 'T': ASCII/Unicode U+0054 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)

In [24]:
typeof(rev_dna_array)

Vector{Char} (alias for Array{Char, 1})

In [25]:
rev_dna_array[1] = 'T'

'T': ASCII/Unicode U+0054 (category Lu: Letter, uppercase)

In [26]:
rev_dna_array

10-element Vector{Char}:
 'T': ASCII/Unicode U+0054 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)

In [10]:
macro ++(x::Symbol)
    return :( $(esc(x)) = $(esc(x)) + 1 )
end

@++ (macro with 1 method)

In [11]:
counter = 1
for base in rev_dna_array
    if base == 'A' rev_dna_array[counter] = 'T'
    elseif base == 'T' rev_dna_array[counter] = 'A'
    elseif base == 'C' rev_dna_array[counter] = 'G'
    elseif base == 'G' rev_dna_array[counter] = 'C'
    end
    @++ counter 
end

In [29]:
for (i, dna_base) in enumerate(rev_dna_array)
    if dna_base == 'A' rev_dna_array[i] = 'T'
    elseif dna_base == 'T' rev_dna_array[i] = 'A'
    elseif dna_base == 'C' rev_dna_array[i] = 'G'
    elseif dna_base == 'G' rev_dna_array[i] = 'C'
    end
end

In [30]:
rev_dna_array

10-element Vector{Char}:
 'A': ASCII/Unicode U+0041 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'C': ASCII/Unicode U+0043 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'G': ASCII/Unicode U+0047 (category Lu: Letter, uppercase)
 'T': ASCII/Unicode U+0054 (category Lu: Letter, uppercase)
 'T': ASCII/Unicode U+0054 (category Lu: Letter, uppercase)
 'T': ASCII/Unicode U+0054 (category Lu: Letter, uppercase)
 'T': ASCII/Unicode U+0054 (category Lu: Letter, uppercase)

A função `join` retorna uma string (não é necessário usar `join` dentro de `string` - como no exemplo logo em seguida)

In [32]:
join(rev_dna_array)

"ACCGGGTTTT"

In [None]:
string(join(rev_dna_array))

In [33]:
rev_dna = join(rev_dna_array)

"ACCGGGTTTT"

Uma outra forma de inverter a ordem:

In [None]:
str_exemplo1 = "AAAACCCGGT"

In [None]:
str_exemplo1[end:-1:begin]

Usando `replace` e `reverse`:

In [35]:
sample_data

"AAAACCCGGT"

In [37]:
sample_data_rev = reverse(sample_data)

"TGGCCCAAAA"

In [39]:
replace(sample_data_rev, 'T'=>'A', 'A'=>'T', 'G'=>'C', 'C'=>'G')

"ACCGGGTTTT"

Fazendo o mesmo, mas usando o dicionário (`Dict`):

In [43]:
replace(sample_data_rev, Dict('T'=>'A', 'A'=>'T', 'G'=>'C', 'C'=>'G')...)

"ACCGGGTTTT"