# Coleções e iterações

In [None]:
n_aminoácidos = 20 # número inteiro
bases = 'AUCG' # string

print(f'Existem {n_aminoácidos} e as bases do mRNA são {bases}')

### Objetos booleanos

No Python existem mais dois objetos que representam os conceitos de *verdadeiro* e *falso*.

São eles `True` e `False` (começam por maiúscula).

In [None]:
a = 3
print(a > 2)
print(a > 5)
print(a > 2 and a < 5)
print(a >= 3)
print(a <= 4)

print()

print(a == 3)
print(a != 3)

In [None]:
print(True)
print(False)
print(True and False)
print(True or False)
print(not True)

## Coleções

- Listas
- Dicionários
- Conjuntos (*sets*)

![](images/obj_colections.png)

In [None]:
uma_lista = [2, 4, 3.1415, 'eu aqui', 1j, "fim da lista"]

um_dict = {'H': [1, 3] , 'Li': 3, 'Na': 11, 'K': 19}

um_set = {'A', 'T', 'C', 'G'}

print(uma_lista)
print(um_dict)
print(um_set)

## Listas

In [None]:
vários = [2, 4, 3.1415, 'eu aqui', "fim da lista"]

print(vários)

In [None]:
a = [19, 14/2, 5.0**3, 'Bom dia']
b = 1
c = [b, b+1, (b+2)**3]

print('a =', a)
print('c =', c)

Função `list()`: transformação de outros objetos numa lista

In [None]:
seql = list('ATGGTCAAACTTGTT')

print(seql)

### Indexação de listas (com números inteiros)

In [None]:
#    0    1      2        3
a = [19, 14/2, 5.0**3, 'Bom dia']

print(a[1])

In [None]:
a = [19, 14/2, 5.0**3, 'Bom dia']
#    0    1      2        3

print(a[0])
print(a[1])
print(a[2])
print(a[3])

In [None]:
dias_abril = [31, 28, 31, 30, 31][3]

print(dias_abril)

## Dicionários (*dicts*)

In [None]:
d = {'H': 1, 'Li': 3, 'Na': 11, 'K': 19}

### Indexação com as chaves

In [None]:
d = {'H':1, 'Li':3, 'Na':11, 'K':19}

print('d =', d)

print(d['K'])
print(d['Li'])

In [None]:
n_K = {'H':1, 'Li':3, 'Na':11, 'K':19} ['K']

print('Número atómico do potássio é', n_K)

As *strings* também podem ser indexadas com números inteiros

In [None]:
s = 'Eu sou uma pequena string'
#    0123456789

print(s[0])
print(s[3])
print(s[8])

## Conjuntos (sets)

In [None]:
aminoácidos = {'I', 'Y', 'P', 'W', 'C', 'M', 'R', 
               'L', 'K', 'H', 'V', 'D', 'F', 'N', 
               'S', 'T', 'A', 'G', 'Q', 'E'}

print(aminoácidos)

In [None]:
bases = {'A', 'A', 'C', 'C', 'U', 'G'}

print(bases)

### Funções de listas, dicionários e conjuntos

As coleções têm funções "associadas".

Estas funções têm a forma geral

```coleção.função(argumentos)```

Algumas destas funções são comuns a vários tipos de coleções

Exemplo: função ```<objeto>.count(<elemento>)```

In [None]:
# Quantas glicinas existem nesta sequência?
seq = 'MSSLVTLNNGLKMPLVGLGCWKIDKKVCANQIYEAIKLGYRLFDGACDYGNEKEVGEGIR'

nG = seq.count('G')

print(nG, 'glicinas')

# Quantos meses do ano têm 30 dias?
n_dias = [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31]

n30 = n_dias.count(30)

print(n30, 'meses têm 30 dias')

A função `len()` pode ser usada com **todas** as coleções (e com as *strings*)

(`len` é a abreviatura de *length*)

(Nota: é "exterior" aos objetos)

In [None]:
a = [2,4,6,8,10, 'viria o 12', 'e depois o 14'] # lista
s = 'Eu sou uma pequena string' # string
d = {'H':1, 'Li':3, 'Na':11, 'K':19} # dicionário

print(len(a))
print(len(s))
print(len(d))

In [None]:
seq = 'MSSLVTLNNGLKMPLVGLGCWKIDKKVCANQIYEAIKLGYRLFDGACDYGNEKEVGEGIR'

print(f'A proteína\n{seq}')
print('tem', len(seq), 'aminoácidos')

O operador `in` também pode ser usado com **todas** as coleções

In [None]:
nums = [1,2,3,4,5,6,7,8,9,10]
if 4 in nums:
    print(4, 'existe')
else:
    print(4, 'não existe')

In [None]:
seq = 'ATGGTCAAACTTGTTGACTGCAAATGCGTACGT'

if 'U' in seq:
    print('Existe', 'U')
else:
    print('Não existe', 'U')

if 'TGT' in seq:
    print('Existe', 'TGT')
else:
    print('Não existe', 'TGT')

In [None]:
grupo1 = {'H':1, 'Li':3, 'Na':11, 'K':19}

print('Mg' in grupo1)

# Iterações

Todas as coleções são **iteráveis**

A **iteração** de coleções consistem em aplicar um bloco de instruções a todos os elementos de uma coleção **um a um**

O comando primário para realizar iterações é o comando `for`

# for

In [None]:
print('tabela de raízes quadradas')

nums = [1,2,3,4,5,6,7,8,9,10]

for n in nums:
    root = n**0.5
    print(n, root)

In [None]:
nums = [1,2,3,4,5,6,7,8,9,10,11,15,27, 30, 40]
a_procurar = [1, 4, 7, 20, 40]

for n in a_procurar:
    if n in nums:
        print(n, 'existe na lista')
    else:
        print(n, 'não existe na lista')

In [None]:
# Anos bissextos (sem input())

anos = [2015, 2014, 2013, 2012, 2000, 1900, 1800]

for a in anos:
    if a % 4 == 0 and not (a % 100 == 0 and not a % 400 == 0):
        print(a , "é bissexto")
    else: 
        print(a, "nao é bissexto")

### Iteração de *strings*

In [None]:
seq = 'ATGGT CAAAC TTGTT'

for b in seq:
    print(b)

Mostrar as ocorrências de lisinas numa sequência

In [None]:
seq = 'ADKHLILTAVGGCWFHVAFWEVEKAGAHKWE'

for aa in seq:
    if aa == 'K':
        print(aa)

Mostrar as ocorrências de lisinas  e argininas numa sequência

In [None]:
seq = 'ADKHLILTAVGGCWFHVAFWEVEKAGAHKWE'

for aa in seq:
    if aa in 'KL':
        print(aa)

Mostrar as ocorrências de lisinas  e argininas numa sequência (versão "fancy")

In [None]:
seq = 'ADKHLILTAVGGCWFHVAFWEVEKAGAHKWE'
print(seq)

for aa in seq:
    if aa in 'KL':
        print(aa, end='')
    else:
        print('-', end='')

### Iteração de dicionários
A iteração de dicionários fornece as **chaves** uma a uma (não os pares ou os valores)

In [None]:
grupo1 = {'H':1, 'Li':3, 'Na':11, 'K':19}

print('elementos do grupo 1')

for e in grupo1:
    print(e)

Mas, podemos obter as chaves e os valores: estes podem ser obtidos pela indexação do dicionário:

In [None]:
grupo1 = {'H':1, 'Li':3, 'Na':11, 'K':19}

print('elementos do grupo 1')

for e in grupo1:
    print(e, grupo1[e])

# Iterações com "acumulações"

Somar todos os elementos de uma lista, somando um a um a um objeto "de acumulação":

In [None]:
nums = [1,2,3,4,5,6,7,8,9,10]

s = 0
for i in nums:
    s = s + i

print('a soma de', nums, 'é', s)

In [None]:
nums = [1,2,3,4,5,6,7,8,9,10]

s = 0
for i in nums:
    print('i =', i)
    print('  s antes da soma', s)
    s = s + i
    print('  s depois da soma', s)

print(f'a soma é {s}')

### Função `range()`

In [None]:
print('-- range(12) ----------')
# começa em 0, acaba em 12 (exclusivé),  e salta de 1 em 1.

nums = list(range(12))
print(nums)

In [None]:
print('-- range(5, 12) ----------')
# começa em 5, acaba em 12 (exclusivé).

nums = list(range(5, 12))
print(nums)

In [None]:
print('-- range(5, 12, 2) ----------')
# começa em 5, acaba em 12 (exclusivé) e salta de 2 em 2.

nums = list(range(5, 12, 2))
print(nums)

In [None]:
s = 0

for i in range(1, 1001):
    s = s + i

print('a soma dos números de 1 a 1000 é', s)

In [None]:
seq = 'ATGGTCAAACTTGTT'
seql = list(seq)
print(seql)

**Fatorial**: "acumulação" de um produto

In [None]:
fact = 1
for i in range(1, 1001):
    fact = fact * i

print('o factorial de 1000 é', fact)

In [None]:
seq = 'ATGGTCAAACTTGTTGACTGCAAATGCGTACGT'

for b in seq:
    print(b, end=' ')

In [None]:
seq = 'ATGGTCAAACTTGTTGACTGCAAATGCGTACGT'

seqcomp = ''

for b in seq:
    if b == 'A':
        bcomp = 'T'
    elif b == 'T':
        bcomp = 'A'
    elif b == 'G':
        bcomp = 'C'
    else:
        bcomp = 'G'
    seqcomp = seqcomp + bcomp

print('sequência:   ', seq)
print('complementar:', seqcomp)

In [None]:
seq = 'ATGGTCAAACTTGTTGACTGCAAATGCGTACGT'

seqcomp = ''

complementares = {'A': 'T', 'T': 'A', 'C': 'G', 'G': 'C'}

for b in seq:
    seqcomp = seqcomp + complementares[b]

print('sequência:   ', seq)
print('complementar:', seqcomp)

In [None]:
seq = 'ATGGTCAAACTTGTTGACTGCAAATGCGTACGT'

complementares = {'A': 'T', 'T': 'A', 'C': 'G', 'G': 'C'}

for b in seq:
    print(b, '-', complementares[b])

In [None]:
trans = {'A': 'Ala', 'C': 'Cys', 'E': 'Glu', 'D': 'Asp',
         'G': 'Gly', 'F': 'Phe', 'I': 'Ile', 'H': 'His',
         'K': 'Lys', 'M': 'Met', 'L': 'Leu', 'N': 'Asn',
         'Q': 'Gln', 'P': 'Pro', 'S': 'Ser', 'R': 'Arg',
         'T': 'Thr', 'W': 'Trp', 'V': 'Val', 'Y': 'Tyr'}

# Problema: transformar seq1 numa string com os códigos de 3 letras dos aa
seq1 = 'ADKLITCWFHHWE'

seq3 = ''
for aa in seq1:
    seq3 = seq3 + trans[aa] + '-'

print(seq1, 'é o mesmo que ', seq3)

In [None]:
s = sum(range(1, 1001))

print('a soma dos números de 1 a 1000 é', s)

In [None]:
import math
f = math.factorial(100)

print('100! =', f)

In [None]:
seq = 'ADKHLILTAVGGCWFHVAFWEVEKAGAHKWE'

i = 0
for aa in seq:
    if aa in 'KL':
        print(i, ':', aa)
    i = i + 1

In [None]:
seq = 'ADKHLILTAVGGCWFHVAFWEVEKAGAHKWE'

for x in enumerate(seq):
    print(x)

In [None]:
seq = 'ADKHLILTAVGGCWFHVAFWEVEKAGAHKWE'

for (i, a) in enumerate(seq):
    print(i, ':', a)

In [None]:
seq = 'ADKHLILTAVGGCWFHVAFWEVEKAGAHKWE'

for i, aa in enumerate(seq):
    if aa in 'KL':
        print(i, ':', aa)

In [None]:
bases = 'AUGC'

for b1 in bases:
    for b2 in bases:
        for b3 in bases:
            c = b1 + b2 + b3
            print(c, end=' ')

In [None]:
seq = 'ATGGTTAAACTTGTTGACTGCAAATGCGTACGT'

complementares = {'A': 'T', 'T': 'A', 'C': 'G', 'G': 'C'}

for b in seq:
    print(b, '-', complementares[b])
    if b == 'C':
        break

In [None]:
seq = 'ATGGTTAAACTTGTTGACTGCAAATGCGTACGT'

complementares = {'A': 'T', 'T': 'A', 'C': 'G', 'G': 'C'}

for b in seq:
    if b in 'AT':
        continue
    print(b, '-', complementares[b])

In [None]:
#contagem decrescente
count = 10
while count > 0:
    print(count)
    count = count - 1
print('kabum!')