# Coleções e iterações

## Coleções

Coleções são objetos que contêm mais do que um valor.

As principais coleções usadas em Python são:

- Sequências:

    + **listas**
    + _strings_

- **dicionários**

### Listas

In [1]:
a = [2, 4, 3.1415, 'eu aqui', "fim da lista"]

print(a)

[2, 4, 3.1415, 'eu aqui', 'fim da lista']


`a` é uma **lista**.

Uma lista é simplesmente um conjunto de elementos reunidos num único "objeto".

São usados `[]` para indicar explicitamente os elementos da lista.

As listas podem ter elementos de vários tipos e até serem indicadas com expressões:

In [None]:
a = [19, 14/2, 5.0**3, 'Bom dia']
b = 1
c = [b, b+1, (b+2)**3]

print('a =', a)
print('c =', c)

Uma propriedade fundamental das listas é que a **ordem dos elementos tem significado** e uma lista pode ser "**indexável**" com numeros inteiros.

In [None]:
a = [19, 14/2, 5.0**3, 'Bom dia']

print('a =', a)
print(a[0])
print(a[1])
print(a[2])
print(a[3])

A ordem dos elementos **começa a contar do zero** e vai até $n-1$ em que $n$ é o número de elementos da lista.

### _strings_

As _strings_ podem ser entendidas como **coleções de caracteres**

As _strings_ também têm uma numeração implícita, a contar do zero.

In [None]:
s = 'Eu sou uma pequena string'
print(s)

print(s[0])
print(s[3])

### Dicionários

Dicionários são *associações* entre **chaves** e **valores**.

In [None]:
d = {'H': 1, 'Li': 3, 'Na': 11, 'K': 19}

Neste exemplo,

`'H'`,`'Li'`,`'Na'`,`'K'`, são as **chaves** do dicionário

`1`,`3`,`11`,`19`, são os respetivos **valores**

Ao contrário das listas e das *strings*, a **ordem dos elementos num dicionário não tem significado** mas um dicionário pode ser "**indexável**" com as *chaves*:

In [None]:
d = {'H':1, 'Li':3, 'Na':11, 'K':19}

print('d =', d)
print()
print(d['K'])
print(d['Li'])

## Iteração de coleções: comando `for`

Iteração é um conceito geral, que consiste em aplicar um conjunto de instruções ou comandos a **cada um dos elementos de uma coleção**.

Em Python é usado o comado `for` para esse efeito.

In [None]:
a = [2,4,6,8,10, 'viria o 12', 'e depois o 14']

for x in a:
    print(x)

In [None]:
# tabela de raízes quadradas
a = [1,2,3,4,5,6,7,8,9,10]

print('tabela de raízes quadradas')
for x in a:
    print(x, x**0.5)

In [None]:
# Programa dos anos bissextos sem input

anos = [2015, 2014, 2013, 2012, 2000, 1900, 1800]

for a in anos:
    if a % 4 == 0 and not (a % 100 == 0 and not a % 400 == 0):
        print(a , "é bissexto")
    else: 
        print(a, "nao é bissexto")

A iteração de uma _string_ "percorre" os seus **caracteres**. Os espaços e a pontuação também são considerados caracteres.

In [None]:
s = 'Eu sou uma string'

for x in s:
    print(x)

Finalmente, a iteração de dicionários "percorre" as suas **chaves** (apenas as chaves).

In [None]:
d = {'H':1, 'Li':3, 'Na':11, 'K':19}

for x in d:
    print(x)

Mas é fácil usar as chaves para obter uma tabela de chaves-valores:

In [None]:
grupo1 = {'H':1, 'Li':3, 'Na':11, 'K':19}

print('elementos do grupo 1')

for e in grupo1:
    print(e, grupo1[e])

A ordem da iteração das chaves num dicionário é "incerta".

Podemos forçar uma ordem, iterando sobre uma **lista** com as chaves, na ordem desejada: 

In [None]:
grupo1 = {'H':1, 'Li':3, 'Na':11, 'K':19}

print('elementos do grupo 1')
for e in ['H', 'Li', 'Na', 'K']:
    print(e, grupo1[e])

## Exemplos de iteração (e acumulação)

**Problema: somar todos os numeros de 1 a 10**

In [None]:
nums = [1,2,3,4,5,6,7,8,9,10]

s = 0
for i in nums:
    s = s + i

print('a soma de', nums, 'é', s)

O papel de `s` neste exemplo é o de "acumular" a soma de sucessivos valores obtidos da iteração dos elementos da lista `nums`.

Inicialmente, antes de começar a iteração (antes do programa entrar no comando `for`), `s` tem o valor 0. Cada vez que "passamos" a um novo valor `i`, este é somado ao valor anterior de `s`. Assim, conseguimos acumular a soma de todos os `i`.

**Problema: somar todos os números de 1 a 1000**

Desta vez não vamos criar a lista de numeros explicitamente (e manualmente)

In [None]:
s = 0

for i in range(1, 1001):
    s = s + i

print('a soma dos números de 1 a 1000 é', s)

## `range()`: coleção de números inteiros

A função `range()`, que pode ter até 3 argumentos, `range(início, fim, passo)`, é usada num comando `for` para percorrer uma coleção de **números inteiros**,

desde `início` até `fim`, **exclusivé**, de `passo` em `passo`.

`início` e `passo` são opcionais.

Se forem omitidos,

- `início` é 0
- `passo` é 1

Nunca esquecer que `fim` **é excluído da lista**

Exemplos:

In [None]:
print('-- range(12) ----------')
# acaba em 12 (exclusivé), começa em 0 e percorre de 1 em 1.

for i in range(12):
    print(i)

In [None]:
print('-- range(5, 12) ----------')
# começa em 5, acaba em 12 (exclusivé) e percorre de 1 em 1.

for i in range(5, 12):
    print(i)

In [None]:
print('-- range(5, 12, 2) ----------')
# começa em 5, acaba em 12 (exclusivé) e percorre de 2 em 2.

for i in range(5, 12, 2):
    print(i)

**Problema: calcular o factorial de 1000**

In [None]:
fact = 1
for i in range(1, 1001):
    fact = fact * i

print('o factorial de 100 é', fact)

Mais uma vez, temos que acumular os produtos sucessivos. `fact` tem esse papel. É análogo a `s` nos exemplos anteriores.

Aqui a diferença é que estamos a acumular produtos e, por isso, `fact` tem de ter o valor inicial de 1 antes de começar a iteração. 

Agora um problema semelhante, mas usando strings:

**obter a sequência da cadeia complementar de uma sequência de DNA**

In [None]:
seq = 'ATGGTCAAACTTGTTGACTGCAAATGCGTACGT'

seqcomp = ''
for b in seq:
    if b == 'A':
        bcomp = 'T'
    elif b == 'T':
        bcomp = 'A'
    elif b == 'G':
        bcomp = 'C'
    else:
        bcomp = 'G'
    seqcomp = seqcomp + bcomp
        
print('sequência:   ', seq)
print('complementar:', seqcomp)

Neste exemplo, temos de acumular as letras das bases complementares. Usamos `seqcomp`. 

Desta vez, antes da iteração temos de começar com uma "_string_ vazia".

As duas aspas consecutivas na atribuição `seqcomp = ''` definem uma uma "_string_ vazia".

O programa pode ser modificado elminando os `if...elif...elif...else`.

Podemos usarmos um dicionário que associe cada base à sua base complementar

In [None]:
seq = 'ATGGTCAAACTTGTTGACTGCAAATGCGTACGT'

seqcomp = ''

complementares = {'A': 'T', 'T': 'A', 'C': 'G', 'G': 'C'}

for b in seq:
    seqcomp = seqcomp + complementares[b]
        
print('sequência:   ', seq)
print('complementar:', seqcomp)

Agora um problema mais elaborado:

**converter uma sequência com códigos de uma letra de aminoácidos para códigos de 3 letras, usando um dicionário para a conversão.**

In [None]:
trans = {'A': 'Ala', 'C': 'Cys', 'E': 'Glu', 'D': 'Asp', 'G': 'Gly', 'F': 'Phe', 'I': 'Ile', 'H': 'His', 'K': 'Lys', 'M': 'Met', 'L': 'Leu', 'N': 'Asn', 'Q': 'Gln', 'P': 'Pro', 'S': 'Ser', 'R': 'Arg', 'T': 'Thr', 'W': 'Trp', 'V': 'Val', 'Y': 'Tyr'}

# Problema: transformar seq1 numa string com os códigos de 3 letras dos aa
seq1 = 'ADKLITCWFHHWE'

seq3 = ''
for aa in seq1:
    seq3 = seq3 + trans[aa] + '-'

print(seq1, 'é o mesmo que ', seq3)

## `len()`: número de elementos de uma coleção.

A função `len()` **pode ser aplicada a qualquer coleção**, devolvendo o **número de elementos** contidos nessa coleção.

In [None]:
a = [2,4,6,8,10, 'viria o 12', 'e depois o 14']
s = 'Eu sou uma pequena string'
trans = {'A': 'Ala', 'C': 'Cys', 'E': 'Glu', 'D': 'Asp', 'G': 'Gly', 'F': 'Phe', 'I': 'Ile', 'H': 'His', 'K': 'Lys', 'M': 'Met', 'L': 'Leu', 'N': 'Asn', 'Q': 'Gln', 'P': 'Pro', 'S': 'Ser', 'R': 'Arg', 'T': 'Thr', 'W': 'Trp', 'V': 'Val', 'Y': 'Tyr'}

print(len(a))
print(len(s))
print(len(trans))

## Comando `break`

O comando `break` permite uma *saída prematura* de uma iteração: podemos não chegar ao fim de todos os elementos da coleção que está a ser iterada se passarmos por um comando `break`.

Tem utilidade desde que seja utilizado com um `if` para testar uma condição.

Problema:

**Obter a sequência da cadeia complementar de uma sequência de DNA, mas parar assim que for encontrado uma citosina (C).**

In [None]:
seq = 'ATGGTTAAACTTGTTGACTGCAAATGCGTACGT'

seqcomp = ''

complementares = {'A': 'T', 'T': 'A', 'C': 'G', 'G': 'C'}

for b in seq:
    if b == 'C':
        break
    seqcomp = seqcomp + complementares[b]
        
print('sequência:   ', seq)
print('complementar:', seqcomp)

## Comando `while`

In [None]:
#contagem decrescente
count = 10
while count > 0:
    print(count)
    count = count - 1
print('kabum!')

O comando while é pouco usado na linguagem Python. Muitas vezes a repetição é usada como **iteração de elementos de uma coleção**.