# Coleções e iterações

## Coleções

Coleções são objetos que contêm mais do que um valor.

As principais coleções usadas em Python são:

- Sequências:

    + **listas**
    + _**strings**_

- **dicionários**

### Listas

In [1]:
a = [2, 4, 3.1415, 'eu aqui', "fim da lista"]

`a` é uma **lista**.

Uma lista é simplesmente um conjunto de elementos reunidos num único "objeto".

São usados `[]` para indicar explicitamente os elementos da lista.

As listas podem ter elementos de vários tipos e até serem indicadas com expressões:

In [2]:
a = [19, 14/2, 5.0**3, 'Bom dia']
b = 1
c = [b, b+1, (b+2)**3]

print 'a =', a
print 'c =', c

a = [19, 7, 125.0, 'Bom dia']
c = [1, 2, 27]


Uma propriedade fundamental das listas é que a **ordem dos elementos tem significado** e uma lista pode ser "**indexável**" com numeros inteiros.

In [3]:
a = [19, 14/2, 5.0**3, 'Bom dia']

print 'a =', a
print a[0]
print a[1]
print a[2]
print a[3]

a = [19, 7, 125.0, 'Bom dia']
19
7
125.0
Bom dia


A ordem dos elementos **começa a contar do zero** e vai até $n-1$ em que $n$ é o número de elementos da lista.

### _strings_

As _strings_ podem ser entendidas como **coleções de caracteres**

As _strings_ também têm uma numeração implícita, a contar do zero.

In [4]:
s = 'Eu sou uma pequena string'
print s

print s[0]
print s[3]

Eu sou uma pequena string
E
s


### Dicionários

Dicionários são *associações* entre **chaves** e **valores**.

In [5]:
d = {'H': 1, 'Li': 3, 'Na': 11, 'K': 19}

Neste exemplo,

`'H'`,`'Li'`,`'Na'`,`'K'`, são as **chaves** do dicionário

`1`,`3`,`11`,`19`, são os respetivos **valores**

Ao contrário das listas e das *strings*, a **ordem dos elementos num dicionário não tem significado** mas um dicionário pode ser "**indexável**" com as *chaves*:

In [6]:
d = {'H':1, 'Li':3, 'Na':11, 'K':19}

print 'd =', d
print
print d['K']
print d['Li']

d = {'H': 1, 'K': 19, 'Na': 11, 'Li': 3}

19
3


## Iteração de coleções: comando `for`

Iteração é um conceito geral, que consiste em aplicar um conjunto de instruções ou comandos a **cada um dos elementos de uma coleção**.

Em Python é usado o comado `for` para esse efeito.

In [7]:
a = [2,4,6,8,10, 'viria o 12', 'e depois o 14']

for x in a:
    print x

2
4
6
8
10
viria o 12
e depois o 14


In [8]:
#tabela de raízes quadradas
a = [1,2,3,4,5,6,7,8,9,10]

print 'tabela de raízes quadradas'
for x in a:
    print x, x**0.5

tabela de raízes quadradas
1 1.0
2 1.41421356237
3 1.73205080757
4 2.0
5 2.2360679775
6 2.44948974278
7 2.64575131106
8 2.82842712475
9 3.0
10 3.16227766017


In [9]:
# Programa dos anos bissextos sem input

anos = [2015, 2014, 2013, 2012, 2000, 1900, 1800]

for a in anos:
    if a % 4 == 0 and not (a % 100 == 0 and not a % 400 == 0):
        print a , "é bissexto"
    else: 
        print a, "nao é bissexto"

2015 nao é bissexto
2014 nao é bissexto
2013 nao é bissexto
2012 é bissexto
2000 é bissexto
1900 nao é bissexto
1800 nao é bissexto


A iteração de uma _string_ "percorre" os seus **caracteres**. Os espaços e a pontuação também são considerados caracteres.

In [10]:
s = 'Eu sou uma string'

for x in s:
    print x

E
u
 
s
o
u
 
u
m
a
 
s
t
r
i
n
g


Finalmente, a iteração de dicionários "percorre" as suas **chaves** (apenas as chaves).

In [11]:
d = {'H':1, 'Li':3, 'Na':11, 'K':19}

for x in d:
    print x

H
K
Na
Li


Mas é fácil usar as chaves para obter uma tabela de chaves-valores:

In [12]:
grupo1 = {'H':1, 'Li':3, 'Na':11, 'K':19}

print 'elementos do grupo 1'

for e in grupo1:
    print e, grupo1[e]

elementos do grupo 1
H 1
K 19
Na 11
Li 3


A ordem da iteração das chaves num dicionário é "incerta".

Podemos forçar uma ordem, iterando sobre uma **lista** com as chaves, na ordem desejada: 

In [13]:
grupo1 = {'H':1, 'Li':3, 'Na':11, 'K':19}

print 'elementos do grupo 1'
for e in ['H', 'Li', 'Na', 'K']:
    print e, grupo1[e]

elementos do grupo 1
H 1
Li 3
Na 11
K 19


**Problema: somar todos os numeros de 1 a 10**

In [14]:
nums = [1,2,3,4,5,6,7,8,9,10]

s = 0
for i in nums:
    s = s + i

print 'a soma de', nums, 'é', s

a soma de [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] é 55


O papel de `s` neste exemplo é o de "acumular" a soma de sucessivos valores obtidos da iteração dos elementos da lista `nums`.

Inicialmente, antes de começar a iteração (antes do programa entrar no comando `for`), `s` tem o valor 0. Cada vez que "passamos" a um novo valor `i`, este é somado ao valor anterior de `s`. Assim, conseguimos acumular a soma de todos os `i`.

**Problema: somar todos os números de 1 a 1000**

Desta vez não vamos criar a lista de numeros explicitamente (e manualmente)

In [15]:
s = 0

for i in range(1, 1001):
    s = s + i

print 'a soma dos números de 1 a 1000 é', s

a soma dos números de 1 a 1000 é 500500


## `range()`: coleção de números inteiros

A função `range()`, que pode ter até 3 argumentos, `range(início, fim, passo)`, é usada num comando `for` para percorrer uma coleção de **números inteiros**,

desde `início` até `fim`, **exclusivé**, de `passo` em `passo`.

`início` e `passo` são opcionais.

Se forem omitidos,

- `início` é 0
- `passo` é 1

Nunca esquecer que `fim` **é excluído da lista**

Exemplos:

In [16]:
print '-- range(12) ----------'
# acaba em 12 (exclusivé), começa em 0 e percorre de 1 em 1.

for i in range(12):
    print i

-- range(12) ----------
0
1
2
3
4
5
6
7
8
9
10
11


In [17]:
print '-- range(5, 12) ----------'
# começa em 5, acaba em 12 (exclusivé) e percorre de 1 em 1.

for i in range(5, 12):
    print i

-- range(5, 12) ----------
5
6
7
8
9
10
11


In [18]:
print '-- range(5, 12, 2) ----------'
# começa em 5, acaba em 12 (exclusivé) e percorre de 2 em 2.

for i in range(5, 12, 2):
    print i

-- range(5, 12, 2) ----------
5
7
9
11


**Problema: calcular o factorial de 1000**

In [19]:
fact = 1
for i in range(1, 1001):
    fact = fact * i

print 'o factorial de 100 é', fact

o factorial de 100 é 4023872600770937735437024339230039857193748642107146325437999104299385123986290205920442084869694048004799886101971960586316668729948085589013238296699445909974245040870737599188236277271887325197795059509952761208749754624970436014182780946464962910563938874378864873371191810458257836478499770124766328898359557354325131853239584630755574091142624174743493475534286465766116677973966688202912073791438537195882498081268678383745597317461360853795345242215865932019280908782973084313928444032812315586110369768013573042161687476096758713483120254785893207671691324484262361314125087802080002616831510273418279777047846358681701643650241536913982812648102130927612448963599287051149649754199093422215668325720808213331861168115536158365469840467089756029009505376164758477284218896796462449451607653534081989013854424879849599533191017233555566021394503997362807501378376153071277619268490343526252000158885351473316117021039681759215109077880193931781141945452572238655414610628

Mais uma vez, temos que acumular os produtos sucessivos. `fact` tem esse papel. É análogo a `s` e `seq3` nos exemplos anteriores.

Aqui a diferença é que estamos a acumular produtos e, por isso, `fact` tem de ter o valor inicial de 1 antes de começar a iteração. 

Agora um problema mais elaborado:

**converter uma sequência com códigos de uma letra de aminoácidos para códigos de 3 letras, usando um dicionário para a conversão.**

In [20]:
trans = {'A': 'Ala', 'C': 'Cys', 'E': 'Glu', 'D': 'Asp', 'G': 'Gly', 'F': 'Phe', 'I': 'Ile', 'H': 'His', 'K': 'Lys', 'M': 'Met', 'L': 'Leu', 'N': 'Asn', 'Q': 'Gln', 'P': 'Pro', 'S': 'Ser', 'R': 'Arg', 'T': 'Thr', 'W': 'Trp', 'V': 'Val', 'Y': 'Tyr'}

# Problema: transformar seq1 numa string com os códigos de 3 letras dos aa
seq1 = 'ADKLITCWFHHWE'

seq3 = ''
for aa in seq1:
    seq3 = seq3 + trans[aa] + '-'

print seq1, 'é o mesmo que ', seq3

ADKLITCWFHHWE é o mesmo que  Ala-Asp-Lys-Leu-Ile-Thr-Cys-Trp-Phe-His-His-Trp-Glu-


Antes da iteração com `for` iniciamos uma _string_,  `seq3`, vazia (isto é, com aspas vazias `''`), à qual vamos acrescentando a "tradução" dos códigos de uma letra, aminoácido a aminoácido. O papel de `seq3` é análogo ao de `s` no exemplo anterior. Só que, desta vez, "acumulamos" por "soma" de _strings_. Por isso, `seq3` é inicializado com `''`.

## `len()`: número de elementos de uma coleção.

A função `len()` **pode ser aplicada a qualquer coleção**, devolvendo o **número de elementos** contidos nessa coleção.

In [21]:
a = [2,4,6,8,10, 'viria o 12', 'e depois o 14']
s = 'Eu sou uma pequena string'
trans = {'A': 'Ala', 'C': 'Cys', 'E': 'Glu', 'D': 'Asp', 'G': 'Gly', 'F': 'Phe', 'I': 'Ile', 'H': 'His', 'K': 'Lys', 'M': 'Met', 'L': 'Leu', 'N': 'Asn', 'Q': 'Gln', 'P': 'Pro', 'S': 'Ser', 'R': 'Arg', 'T': 'Thr', 'W': 'Trp', 'V': 'Val', 'Y': 'Tyr'}

print len(a)
print len(s)
print len(trans)

7
25
20


## Comando `while`

In [22]:
#contagem decrescente
count = 10
while count > 0:
    print count
    count = count - 1
print 'kabum!'

10
9
8
7
6
5
4
3
2
1
kabum!


O comando while é pouco usado na linguagem Python. Muitas vezes a repetição é usada como **iteração de elementos de uma coleção**.