**Coleções** são conjuntos de dados. Como visto anteriormente, algumas das coleções mais importantes em Python são: listas, dicionários, tuplas e sets. Vamos ver mais detalhes sobre cada uma.

## Listas

Listas são declaradas usando colchetes

In [1]:
l1 = [4, 3, 5, 9]

### Funções

Já vimos algumas funções disponíveis para listas:

In [2]:
print(len(l1))  # tamanho, número de itens
print(sum(l1))  # soma dos valores

4
21


In [3]:
print(sorted(l1))  # retorna os valores da lista ordenados
print(min(l1))  # retorna o valor mínimo da lista
print(max(l1))  # retorna o valor máximo da lista

[3, 4, 5, 9]
3
9


Vamos ver o que acontece quando tentamos somar duas listas

In [4]:
l2 = [6, 6, 6, 6]
print(l1 + l2)

[4, 3, 5, 9, 6, 6, 6, 6]


Vemos que as listas são concatenadas, assim como strings.

No futuro, veremos sobre o módulo numpy que permite a soma entre valores de listas diferentes.

Existe uma forma simples de criar listas com valores repetidos

In [5]:
# Criando uma lista com 10 zeros
l_zeros = [0]*10  # Usamos o sinal de multiplicação
print(l_zeros)

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]


A "multiplicação" também funciona com listas com mais de um valor

In [6]:
print([5,6]*3)

[5, 6, 5, 6, 5, 6]


### Métodos

Um método é uma função que “pertence” a uma instância de uma classe (objeto).

Diferentes objetos podem apresentar métodos diferentes, ou mesmo possuirem o mesmo método.

Diferentemente das funções "gerais", que são chamadas através de seu nome, seguido de parênteses e o objeto (ex: `len(l1)`), métodos são chamados usando o nome do objeto seguido de `.method_name()`

[Documentação: Classes](https://docs.python.org/pt-br/3/tutorial/classes.html)

Por exemplo, o método `.sort()` pode ser usado para ordenar os valores de uma lista. Note as diferenças com relação à função `sorted()`

In [7]:
l1 = [5, 1, 6, 9]
print(l1)
sorted(l1)
print(l1)  # l1 não é alterada quando chamamos sorted(l1)

[5, 1, 6, 9]
[5, 1, 6, 9]


A forma correta de usar a função `sorted()` é atribuindo seu output a outra variável:

In [8]:
l2 = sorted(l1)
print(l2)

[1, 5, 6, 9]


Veja que usando o método `.sort()`, o resultado é diferente

In [9]:
l1 = [5, 1, 6, 9]
print(l1)
l1.sort()
print(l1)  # l1 foi alterada!

[5, 1, 6, 9]
[1, 5, 6, 9]


Veja a diferença entre o output depois do uso da função e do método:

In [10]:
l1 = [5, 1, 6, 9]
print(sorted(l1))
print(l1.sort())

[1, 5, 6, 9]
None


Ou seja: a **função** `sorted()` retorna um objeto e **não modifica** o objeto original. O **método** `.sort()` não retorna um objeto (retorna None) e **modifica** diretamente o objeto original.

Outros métodos e palavras-chave para trabalhar com listas:

`append`: adiciona um valor ao final da lista

In [11]:
l1 = [5, 1, 6, 9]
l1.append(88)  
print(l1)

[5, 1, 6, 9, 88]


`clear`: limpa todos os valores da lista

In [3]:
l1 = [5, 1, 6, 9]
l1.clear()  
print(l1)

[]


`index`: retorna o índice da primeira ocorrência do valor passado

In [13]:
l1 = ["a", "b", "c"]
print(l1.index("a"))  

0


`insert`: insere um item em uma determinada posição da lista

In [6]:
l1 = [5, 1, 6, 9]
l1.insert(2, 88)  # inserir número 88 na posição 2
print(l1)

[5, 1, 88, 6, 9]


`pop`: remove o último valor da lista e retorna esse valor

In [12]:
l1 = [5, 1, 6, 9]
l1.pop()  # se declarar x = l1.pop(), o valor removido será atribuído à variável x
print(l1)

[5, 1, 6]


`reverse`: inverte a ordem dos itens de uma lista

In [4]:
l1 = [5, 1, 6, 9]
l1.reverse()  
print(l1)

[9, 6, 1, 5]


**Palavras-chave**

`del`: remove um valor da lista

In [2]:
l1 = [5, 1, 6, 9]
del l1[0]  # modifica a lista!
print(l1)

[1, 6, 9]


`in`: keyword especial, verifica se um valor se encontra na lista e retorna um boolean (veja o próximo notebook)

In [14]:
l1 = ["a", "b", "c"]
print("b" in l1)
print("d" in l1)

True
False


Por fim, para listar os métodos disponíveis para um objeto, use `help()`

Veja em "Methods defined here:" todos os métodos disponíveis para listas.

In [1]:
help(list)

Help on class list in module builtins:

class list(object)
 |  list(iterable=(), /)
 |  
 |  Built-in mutable sequence.
 |  
 |  If no argument is given, the constructor creates a new empty list.
 |  The argument must be an iterable if specified.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __iadd__(self, value, /)
 |      Implement self+=value.
 |  
 |  __imul__(self, value, /)
 |      Implement self*=value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self))

### Indexação

É uma forma de localizar itens em uma lista. Cada item em uma lista tem uma posição, mas o Python tem uma peculiaridade: os índices começam em 0, e não em 1. Portanto, o primeiro item da lista é o item 0, o segundo é o item 1, etc.

Para indexar um valor em uma lista usamos o número do índice entre colchetes. Cuidado! Em Python, o mesmo símbolo pode ter significados diferentes em contextos diferentes. Lembre-se que os colchetes podem ser usados para declarar listas, mas nesse caso, não representam listas, e sim índices de uma lista. Um outro exemplo é o símbolo `*`, lembre-se que ele pode representar: multiplicação de números, criação de listas com valores repetidos, e, no caso de declaração de uma função, representa argumentos com número indeterminado.

Vejamos como indexar itens em uma lista:

In [15]:
l1 = ["Alberto", "Carla", "Pedro", "Maria", "Mariana"]

print(l1[0])  # O primeiro item da lista l1

Alberto


In [16]:
print(l1[0], l1[2])  # O primeiro e o terceiro item da lista l1

Alberto Pedro


Usando índices negativos, podemos indexar começando do final da lista. O último valor de uma lista está no índice -1, o penúltimo -2, e assim por diante

In [17]:
print(l1[-1])

Mariana


Listas são mutáveis, o que significa que valores de uma lista podem ser alterados usando declarações:

In [18]:
print(l1)
l1[0] = "Novo nome"  # declaramos que o valor no índice 0 da lista l1 passa a ser "Novo nome"
print(l1)  # a lista é modificada

['Alberto', 'Carla', 'Pedro', 'Maria', 'Mariana']
['Novo nome', 'Carla', 'Pedro', 'Maria', 'Mariana']


### Slicing

É uma outra forma de indexar, mas em vez de selecionarmos índices individuais, selecionamos intervalos de índices. Para isso, usamos dois pontos.

Por exemplo, para selecionarmos do primeiro ao segundo item da lista l1, fazemos:

In [19]:
print(l1[0:2])

['Novo nome', 'Carla']


Observe que, apesar de termos colocado o índice 2, o valor de índice 2 não foi incluído no slicing. Dizemos que o slicing é não-inclusivo, ou seja, os itens retornados vão até *o último índice anterior* ao que foi declarado. Se quiséssemos retornar do primeiro ao terceiro item, teríamos que usar:

In [20]:
print(l1[0:3])  # retorma itens 0, 1 e 2

['Novo nome', 'Carla', 'Pedro']


Do segundo ao quarto:

In [21]:
print(l1[2:5])  # 2, 3 e 4

['Pedro', 'Maria', 'Mariana']


Também podemos usar **intervalos abertos** para selecionar do primeiro até o índice desejado, ou de um índice desejado até o último.

Por exemplo, do segundo até o último item da lista:

In [22]:
print(l1[2:])

['Pedro', 'Maria', 'Mariana']


Do primeiro até o quarto:

In [23]:
print(l1[:5])

['Novo nome', 'Carla', 'Pedro', 'Maria', 'Mariana']


Usando índices negativos

In [24]:
print(l1[2:-1])

['Pedro', 'Maria']


### Listas de listas

É possível criar listas dentro de listas, por exemplo, podemos criar uma matriz 3x3:

In [25]:
m = [[0, 1, 2], [3, 4, 5], [6, 7, 8]]

A declaração abaixo é igual à anterior, mas é mais fácil visualizar as linhas e colunas:

In [26]:
m = [
    [0, 1, 2], 
    [3, 4, 5],
    [6, 7, 8]
]

Para acessar o número 5, que é o terceiro item da segunda linha, usamos indexação dupla, lembrando que, em Python, os índices começam em zero:

In [27]:
print(m[1][2])  #  índice da linha 1, item de índice 2

5


Podemos também usar slicing para selecionar os itens 6 a 8, lembrando que slicing é não-inclusivo:

In [28]:
print(m[2][0:3])  # ou print(m[2][0:])

[6, 7, 8]


## Tuplas

São similares às listas, mas declaradas com parênteses. Importante: operações em Python também podem estar entre parênteses. O Python é capaz de diferenciar as duas aplicações. Exemplo:

In [29]:
a = (2*5)**(100/50)  # O código dentro dos parênteses é executado primeiro. Não são tuplas

In [30]:
tup = (5, 6, 9, 10, 6, 74)  # Isso é uma tupla, similar a uma lista, mas declarada com parênteses

In [31]:
type(tup)

tuple

Tuplas aceitam indexação e slicing, como as listas

In [32]:
print(tup[0])
print(tup[2:])

5
(9, 10, 6, 74)


Qual a diferença das tuplas para as listas?

Tuplas são **imutáveis**. Uma vez declarada, uma tupla permanecerá como é, a menos que você declare a variável novamente. Vamos tentar alterar uma tupla usando indexação, como foi feito com as listas.

In [33]:
tup[0] = "novo valor"

TypeError: 'tuple' object does not support item assignment

## Sets

Sets são conjuntos com valores não repetidos. São mutáveis (como as listas), mas os valores dentro de um set devem ser imutáveis (como números, strings, tuplas).

Sets podem ser criados a partir de listas:

In [7]:
l1 = [2, 3, 3, 4, 5, 5, 3, 3, 2]
s1 = set(l1)
print(s1)

{2, 3, 4, 5}


Note que o output está ordenado. Isso porque os número usados possuem uma ordem lógica. Nem sempre esse é o caso:

In [12]:
l1 = [42, 'foo', (1, 2, 3), 3.14159]
s1 = set(l1)
print(s1)

{42, 3.14159, 'foo', (1, 2, 3)}


In [11]:
l1 = [2, 3, "nome", 4, (1,2), 5, 3, 3, "abc"]
s1 = set(l1)
print(s1)

{(1, 2), 2, 3, 4, 5, 'abc', 'nome'}


Vemos que no primeiro caso, o número inteiro veio antes da tupla, e o oposto ocorreu no segundo caso.

Também podemos declarar sets usando chaves: `{ }`

In [13]:
s1 = {1, 2, 3}
print(type(s1))

<class 'set'>


Vamos ver alguns métodos dos sets usando a função `help()`:

In [14]:
help(s1)

Help on set object:

class set(object)
 |  set() -> new empty set object
 |  set(iterable) -> new set object
 |  
 |  Build an unordered collection of unique elements.
 |  
 |  Methods defined here:
 |  
 |  __and__(self, value, /)
 |      Return self&value.
 |  
 |  __contains__(...)
 |      x.__contains__(y) <==> y in x.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __iand__(self, value, /)
 |      Return self&=value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  __ior__(self, value, /)
 |      Return self|=value.
 |  
 |  __isub__(self, value, /)
 |      Return self-=value.
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __ixor__(self, value, /)
 |      Return self^=value.


Vemos que "o forte" dos sets é a comparação entre sets diferentes. Por exemplo, vamos ver se um set contém (ou é contido) por outro, e obter o resultado da união e da diferença entre sets. 

Obs: o output `True` significa "verdadeiro", e `False`, "falso" (veja mais sobre booleanos no próximo notebook)

In [17]:
s1 = {1, 2, 3}
s2 = {1, 2, 3, 4}
s3 = {1, 3, 9}

print("s1 está contido em s2?", s1.issubset(s2))
print("s2 está contido em s1?", s2.issubset(s1))
print("s2 contém s1?", s2.issuperset(s1))
print("s3 está contido em s2?", s3.issubset(s2))
print("Diferença entre s2 e s3", s2.difference(s3))
print("Diferença entre s3 e s2", s3.difference(s2))
print("União de s1 e s3", s1.union(s3))

s1 está contido em s2? True
s2 está contido em s1? False
s2 contém s1? True
s3 está contido em s2? False
Diferença entre s2 e s3 {2, 4}
Diferença entre s3 e s2 {9}
União de s1 e s3 {1, 2, 3, 9}


Agora, um problema interessante: *essa frase é composta de quantos caracteres diferentes?*

É fácil resolver esse problema usando sets:

In [18]:
frase = "essa frase é composta de quantos caracteres diferentes?"
print("Caracteres únicos:", set(frase))  # note que o set não é ordenado!
print("Número de caracteres únicos:", len(set(frase)))  # usei a função len para determinar o tamanho do set

Caracteres únicos: {'f', 'o', 'e', 'r', 'm', ' ', 'a', 'é', 't', 'd', 'u', 'n', 'i', 'c', '?', 'p', 'q', 's'}
Número de caracteres únicos: 18


## Dicionários

[Documentação](https://docs.python.org/pt-br/3/tutorial/datastructures.html#dictionaries)

Assim como os sets, os dicionários são declarados com chaves `{ }`, mas de forma diferente, pois incluímos dois pontos `:` para declarar pares de chaves:valores (cuidado para não confundir: "chaves" pode significar tanto as chaves do dicionário quanto as chaves usadas para declarar dicionários `{ }`. Para evitar confusão, vou usar o termo em inglês *keys:values* para me referir às chaves e valores dentro de um dicionário). 

As keys devem ser imutáveis, como strings, inteiros e tuplas. O valor do dicionário está em podermos resgatar um valor utilizando uma key, em vez de utilizando um índice, como no caso das listas. 

Por exemplo, faz mais sentido guardar um dicionário com as capitais dos países do que uma lista, pois, com o dicionário, podemos resgatar a capital chamando pelo nome do país:

In [34]:
paises_capitais = {"Alemanha":"Berlim", "Brasil":"Brasília", "Canadá":"Ottawa"}

In [35]:
paises_capitais[0]  # Não faz sentido, dicionários não possuem índice numérico

KeyError: 0

In [36]:
paises_capitais["Brasil"]  # assim acessamos o valor correspondente à chave Brasil

'Brasília'

Em breve, veremos aplicações das coleções para uso iterativo, com os loops