(cap:estruturas_dados_loops)=
# Estruturas de dados e loops

Até agora vimos tipos que continham somente um valor, exceto as strings, que podíamos entender como uma sequência de caracteres. Porém, tais variáveis tem utilidade limitada na área científica. No máximo, você conseguiria representar um par de pontos como um número complexo, mas isso está muito aquem de algo desejado, como um vetor, uma matriz ou uma tabela.

Neste capítulo iremos abordar algumas estruturas de dados embutidas em Python para armazenar sequências, conjuntos ou equivalências de valores. Iremos ver como criar essas estruturas, adicionar ou remover elementos, checar se um objeto já é membro, e como operar sobre as estruturas.

Tais estruturas não possuem um tamanho pré-definido. Para operar sobre todos os elementos dessas estruturas, torna-se necessário algum método que permita que você realize um mesmo conjunto de ações várias vezes, sem saber de antemão o número de vezes. Esses são chamados *loops* ou laços. Iremos aprender como utilizar tais loops em todos os elementos de uma estrutura de dados, mas também executar ações um número específico de vezes.

(sec:listas)=
## A estrutura de dados mais básica: a lista

Uma lista é uma estrutura de dados que junta elementos de tipos diversos em sequência, e pode aumentar ou diminuir seu comprimento sem problemas (ela é mutável). Apesar dos tipos dos objetos em uma lista poderem ser distintos, é geralmente mais útil que todos sejam de um mesmo tipo, para simplificar a lógica quando operarmos por todos os elementos.

### Criação

Para criar uma lista, basta colocar os elementos entre colchetes `[]`, separados por vírgulas. Vejamos um exemplo:

In [1]:
letras_minúsculas = [
    'a', 'b', 'c', 'd', 'e', 'f',
    'g', 'h', 'i', 'j', 'k', 'l',
    'm', 'n', 'o', 'p', 'q', 'r', 
    's', 't', 'u', 'v', 'w', 'x', 
    'y', 'z'
]
letras_minúsculas

['a',
 'b',
 'c',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'k',
 'l',
 'm',
 'n',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'v',
 'w',
 'x',
 'y',
 'z']

Como vimos com parênteses, os colchetes também flexibilizam as regras de indentação de código dentro deles.

Além dessa maneira, podemos converter outros tipos em listas. Como vimos que strings também são como sequências, podemos converter uma string numa lista utilizando a função `list`.

In [2]:
local = 'citadelStation'
lst_local = list(local)
lst_local

['c', 'i', 't', 'a', 'd', 'e', 'l', 'S', 't', 'a', 't', 'i', 'o', 'n']

E podemos também fazer o caminho inverso, convertendo uma lista de `str` em uma `str` só. Isso é uma ação relativamente comum, mas é feita de uma maneira pouco intuitiva. Para isso, utilize o método interno `.join` de uma string, que agirá como o separador dos elementos.

In [3]:
novo_local = ''.join(lst_local)
novo_local

'citadelStation'

In [4]:
novo_local == local

True

Podemos também gerar uma lista vazia simplesmente utilizando um par de colchetes:

In [5]:
vazia = []
vazia

[]

E lembre-se que conteineres vazios são considerados como "falsy", então:

In [6]:
if vazia:
    print('Esta linha não deveria ser executada')

### Adição e remoção de membros específicos

Podemos adicionar membros utilizando o método `.append`

In [7]:
vazia.append('a')
vazia

['a']

Se você executar o código acima várias vezes, irá notar que a lista vai aumentando gradualmente.

Se você quiser remover um valor específico, pode utilizar o método `.remove`. Se o elemento não existir, um `ValueError` será lançado. 

In [8]:
vazia.remove('a')
vazia

[]

### Indexação

Para acessar um elemento de uma lista, você pode usar a notação de colchetes, com o índice do elemento dentro do colchete.

Isso pode ser um pouco confuso para iniciantes, mas a numeração em Python começa do zero, e não inclui o elemento com índice igual ao comprimento. E não se esqueça que um índice precisa ser um número inteiro! Não existe elemento `0.2`. Lembre-se das operações de divisão inteira que vimos no [capítulo de operações matemáticas](cap:op_matematicas)

Para ilustração, este são as letras minúsculas e seus índices

    a  b  c  d  e  f  g ... x  y  z
    0  1  2  3  4  5  6 ... 23 24 25

Essa é somente *uma* maneira possível de indexar elementos em ciência de computação. MATLAB, por exemplo, começa do 1 e inclui o índice igual ao comprimento, uma notação um pouco mais natural à manipulação de matrizes. Apesar de tudo, isso é uma fonte comum de bugs e confusões, então seja sempre cauteloso. Se você tentar acessar um índice inexistente, um `IndexError` será lançado.

In [9]:
len(letras_minúsculas)

26

In [10]:
letras_minúsculas[0]

'a'

In [11]:
letras_minúsculas[25]

'z'

In [12]:
letras_minúsculas[26]

IndexError: list index out of range

Com a indexação, você pode alterar diretamente os valores de uma lista, utilizando os operadores de atribuição ou atribuição aumentada.

In [13]:
lista = [1, 2, 3, 4, 5]
lista[0] = lista[0] + 10
lista[1] += 5
lista

[11, 7, 3, 4, 5]

### Slicing

Caso você queira seccionar uma lista, pode utilizar a notação de colchetes, separando os índices de início e fim com `:`. Aqui, o índice de fim **não é incluído** na seção, então, se você deseja seccionar até o fim de uma lista, precisa seccionar até o `len` dela.

In [14]:
letras_minúsculas[0:5]

['a', 'b', 'c', 'd', 'e']

In [15]:
letras_minúsculas[0:len(letras_minúsculas)]

['a',
 'b',
 'c',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'k',
 'l',
 'm',
 'n',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'v',
 'w',
 'x',
 'y',
 'z']

Para pegar elementos da parte final, fica inconveniente sempre utilizar `len(lista) - x` para significar "exceto os `x` últimos elementos. Existe uma notação de conveniência, onde índices negativos começam do final. Então `-1` significa "último elemento".

In [16]:
letras_minúsculas[len(letras_minúsculas) - 5: len(letras_minúsculas) - 1]

['v', 'w', 'x', 'y']

In [17]:
letras_minúsculas[-5:-1]

['v', 'w', 'x', 'y']

Se você utilizar `None` em um dos lados do `:`, significa que quer incluir tudo daquele lado. Então `None:-1` significa "todos os elementos do começo até, mas não incluindo, o último elemento. Por conveniência, você pode também não colocar nada, e isso será interpretado como `None`. Por exemplo:

In [18]:
letras_minúsculas[-5:None]

['v', 'w', 'x', 'y', 'z']

In [19]:
letras_minúsculas[-5:]

['v', 'w', 'x', 'y', 'z']

Tecnicamente, ao utilizar a notação `início:fim`, você está criando um objeto `slice`. Você pode fazer isso manualmente com a função `slice`.

In [20]:
slice_letras = slice(-5, None)
slice_letras

slice(-5, None, None)

In [21]:
letras_minúsculas[slice_letras]

['v', 'w', 'x', 'y', 'z']

E você também pode usar variáveis na hora de especificar as regiões.

In [22]:
início = 0
fim = 5
letras_minúsculas[início:fim]

['a', 'b', 'c', 'd', 'e']

Os astutos terão notado que na criação de um slice manual, a representação retornada possuía 3 argumentos. `-5, None, None`. Na criação de slices, é possível utilizar outro `:` e especificar o *passo*. Por padrão, o passo é 1, então todos os elementos entre o início e o fim são selecionados. Se o passo for 2, um elemento é pulado. Se o passo for negativo, os elementos serão selecionados de trás para frente, mas ainda começando no início e terminando no fim. Note a diferença:

In [23]:
letras_minúsculas[5:0:-1]

['f', 'e', 'd', 'c', 'b']

In [24]:
letras_minúsculas[0:5:-1]

[]

In [25]:
letras_minúsculas[None:None:5]

['a', 'f', 'k', 'p', 'u', 'z']

Você pode escolher não colocar o início e o fim, e só especificar o passo. Essa é uma maneira comum de reverter a ordem de listas.

In [26]:
letras_minúsculas[::-1]

['z',
 'y',
 'x',
 'w',
 'v',
 'u',
 't',
 's',
 'r',
 'q',
 'p',
 'o',
 'n',
 'm',
 'l',
 'k',
 'j',
 'i',
 'h',
 'g',
 'f',
 'e',
 'd',
 'c',
 'b',
 'a']

### Mais métodos de listas

Temos também mais alguns métodos de listas que podem ser úteis.

* `.pop` remove o último elemento e o retorna, ou `.pop(índice)` remove o elemento no índice especificado e o retorna.

In [27]:
lista = [1, 2, 3, 4, 5]
print(lista.pop(), lista)

5 [1, 2, 3, 4]


* `.insert(índice, elemento)` insere um elemento antes do índice especificado, como um `.pop` inverso.

In [28]:
lista = ['a', 'b', 'd', 'e']
lista.insert(2, 'c') # Insere 'c' antes do elemento de índice 2, que é 'd'
lista

['a', 'b', 'c', 'd', 'e']

* `.extend` aceita uma outra lista e a coloca no fim da lista atual. Note que isso atua na lista diretamente, e não retorna uma lista nova.

In [29]:
lista1 = [1, 2, 3, 4, 5]
lista2 = [6, 7, 8, 9, 10]
lista1.extend(lista2)
print(lista1, lista2)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] [6, 7, 8, 9, 10]


Existe uma operação bem similar a `.extend`, que é a ação de somar duas listas com `+`. Note que essa operação **retorna uma lista nova**, e não altera as listas anteriores.

In [30]:
lista1 = [1, 2, 3, 4, 5]
lista2 = [6, 7, 8, 9, 10]
print(lista1 + lista2, lista1, lista2)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] [1, 2, 3, 4, 5] [6, 7, 8, 9, 10]


* `.count` conta quantos elementos iguais ao especificado existem em uma lista.

In [31]:
lista = [1, 2, 3, 1, 2]
print(lista.count(2), lista.count(1), lista.count(3))

2 2 1


* `.reverse` inverte a ordem dos elementos de uma lista, sem retornar uma lista nova (*in place*).

In [32]:
lista = [1, 2, 3, 4, 5]
print(lista)
print(lista.reverse())  # Por fazer a operação *in place*, `.reverse()` retorna None
print(lista)

[1, 2, 3, 4, 5]
None
[5, 4, 3, 2, 1]


* `.sort` ordena os elementos da lista em ordem crescente *in place*. Se quiser inverter a ordem, forneça o argumento `reverse = True`. A ordem relativa de dois elementos é obtida pelo operador `<`.

In [33]:
lista = [5, 2, 1, 4, 3]
print(lista)
print(lista.sort())
print(lista)

[5, 2, 1, 4, 3]
None
[1, 2, 3, 4, 5]


Se você quiser controlar melhor como controlar os elementos, precisa fornecer uma função para `key`. Por exemplo:

In [34]:
def quadrado(x):
    return x**2
lista = [-2, -1, 0, 1, 2]
lista.sort(key = quadrado)
print(lista)

[0, -1, 1, -2, 2]


Para não precisar definir uma nova função, você pode utilizar [uma função lambda](sec:func_lambda).

In [35]:
lista = [-2, -1, 0, 1, 2]
lista.sort(key = lambda x: x**2)
print(lista)

[0, -1, 1, -2, 2]


* `.index(elemento)` retorna o índice da primeira ocorrência de um elemento em uma lista. Você pode especificar o índice de início e fim se quiser, com argumentos opcionais.

In [36]:
lista = ['a', 'b', 'c', 'c', 'd', 'd', 'e']
print(lista.index('b'), lista.index('e'))

1 6


* `.copy` retorna uma cópia de uma lista. Se você realizar alterações em uma cópia, a lista original não será afetada.

In [37]:
lista = [1, 2, 3, 4, 5]
lista_cópia = lista.copy()
lista_cópia[2] = 1000
print(lista, lista_cópia)

[1, 2, 3, 4, 5] [1, 2, 1000, 4, 5]


Note que isso difere do seguinte:

In [38]:
lista = [1, 2, 3, 4, 5]
lista_ref = lista
lista_ref[2] = 1000
print(lista, lista_ref)

[1, 2, 1000, 4, 5] [1, 2, 1000, 4, 5]


```{note}
Por que isso ocorre? Lembra-se de nossa analogia, de variáveis sendo "caixinhas" com "etiquetas de nome"? Neste caso, temos só uma caixinha com duas etiquetas, ou seja, você pode se referir à mesma lista por diferentes nomes. Então, qualquer operação que realizar com `lista_ref`, estará realizando com `lista` também, pois se tratam da mesma variável por trás dos panos.
```

Podemos verificar esse problema utilizando a função `id`. Essa função retorna um número único para cada objeto que existe na memória do Python.

In [39]:
print(id(lista) == id(lista_cópia))
print(id(lista) == id(lista_ref))

False
True


Quando você utiliza `.copy`, você força que uma nova "caixinha" seja criada, e copia todo o conteúdo para a caixa nova. Então você consegue realizar as operações. Até agora, não nos deparamos com este problema porque todas as variáveis que vimos são **imutáveis**, ou seja, você não consegue alterar o estado delas, inclusive strings! Quando você faz `contador += 1`, você está, na verdade, criando um novo objeto e atribuindo o valor dele com base no valor anterior, e potencialmente descartando o objeto antigo. Veja o seguinte exemplo:

In [40]:
contador = 0
id1 = id(contador)
contador += 1
id2 = id(contador)
print(id1 == id2)

False


Já quando você opera com uma lista, o mesmo objeto é mantido. Veja o exemplo:

In [41]:
lista = []
id1 = id(lista)
lista.append('a')
id2 = id(lista)
print(id1 == id2)

True


E mesmo dentro de uma lista **mutável**, objetos podem continuar **imutáveis**. Veja que aqui eu modifico o elemento dentro de uma lista e vejo que seu `id` muda.

In [42]:
lista = ['a']
id1 = id(lista[0])
lista[0] += 'b'
id2 = id(lista[0])
print(id1 == id2)

False


Quando temos dois objetos e queremos saber se possuem `id`s diferentes, mas sem precisar fazer a comparação aqui, podemos usar `is`.

In [43]:
lista1 = []
lista2 = []
print(lista1 == lista2)
print(id(lista1) == id(lista2))
print(lista1 is lista2)

True
False
False


Por detalhes de implementação, o código acima não funciona com números e strings curtos.

Você pode se perguntar porque saber se um objeto é mutável ou imutável é importante. Isso será visto na [seção de dicionários](sec:dicts).

```{warning}
Se você quer pegar um objeto a partir de seu `id`, [pode seguir os passos neste post](https://stackoverflow.com/questions/15011674/is-it-possible-to-dereference-variable-ids), mas cuidado, é um tópico bastante avançado!
```

(sec:aninhamento_listas)=
### Aninhamento de listas

Quando uma lista contém outra lista em seu interior, dizemos que as listas estão aninhadas. Isso acaba sendo a maneira natural de representar estruturas multidimensionais, como uma matriz.

In [44]:
matriz_identidade = [
    [1, 0, 0],
    [0, 1, 0],
    [0, 0, 1]
]
matriz_identidade

[[1, 0, 0], [0, 1, 0], [0, 0, 1]]

Nesta maneira de organizar uma matriz, para acessar a linha `m` columa `n`, pode utilizar sequencialmente os operadores `[]`, `[m][n]`.

In [45]:
print(matriz_identidade[0][0], matriz_identidade[1][0])

1 0


Note o que ocorre com este código

In [46]:
linha1 = [1, 2, 3]
linha2 = [4, 5, 6]
linha3 = [7, 8, 9]
matriz = [linha1, linha2, linha3]
linha2[1] = 1000
matriz

[[1, 2, 3], [4, 1000, 6], [7, 8, 9]]

Isso ocorre porque `matriz` armazenou referências às outras 3 listas, então modificar uma dessas listas faz com que `matriz` veja as alterações. Você pode pensar que utilizar `copy` irá resolver isso, porque imagina que essa função copie as listas. Veja o que ocorre.

In [47]:
matriz = [[1, 2, 3], [4, 5, 6]]
matriz_cópia = matriz.copy()
print(matriz_cópia)
matriz[1][1] = 1000
print(matriz_cópia)

[[1, 2, 3], [4, 5, 6]]
[[1, 2, 3], [4, 1000, 6]]


Ou seja, mesmo criando uma cópia, `matriz_cópia` ainda está vendo as alterações de `matriz`! Isso ocorre porque esta é uma cópia rasa, *shallow copy*, onde somente a "primeira camada" está sendo copiada, que contém a referência de `matriz`, mas as camadas interiores, com referências às listas interiores, não foram copiadas. Se fizermos essa tarefa manualmente, obtemos uma cópia verdadeira.

In [48]:
matriz = [[1, 2, 3], [4, 5, 6]]
matriz_cópia = [matriz[0].copy(), matriz[1].copy()]
print(matriz_cópia)
matriz[1][1] = 1000
print(matriz_cópia)

[[1, 2, 3], [4, 5, 6]]
[[1, 2, 3], [4, 5, 6]]


Veremos [posteriormente](sec:deepcopy) como resolver este problema com maior facilidade.

Toda essa história de listas e referências pode introduzir muitos bugs, como você deve imaginar. Inclusive, você consegue criar uma estrutura infinita com certa facilidade. Veja a seguir.

In [49]:
infinito = []
infinito.append(infinito)
infinito

[[...]]

Temos aqui uma lista cujo primeiro elemento é uma referência para ela mesmo. Python nota isso e, ao invés de quebrar, apresenta aquele símbolo com reticências. Podemos acessar os elementos dessa lista infinitas vezes.

In [50]:
id(infinito) == id(infinito[0]) == id(infinito[0][0]) == id(infinito[0][0][0])

True

Eu nunca cometi essa façanha acidentalmente, mas vai que você acaba encontrando isso num momento desavisado, então fica aqui o aviso.

### Funções embutidas que operam em listas

Python possui algumas funções que operam em listas (de fato, em quaisquer iteráveis). Essas funções são:

* `sum` soma todos os elementos na lista.

In [51]:
nums = [1, 2, 3, 4, 5]
sum(nums)

15

* `min` encontra o menor valor na lista

In [52]:
min(nums)

1

* `max` encontra o valor máximo na lista

In [53]:
max(nums)

5

* `all` retorna `True` se todos os elementos em uma lista forem *truthy*

In [54]:
lista_falsa1 = [0, False, '', []]
lista_falsa2 = [0, False, '', True]
lista_verdadeira = [1, True, 'a', True]
print(all(lista_falsa1), all(lista_falsa2), all(lista_verdadeira))

False False True


* `any` retorna `True` se qualquer elemento da lsita for *truthy*

In [55]:
lista_falsa = [0, False, '', []]
lista_verdadeira1 = [0, False, '', True]
lista_verdadeira2 = [1, True, 'a', True]
print(any(lista_falsa), any(lista_verdadeira1), any(lista_verdadeira2))

False True True


* `map(função, lista)` aplica uma função em todos os elementos de uma lista. O objeto gerado é um objeto `map`, que não realizou as operações desejadas, para economizar memória e processamento. Os dados são calculados à medida que são requisitados. Você pode forçar que todos sejam computados transformando o objeto em uma lista.

In [56]:
valores = [1, 2, 3, 4, 5]
quadrados = map(lambda x: x**2, valores)
print(quadrados, list(quadrados))

<map object at 0x000002BA7F8B60E0> [1, 4, 9, 16, 25]


* `filter(função, lista)` remove elementos de uma lista que resultarem em `False` pela operação da função. Como map, o objeto retornado não computa os resultados até ser requisitado, e você pode forçar isso transformando o objeto em uma lista.

In [57]:
valores = [1, 2, 3, 4, 5]
pares = filter(lambda x: x % 2 == 0, valores)
print(pares, list(pares))

<filter object at 0x000002BA7F8B69B0> [2, 4]


Aqui, `map` e `filter` são **geradores**, e são exauridos depois de você processá-los. Veja o que ocorre se eu fizer o seguinte:

In [58]:
valores = [1, 2, 3, 4, 5]
pares = filter(lambda x: x % 2 == 0, valores)
print(pares, list(pares), list(pares))

<filter object at 0x000002BA7F3297E0> [2, 4] []


Como `pares` já havia sido processada, quando `list` requisitou mais elementos de `pares`, não recebeu nada, então o resultado da segunda chamada foi uma lista vazia. Veremos mais sobre [geradores em uma outra seção](sec:geradores).

* `sorted(lista)` ordena os elementos de uma lista, como a função `sort`, porém não opera *in-place*. Neste caso, o resultado é uma lista, e não um gerador, como `map` e `filter`

In [59]:
valores = [5, 4, 3, 2, 1]
sorted(valores)

[1, 2, 3, 4, 5]

## A tupla: uma lista mais fraca?

### Criação

Bastante similar à uma lista temos a tupla. Ela pode ser criada similarmente a uma lista, mas utilizando parênteses ao invés de colchetes, e pode conter elementos de tipos distintos.

In [60]:
tupla = (1, 'a', 3, 'b')
tupla

(1, 'a', 3, 'b')

Para criar uma tupla com 1 elemento, é necessário colocar uma vírgula após o elemento, pois senão os parênteses são interpretados como sendo agrupadores.

In [61]:
tupla_1_elemento = (1,)
tupla_1_elemento

(1,)

Para criar uma tupla vazia, você precisa utilizar a função `tuple`.

In [62]:
tupla_vazia = tuple()
tupla_vazia

()

### Conversão

Você também pode criar uma tupla a partir de uma lista, e uma lista a partir de uma tupla.

In [63]:
tuple([1, 2, 3])

(1, 2, 3)

In [64]:
list((1, 2, 3))

[1, 2, 3]

### Métodos internos e imutabilidade

Porém, diferentemente de uma lista, uma tupla é **imutável**, ou seja, você não consegue colocar mais elementos, ou remover elementos. Ela só possui dois métodos, `index` e `count`, que operam como listas.

Você consegue utilizar o operador `+` para juntar duas tuplas, mas o objeto resultante é diferente.

In [65]:
tupla1 = (1, 2, 3)
tupla2 = (4, 5, 6)
tupla3 = (1, 2, 3) + (4, 5, 6)
id(tupla1), id(tupla2), id(tupla3)

(3000031237632, 3000031132544, 3000031221248)

Os 3 ids são diferentes. Note que uma tupla é imutável, mas seus elementos internos podem ser mutáveis. Veja o seguinte:

In [66]:
lista1 = []
tupla1 = (lista1, 'a', 1)
print(tupla1, id(tupla1))
lista1.append('zzz')
print(tupla1, id(tupla1))

([], 'a', 1) 3000031128640
(['zzz'], 'a', 1) 3000031128640


Alteramos a tupla? Não, o `id` das duas tuplas é igual. Alteramos somente o elemento na primeira posição. Podemos fazer o acesso diretamente também.

In [67]:
tupla1[0].append('yyy')
print(tupla1)

(['zzz', 'yyy'], 'a', 1)


Mas não conseguimos alterar o elemento com um operador de atribuição, mesmo sendo o mesmo elemento já existente.

In [68]:
tupla1[0] = lista1
print(tupla1)

TypeError: 'tuple' object does not support item assignment

### Significado vêm da posição

Como uma tupla possui um número fixo de elementos, a **posição** desses elementos acaba ganhando um significado intrínseco, diferentemente de uma lista, onde a posição de um elemento pode variar a esmo. Isso permite uma operação chamada *tuple unpacking*, relacionada a *iterable unpacking*, onde mais de uma variável é criada pela comparação de elementos em duas tuplas.

In [69]:
num1, num2, num3 = 1, 2, 3
num1, num2, num3

(1, 2, 3)

Aqui, você notou que o resultado apresentado é, na verdade, uma tupla, pela existência de parênteses no início e no fim? De fato, tuplas são muito ubíquas em Python, mas são frequentemente invisíveis. No exemplo acima, os dois elementos de cada lado do `=` também são tuplas invisíveis (sem os parênteses). Você pode colocá-los se quiser, e a operação ocorre da mesma maneira.


In [70]:
(num1, num2, num3) = (1, 2, 3)

Para fazer um *tuple unpacking*, é necessário que o número de elementos dos dois lados sejam iguais, senão uma exceção será lançada.

In [71]:
num1, num2, num3 = 1, 2

ValueError: not enough values to unpack (expected 3, got 2)

Essa operação também funciona com outros iteráveis, como listas, e entre iteráveis de tipos diferentes, desde que tenham um formato apropriado.

In [72]:
(num1, num2) = [1, 2]
num1, num2

(1, 2)

In [73]:
[num1, num2] = [1, 2]
num1, num2

(1, 2)

In [74]:
[num1, num2] = (1, 2)
num1, num2

(1, 2)

### Funções com mais de um valor de retorno

Nós vimos anteriormente como definir uma função que retorna um valor. Se você tentar, irá ver que consegue retornar mais de um valor.

In [75]:
def estat_básica(lista):
    mínimo = min(lista)
    máximo = max(lista)
    média = sum(lista) / len(lista)
    return mínimo, máximo, média

estat_básica([1, 2, 3, 4, 5])

(1, 5, 3.0)

Mas na verdade, você está retornando somente um valor, uma tupla, que você consegue atribuir a variáveis com *tuple unpacking*.

In [76]:
mi, ma, me = estat_básica([1, 2, 3, 4, 5])
print(mi, ma, me)

1 5 3.0


## `set`: uma conjunto, sem valores duplicados

### Criação

Um `set` é uma estrutura **mutável**, **sem ordem** que não aceita valores repetidos. Para isso, ela requer que todos os seus elementos sejam **imutáveis**. Para criar um `set`, utilize a função `set` ou coloque valores entre chaves, separados por vírgulas.

In [77]:
set((1, 2, 3))

{1, 2, 3}

In [78]:
{'a', 'b', 'b', 'c'}

{'a', 'b', 'c'}

Nestes exemplos, os valores retornados apareceram na mesma ordem que foram criados, mas isso não é necessariamente verdadeiro sempre. Um uso um tanto simplista para `set` é a remoção de valores duplicados em listas.

In [79]:
lista = [1, 1, 3, 2, 5, 2, 3, 1, 1, 7, 6, 3, 2, 2]
lista_sem_repetições = list(set(lista))
lista_sem_repetições

[1, 2, 3, 5, 6, 7]

Note que os elementos apareceram em ordem crescente, mas não na ordem da criação da lista, pois só 1 `6` existe, e aparece na lista após o `7`.

Se você tentar criar um `set` com um objeto mutável, irá receber a seguinte mensagem de erro:

In [80]:
{[1]}

TypeError: unhashable type: 'list'

Aqui, `unhashable` significa que um objeto não possui a função `.__hash__`, que também significa que a função `hash` não o aceita. Isso é geralmente o caso de objetos mutáveis, por isso que venho utilizando esse termo. Um `hash` é uma operação matemática feita em um objeto que sempre retorna o mesmo valor se um objeto tiver o mesmo conteúdo, difere grandemente com pequenas alterações no conteúdo do objeto, e que é, idealmente, único para cada objeto.

In [81]:
hash((1, 2, 3)), hash((1, 2, 3)), hash((1, 2, 4))

(529344067295497451, 529344067295497451, -4363729961677198915)

### Métodos de `set`

`set` apresenta muitos métodos da teoria de conjuntos:

* `.union` junta dois conjuntos em um novo conjunto.

In [82]:
set1 = {1, 2, 3, 4, 5}
set2 = {3, 4, 5, 6, 7}
união = set1.union(set2)
print(set1, união)

{1, 2, 3, 4, 5} {1, 2, 3, 4, 5, 6, 7}


* `.difference(outro_set)` remove os elementos presentes em `outro_set` e retorna um `set` novo.

In [83]:
diferença = set1.difference(set2)
print(set1, diferença)

{1, 2, 3, 4, 5} {1, 2}


* `.difference_update(outro_set)` realiza o mesmo que `difference`, mas *in-place*.

In [84]:
diferença2 = set1.difference_update(set2)
print(set1, diferença2)

{1, 2} None


* `.intersection` retorna os elementos presentes em ambos os conjuntos.

In [85]:
set1 = {1, 2, 3, 4, 5}
set2 = {3, 4, 5, 6, 7}
set1.intersection(set2) # vide também intersection_update

{3, 4, 5}

* `.discard` e `.remove` são similares, onde o primeiro remove um elemento se existir, mas não lança um erro se o elemento não existir, enquanto o segundo lança o erro.

In [86]:
set1.discard(1000)

* `symmetric_difference` retorna os elementos que aparecem ou em um ou no outro conjunto.

In [87]:
set1.symmetric_difference(set2) # vide também symmetric_difference_update

{1, 2, 6, 7}

* `.add` age como `.append` de uma lista.
* `.pop` age igual a `.pop` de uma lista.
* `.copy` age igual a `.copy` de uma lista
* `.issubset` retorna `True` se um conjunto é subconjunto de outro.

In [88]:
set1 = {3, 4, 5}
set2 = {1, 2, 3, 4, 5, 6, 7}
set1.issubset(set2)

True

In [89]:
set2.issubset(set1)

False

* `.issuperset` retorna `True` se um conjunto engloba outro conjunto.

In [90]:
set2.issuperset(set1)

True

In [91]:
set1.issuperset(set2)

False

* `.isdisjoint` retorna `True` se os conjuntos não possuem elementos em comum.

In [92]:
{-1, -2, -3}.isdisjoint({1, 2, 3})

True

In [93]:
{1, 0, -1}.isdisjoint({1, 2, 3})

False

Se deseja um `set` imutável, pode utilizar `frozenset`. Nesse caso, qualquer operação que altera os conjuntos é proibida.

## Dicionários: correlações entre chaves e valores