(cap:estruturas_dados_loops)=
# Estruturas de dados e loops

Até agora vimos tipos que continham somente um valor, exceto as strings, que podíamos entender como uma sequência de caracteres. Porém, tais variáveis tem utilidade limitada na área científica. No máximo, você conseguiria representar um par de pontos como um número complexo, mas isso está muito aquem de algo desejado, como um vetor, uma matriz ou uma tabela.

Neste capítulo iremos abordar algumas estruturas de dados embutidas em Python para armazenar sequências, conjuntos ou equivalências de valores. Iremos ver como criar essas estruturas, adicionar ou remover elementos, checar se um objeto já é membro, e como operar sobre as estruturas.

Tais estruturas não possuem um tamanho pré-definido. Para operar sobre todos os elementos dessas estruturas, torna-se necessário algum método que permita que você realize um mesmo conjunto de ações várias vezes, sem saber de antemão o número de vezes. Esses são chamados *loops* ou laços. Iremos aprender como utilizar tais loops em todos os elementos de uma estrutura de dados, mas também executar ações um número específico de vezes. Percorrer uma estrutura de dados é também chamado de *iterar* pela estrutura, e cada passo é uma *iteração*. Um objeto que pode ser percorrido é um *iterável*.

Ao concluir este capítulo, teremos finalmente acumulado conhecimento suficiente para resolver problemas mais interessantes.

(sec:listas)=
## A estrutura de dados mais básica: a lista

Uma lista é uma estrutura de dados que junta elementos de tipos diversos em sequência, e pode aumentar ou diminuir seu comprimento sem problemas (ela é **mutável**). Apesar dos tipos dos objetos em uma lista poderem ser distintos, é geralmente mais útil que todos sejam de um mesmo tipo, para simplificar a lógica quando operarmos por todos os elementos.

### Criação

Para criar uma lista, basta colocar os elementos entre colchetes `[]`, separados por vírgulas. Vejamos um exemplo:

In [1]:
letras_minúsculas = [
    'a', 'b', 'c', 'd', 'e', 'f',
    'g', 'h', 'i', 'j', 'k', 'l',
    'm', 'n', 'o', 'p', 'q', 'r', 
    's', 't', 'u', 'v', 'w', 'x', 
    'y', 'z'
]
letras_minúsculas

['a',
 'b',
 'c',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'k',
 'l',
 'm',
 'n',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'v',
 'w',
 'x',
 'y',
 'z']

Como vimos com parênteses, os colchetes também flexibilizam as regras de indentação de código dentro deles.

Além dessa maneira, podemos converter outros tipos em listas. Como vimos que strings também são como sequências, podemos converter uma string numa lista utilizando a função `list`.

In [2]:
local = 'citadelStation'
lst_local = list(local)
lst_local

['c', 'i', 't', 'a', 'd', 'e', 'l', 'S', 't', 'a', 't', 'i', 'o', 'n']

E podemos também fazer o caminho inverso, convertendo uma lista de `str` em uma `str` só. Isso é uma ação relativamente comum, mas é feita de uma maneira pouco intuitiva. Para isso, utilize o método interno `.join` de uma string, que agirá como o separador dos elementos.

In [3]:
novo_local = ''.join(lst_local)
novo_local

'citadelStation'

In [4]:
novo_local == local

True

Podemos também gerar uma lista vazia simplesmente utilizando um par de colchetes:

In [5]:
vazia = []
vazia

[]

E lembre-se que conteineres vazios são considerados como "falsy", então:

In [6]:
if vazia:
    print('Esta linha não deveria ser executada')

### Adição e remoção de membros específicos

Podemos adicionar membros utilizando o método `.append`

In [7]:
vazia.append('a')
vazia

['a']

Se você executar o código acima várias vezes, irá notar que a lista vai aumentando gradualmente.

Se você quiser remover um valor específico, pode utilizar o método `.remove`. Se o elemento não existir, um `ValueError` será lançado. 

In [8]:
vazia.remove('a')
vazia

[]

### Indexação

Para acessar um elemento de uma lista, você pode usar a notação de colchetes, com o índice do elemento dentro do colchete.

Isso pode ser um pouco confuso para iniciantes, mas a numeração em Python começa do zero, e não inclui o elemento com índice igual ao comprimento. E não se esqueça que um índice precisa ser um número inteiro! Não existe elemento `0.2`. Lembre-se das operações de divisão inteira que vimos no [capítulo de operações matemáticas](cap:op_matematicas)

Para ilustração, este são as letras minúsculas e seus índices

    a  b  c  d  e  f  g ... x  y  z
    0  1  2  3  4  5  6 ... 23 24 25

Essa é somente *uma* maneira possível de indexar elementos em ciência de computação. MATLAB, por exemplo, começa do 1 e inclui o índice igual ao comprimento, uma notação um pouco mais natural à manipulação de matrizes. Apesar de tudo, isso é uma fonte comum de bugs e confusões, então seja sempre cauteloso. Se você tentar acessar um índice inexistente, um `IndexError` será lançado.

In [9]:
len(letras_minúsculas)

26

In [10]:
letras_minúsculas[0]

'a'

In [11]:
letras_minúsculas[25]

'z'

In [12]:
letras_minúsculas[26]

IndexError: list index out of range

Com a indexação, você pode alterar diretamente os valores de uma lista, utilizando os operadores de atribuição ou atribuição aumentada.

In [13]:
lista = [1, 2, 3, 4, 5]
lista[0] = lista[0] + 10
lista[1] += 5
lista

[11, 7, 3, 4, 5]

### Slicing

Caso você queira seccionar uma lista, pode utilizar a notação de colchetes, separando os índices de início e fim com `:`. Aqui, o índice de fim **não é incluído** na seção, então, se você deseja seccionar até o fim de uma lista, precisa seccionar até o `len` dela.

In [14]:
letras_minúsculas[0:5]

['a', 'b', 'c', 'd', 'e']

In [15]:
letras_minúsculas[0:len(letras_minúsculas)]

['a',
 'b',
 'c',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'k',
 'l',
 'm',
 'n',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'v',
 'w',
 'x',
 'y',
 'z']

Para pegar elementos da parte final, fica inconveniente sempre utilizar `len(lista) - x` para significar "exceto os `x` últimos elementos. Existe uma notação de conveniência, onde índices negativos começam do final. Então `-1` significa "último elemento".

In [16]:
letras_minúsculas[len(letras_minúsculas) - 5: len(letras_minúsculas) - 1]

['v', 'w', 'x', 'y']

In [17]:
letras_minúsculas[-5:-1]

['v', 'w', 'x', 'y']

Se você utilizar `None` em um dos lados do `:`, significa que quer incluir tudo daquele lado. Então `None:-1` significa "todos os elementos do começo até, mas não incluindo, o último elemento. Por conveniência, você pode também não colocar nada, e isso será interpretado como `None`. Por exemplo:

In [18]:
letras_minúsculas[-5:None]

['v', 'w', 'x', 'y', 'z']

In [19]:
letras_minúsculas[-5:]

['v', 'w', 'x', 'y', 'z']

Tecnicamente, ao utilizar a notação `início:fim`, você está criando um objeto `slice`. Você pode fazer isso manualmente com a função `slice`.

In [20]:
slice_letras = slice(-5, None)
slice_letras

slice(-5, None, None)

In [21]:
letras_minúsculas[slice_letras]

['v', 'w', 'x', 'y', 'z']

E você também pode usar variáveis na hora de especificar as regiões.

In [22]:
início = 0
fim = 5
letras_minúsculas[início:fim]

['a', 'b', 'c', 'd', 'e']

Os astutos terão notado que na criação de um slice manual, a representação retornada possuía 3 argumentos. `-5, None, None`. Na criação de slices, é possível utilizar outro `:` e especificar o *passo*. Por padrão, o passo é 1, então todos os elementos entre o início e o fim são selecionados. Se o passo for 2, um elemento é pulado. Se o passo for negativo, os elementos serão selecionados de trás para frente, mas ainda começando no início e terminando no fim. Note a diferença:

In [23]:
letras_minúsculas[5:0:-1]

['f', 'e', 'd', 'c', 'b']

In [24]:
letras_minúsculas[0:5:-1]

[]

In [25]:
letras_minúsculas[None:None:5]

['a', 'f', 'k', 'p', 'u', 'z']

Você pode escolher não colocar o início e o fim, e só especificar o passo. Essa é uma maneira comum de reverter a ordem de listas.

In [26]:
letras_minúsculas[::-1]

['z',
 'y',
 'x',
 'w',
 'v',
 'u',
 't',
 's',
 'r',
 'q',
 'p',
 'o',
 'n',
 'm',
 'l',
 'k',
 'j',
 'i',
 'h',
 'g',
 'f',
 'e',
 'd',
 'c',
 'b',
 'a']

### Mais métodos de listas

Temos também mais alguns métodos de listas que podem ser úteis.

* `.pop` remove o último elemento e o retorna, ou `.pop(índice)` remove o elemento no índice especificado e o retorna.

In [27]:
lista = [1, 2, 3, 4, 5]
print(lista.pop(), lista)

5 [1, 2, 3, 4]


* `.insert(índice, elemento)` insere um elemento antes do índice especificado, como um `.pop` inverso.

In [28]:
lista = ['a', 'b', 'd', 'e']
lista.insert(2, 'c') # Insere 'c' antes do elemento de índice 2, que é 'd'
lista

['a', 'b', 'c', 'd', 'e']

* `.extend` aceita uma outra lista e a coloca no fim da lista atual. Note que isso atua na lista diretamente, e não retorna uma lista nova.

In [29]:
lista1 = [1, 2, 3, 4, 5]
lista2 = [6, 7, 8, 9, 10]
lista1.extend(lista2)
print(lista1, lista2)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] [6, 7, 8, 9, 10]


Existe uma operação bem similar a `.extend`, que é a ação de somar duas listas com `+`. Note que essa operação **retorna uma lista nova**, e não altera as listas anteriores.

In [30]:
lista1 = [1, 2, 3, 4, 5]
lista2 = [6, 7, 8, 9, 10]
print(lista1 + lista2, lista1, lista2)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] [1, 2, 3, 4, 5] [6, 7, 8, 9, 10]


* `.count` conta quantos elementos iguais ao especificado existem em uma lista.

In [31]:
lista = [1, 2, 3, 1, 2]
print(lista.count(2), lista.count(1), lista.count(3))

2 2 1


* `.reverse` inverte a ordem dos elementos de uma lista, sem retornar uma lista nova (*in place*).

In [32]:
lista = [1, 2, 3, 4, 5]
print(lista)
print(lista.reverse())  # Por fazer a operação *in place*, `.reverse()` retorna None
print(lista)

[1, 2, 3, 4, 5]
None
[5, 4, 3, 2, 1]


* `.sort` ordena os elementos da lista em ordem crescente *in place*. Se quiser inverter a ordem, forneça o argumento `reverse = True`. A ordem relativa de dois elementos é obtida pelo operador `<`.

In [33]:
lista = [5, 2, 1, 4, 3]
print(lista)
print(lista.sort())
print(lista)

[5, 2, 1, 4, 3]
None
[1, 2, 3, 4, 5]


Se você quiser controlar melhor como controlar os elementos, precisa fornecer uma função para `key`. Por exemplo:

In [34]:
def quadrado(x):
    return x**2
lista = [-2, -1, 0, 1, 2]
lista.sort(key = quadrado)
print(lista)

[0, -1, 1, -2, 2]


Para não precisar definir uma nova função, você pode utilizar [uma função lambda](sec:func_lambda).

In [35]:
lista = [-2, -1, 0, 1, 2]
lista.sort(key = lambda x: x**2)
print(lista)

[0, -1, 1, -2, 2]


* `.index(elemento)` retorna o índice da primeira ocorrência de um elemento em uma lista. Você pode especificar o índice de início e fim se quiser, com argumentos opcionais.

In [36]:
lista = ['a', 'b', 'c', 'c', 'd', 'd', 'e']
print(lista.index('b'), lista.index('e'))

1 6


* `.copy` retorna uma cópia de uma lista. Se você realizar alterações em uma cópia, a lista original não será afetada.

In [37]:
lista = [1, 2, 3, 4, 5]
lista_cópia = lista.copy()
lista_cópia[2] = 1000
print(lista, lista_cópia)

[1, 2, 3, 4, 5] [1, 2, 1000, 4, 5]


Note que isso difere do seguinte:

In [38]:
lista = [1, 2, 3, 4, 5]
lista_ref = lista
lista_ref[2] = 1000
print(lista, lista_ref)

[1, 2, 1000, 4, 5] [1, 2, 1000, 4, 5]


```{note}
Por que isso ocorre? Lembra-se de nossa analogia, de variáveis sendo "caixinhas" com "etiquetas de nome"? Neste caso, temos só uma caixinha com duas etiquetas, ou seja, você pode se referir à mesma lista por diferentes nomes. Então, qualquer operação que realizar com `lista_ref`, estará realizando com `lista` também, pois se tratam da mesma variável por trás dos panos.
```

Podemos verificar esse problema utilizando a função `id`. Essa função retorna um número único para cada objeto que existe na memória do Python.

In [39]:
print(id(lista) == id(lista_cópia))
print(id(lista) == id(lista_ref))

False
True


Quando você utiliza `.copy`, você força que uma nova "caixinha" seja criada, e copia todo o conteúdo para a caixa nova. Então você consegue realizar as operações. Até agora, não nos deparamos com este problema porque todas as variáveis que vimos são **imutáveis**, ou seja, você não consegue alterar o estado delas, inclusive strings! Quando você faz `contador += 1`, você está, na verdade, criando um novo objeto e atribuindo o valor dele com base no valor anterior, e potencialmente descartando o objeto antigo. Veja o seguinte exemplo:

In [40]:
contador = 0
id1 = id(contador)
contador += 1
id2 = id(contador)
print(id1 == id2)

False


Já quando você opera com uma lista, o mesmo objeto é mantido. Veja o exemplo:

In [41]:
lista = []
id1 = id(lista)
lista.append('a')
id2 = id(lista)
print(id1 == id2)

True


E mesmo dentro de uma lista **mutável**, objetos podem continuar **imutáveis**. Veja que aqui eu modifico o elemento dentro de uma lista e vejo que seu `id` muda.

In [42]:
lista = ['a']
id1 = id(lista[0])
lista[0] += 'b'
id2 = id(lista[0])
print(id1 == id2)

False


Quando temos dois objetos e queremos saber se possuem `id`s diferentes, mas sem precisar fazer a comparação aqui, podemos usar `is`.

In [43]:
lista1 = []
lista2 = []
print(lista1 == lista2)
print(id(lista1) == id(lista2))
print(lista1 is lista2)

True
False
False


Por detalhes de implementação, o código acima não funciona com números e strings curtos.

Você pode se perguntar porque saber se um objeto é mutável ou imutável é importante. Isso será visto na [seção de dicionários](sec:dicts).

```{warning}
Se você quer pegar um objeto a partir de seu `id`, [pode seguir os passos neste post](https://stackoverflow.com/questions/15011674/is-it-possible-to-dereference-variable-ids), mas cuidado, é um tópico bastante avançado!
```

(sec:aninhamento_listas)=
### Aninhamento de listas

Quando uma lista contém outra lista em seu interior, dizemos que as listas estão aninhadas. Isso acaba sendo a maneira natural de representar estruturas multidimensionais, como uma matriz.

In [44]:
matriz_identidade = [
    [1, 0, 0],
    [0, 1, 0],
    [0, 0, 1]
]
matriz_identidade

[[1, 0, 0], [0, 1, 0], [0, 0, 1]]

Nesta maneira de organizar uma matriz, para acessar a linha `m` columa `n`, pode utilizar sequencialmente os operadores `[]`, `[m][n]`.

In [45]:
print(matriz_identidade[0][0], matriz_identidade[1][0])

1 0


Note o que ocorre com este código

In [46]:
linha1 = [1, 2, 3]
linha2 = [4, 5, 6]
linha3 = [7, 8, 9]
matriz = [linha1, linha2, linha3]
linha2[1] = 1000
matriz

[[1, 2, 3], [4, 1000, 6], [7, 8, 9]]

Isso ocorre porque `matriz` armazenou referências às outras 3 listas, então modificar uma dessas listas faz com que `matriz` veja as alterações. Você pode pensar que utilizar `copy` irá resolver isso, porque imagina que essa função copie as listas. Veja o que ocorre.

In [47]:
matriz = [[1, 2, 3], [4, 5, 6]]
matriz_cópia = matriz.copy()
print(matriz_cópia)
matriz[1][1] = 1000
print(matriz_cópia)

[[1, 2, 3], [4, 5, 6]]
[[1, 2, 3], [4, 1000, 6]]


Ou seja, mesmo criando uma cópia, `matriz_cópia` ainda está vendo as alterações de `matriz`! Isso ocorre porque esta é uma cópia rasa, *shallow copy*, onde somente a "primeira camada" está sendo copiada, que contém a referência de `matriz`, mas as camadas interiores, com referências às listas interiores, não foram copiadas. Se fizermos essa tarefa manualmente, obtemos uma cópia verdadeira.

In [48]:
matriz = [[1, 2, 3], [4, 5, 6]]
matriz_cópia = [matriz[0].copy(), matriz[1].copy()]
print(matriz_cópia)
matriz[1][1] = 1000
print(matriz_cópia)

[[1, 2, 3], [4, 5, 6]]
[[1, 2, 3], [4, 5, 6]]


Veremos [posteriormente](sec:deepcopy) como resolver este problema com maior facilidade.

Toda essa história de listas e referências pode introduzir muitos bugs, como você deve imaginar. Inclusive, você consegue criar uma estrutura infinita com certa facilidade. Veja a seguir.

In [49]:
infinito = []
infinito.append(infinito)
infinito

[[...]]

Temos aqui uma lista cujo primeiro elemento é uma referência para ela mesmo. Python nota isso e, ao invés de quebrar, apresenta aquele símbolo com reticências. Podemos acessar os elementos dessa lista infinitas vezes.

In [50]:
id(infinito) == id(infinito[0]) == id(infinito[0][0]) == id(infinito[0][0][0])

True

Eu nunca cometi essa façanha acidentalmente, mas vai que você acaba encontrando isso num momento desavisado, então fica aqui o aviso.

### Funções embutidas que operam em listas

Python possui algumas funções que operam em listas (de fato, em quaisquer iteráveis). Essas funções são:

* `sum` soma todos os elementos na lista.

In [51]:
nums = [1, 2, 3, 4, 5]
sum(nums)

15

* `min` encontra o menor valor na lista

In [52]:
min(nums)

1

* `max` encontra o valor máximo na lista

In [53]:
max(nums)

5

* `all` retorna `True` se todos os elementos em uma lista forem *truthy*

In [54]:
lista_falsa1 = [0, False, '', []]
lista_falsa2 = [0, False, '', True]
lista_verdadeira = [1, True, 'a', True]
print(all(lista_falsa1), all(lista_falsa2), all(lista_verdadeira))

False False True


* `any` retorna `True` se qualquer elemento da lsita for *truthy*

In [55]:
lista_falsa = [0, False, '', []]
lista_verdadeira1 = [0, False, '', True]
lista_verdadeira2 = [1, True, 'a', True]
print(any(lista_falsa), any(lista_verdadeira1), any(lista_verdadeira2))

False True True


* `map(função, lista)` aplica uma função em todos os elementos de uma lista. O objeto gerado é um objeto `map`, que não realizou as operações desejadas, para economizar memória e processamento. Os dados são calculados à medida que são requisitados. Você pode forçar que todos sejam computados transformando o objeto em uma lista.

In [56]:
valores = [1, 2, 3, 4, 5]
quadrados = map(lambda x: x**2, valores)
print(quadrados, list(quadrados))

<map object at 0x0000011CEC376E60> [1, 4, 9, 16, 25]


* `filter(função, lista)` remove elementos de uma lista que resultarem em `False` pela operação da função. Como map, o objeto retornado não computa os resultados até ser requisitado, e você pode forçar isso transformando o objeto em uma lista.

In [57]:
valores = [1, 2, 3, 4, 5]
pares = filter(lambda x: x % 2 == 0, valores)
print(pares, list(pares))

<filter object at 0x0000011CEC374730> [2, 4]


Aqui, `map` e `filter` são **geradores**, e são exauridos depois de você processá-los. Veja o que ocorre se eu fizer o seguinte:

In [58]:
valores = [1, 2, 3, 4, 5]
pares = filter(lambda x: x % 2 == 0, valores)
print(pares, list(pares), list(pares))

<filter object at 0x0000011CEC377940> [2, 4] []


Como `pares` já havia sido processada, quando `list` requisitou mais elementos de `pares`, não recebeu nada, então o resultado da segunda chamada foi uma lista vazia. Veremos mais sobre [geradores em uma outra seção](sec:geradores).

* `sorted(lista)` ordena os elementos de uma lista, como a função `sort`, porém não opera *in-place*. Neste caso, o resultado é uma lista, e não um gerador, como `map` e `filter`

In [59]:
valores = [5, 4, 3, 2, 1]
sorted(valores)

[1, 2, 3, 4, 5]

### Um detalhe chato de Python: argumentos padrão mutáveis em funções

É plenamente possível que você deseje fazer uma função deste tipo:

In [60]:
def acumulador(objeto, ação, destino = []):
    destino.append(ação(objeto))
    return destino

O objetivo desta função é realizar alguma operação em um objeto e colocar em uma lista, que pode ser fornecida pelo usuário. Inicialmente, você imagina que se você fornecer uma lista para destino, os valores serão colocados nessa lista, mas se não fornecer, os valores serão colocados em uma nova lista vazia. Vejamos um exemplo:

In [61]:
lista = []
acumulador(1, lambda x: x**2, destino = lista)
lista

[1]

Neste caso, note que fornecemos a lista como argumento, não capturamos o resultado do acumulador, e mesmo assim a lista foi modificada. Isso é esperado, dado que listas são mutáveis. Até agora, tudo bem, mas veja o que ocorre neste caso.

In [62]:
lista = acumulador(1, lambda x: x**2)
lista

[1]

Tudo certo? Vamos utilizar isso novamente.

In [63]:
lista = acumulador(1, lambda x: x**2)
lista

[1, 1]

Pela nossa lógica atual, imaginaríamos que a segunda lista criada deveria ser idêntica à primeira, com um elemento só. Mas isso não ocorre porque Python avalia os argumentos opcionais na hora que a função é criada, isto é, a lista chamada `destino` já existe e persiste entre as chamadas da função.

Se você deseja fazer uma função deste tipo, você pode fazer o seguinte:
Ao invés de utilizar uma lista como argumento padrão, utilize `None` e cheque se o valor é `None`. Se for, você cria uma lista nova, senão utiliza a lista fornecida.

In [64]:
def acumulador(objeto, ação, destino = None):
    if destino is None:
        destino = []
    destino.append(ação(objeto))
    return destino

In [65]:
lista = acumulador(1, lambda x: x**2)
lista

[1]

In [66]:
lista = acumulador(1, lambda x: x**2)
lista

[1]

Dessa maneira tudo funciona como esperado.

## A tupla: uma lista mais fraca?

### Criação

Bastante similar à uma lista temos a tupla. Ela pode ser criada similarmente a uma lista, mas utilizando parênteses ao invés de colchetes, e pode conter elementos de tipos distintos.

In [67]:
tupla = (1, 'a', 3, 'b')
tupla

(1, 'a', 3, 'b')

Para criar uma tupla com 1 elemento, é necessário colocar uma vírgula após o elemento, pois senão os parênteses são interpretados como sendo agrupadores.

In [68]:
tupla_1_elemento = (1,)
tupla_1_elemento

(1,)

Para criar uma tupla vazia, você precisa utilizar a função `tuple`.

In [69]:
tupla_vazia = tuple()
tupla_vazia

()

### Conversão

Você também pode criar uma tupla a partir de uma lista, e uma lista a partir de uma tupla.

In [70]:
tuple([1, 2, 3])

(1, 2, 3)

In [71]:
list((1, 2, 3))

[1, 2, 3]

### Métodos internos e imutabilidade

Porém, diferentemente de uma lista, uma tupla é **imutável**, ou seja, você não consegue colocar mais elementos, ou remover elementos. Ela só possui dois métodos, `index` e `count`, que operam como listas.

Você consegue utilizar o operador `+` para juntar duas tuplas, mas o objeto resultante é diferente.

In [72]:
tupla1 = (1, 2, 3)
tupla2 = (4, 5, 6)
tupla3 = (1, 2, 3) + (4, 5, 6)
id(tupla1), id(tupla2), id(tupla3)

(1223737868224, 1223737862656, 1223737728480)

Os 3 ids são diferentes. Note que uma tupla é imutável, mas seus elementos internos podem ser mutáveis. Veja o seguinte:

In [73]:
lista1 = []
tupla1 = (lista1, 'a', 1)
print(tupla1, id(tupla1))
lista1.append('zzz')
print(tupla1, id(tupla1))

([], 'a', 1) 1223737825536
(['zzz'], 'a', 1) 1223737825536


Alteramos a tupla? Não, o `id` das duas tuplas é igual. Alteramos somente o elemento na primeira posição. Podemos fazer o acesso diretamente também.

In [74]:
tupla1[0].append('yyy')
print(tupla1)

(['zzz', 'yyy'], 'a', 1)


Mas não conseguimos alterar o elemento com um operador de atribuição, mesmo sendo o mesmo elemento já existente.

In [75]:
tupla1[0] = lista1
print(tupla1)

TypeError: 'tuple' object does not support item assignment

### Significado vêm da posição

Como uma tupla possui um número fixo de elementos, a **posição** desses elementos acaba ganhando um significado intrínseco, diferentemente de uma lista, onde a posição de um elemento pode variar a esmo. Isso permite uma operação chamada *tuple unpacking*, relacionada a *iterable unpacking*, onde mais de uma variável é criada pela comparação de elementos em duas tuplas.

In [76]:
num1, num2, num3 = 1, 2, 3
num1, num2, num3

(1, 2, 3)

Aqui, você notou que o resultado apresentado é, na verdade, uma tupla, pela existência de parênteses no início e no fim? De fato, tuplas são muito ubíquas em Python, mas são frequentemente invisíveis. No exemplo acima, os dois elementos de cada lado do `=` também são tuplas invisíveis (sem os parênteses). Você pode colocá-los se quiser, e a operação ocorre da mesma maneira.


In [77]:
(num1, num2, num3) = (1, 2, 3)

Para fazer um *tuple unpacking*, é necessário que o número de elementos dos dois lados sejam iguais, senão uma exceção será lançada.

In [78]:
num1, num2, num3 = 1, 2

ValueError: not enough values to unpack (expected 3, got 2)

Essa operação também funciona com outros iteráveis, como listas, e entre iteráveis de tipos diferentes, desde que tenham um formato apropriado.

In [79]:
(num1, num2) = [1, 2]
num1, num2

(1, 2)

In [80]:
[num1, num2] = [1, 2]
num1, num2

(1, 2)

In [81]:
[num1, num2] = (1, 2)
num1, num2

(1, 2)

### Funções com mais de um valor de retorno

Nós vimos anteriormente como definir uma função que retorna um valor. Se você tentar, irá ver que consegue retornar mais de um valor.

In [82]:
def estat_básica(lista):
    mínimo = min(lista)
    máximo = max(lista)
    média = sum(lista) / len(lista)
    return mínimo, máximo, média

estat_básica([1, 2, 3, 4, 5])

(1, 5, 3.0)

Mas na verdade, você está retornando somente um valor, uma tupla, que você consegue atribuir a variáveis com *tuple unpacking*.

In [83]:
mi, ma, me = estat_básica([1, 2, 3, 4, 5])
print(mi, ma, me)

1 5 3.0


## `set`: uma conjunto, sem valores duplicados

### Criação

Um `set` é uma estrutura **mutável**, **sem ordem** que não aceita valores repetidos. Para isso, ela requer que todos os seus elementos sejam **imutáveis**. Para criar um `set`, utilize a função `set` ou coloque valores entre chaves, separados por vírgulas.

In [84]:
set((1, 2, 3))

{1, 2, 3}

In [85]:
{'a', 'b', 'b', 'c'}

{'a', 'b', 'c'}

Nestes exemplos, os valores retornados apareceram na mesma ordem que foram criados, mas isso não é necessariamente verdadeiro sempre. Um uso um tanto simplista para `set` é a remoção de valores duplicados em listas.

In [86]:
lista = [1, 1, 3, 2, 5, 2, 3, 1, 1, 7, 6, 3, 2, 2]
lista_sem_repetições = list(set(lista))
lista_sem_repetições

[1, 2, 3, 5, 6, 7]

Note que os elementos apareceram em ordem crescente, mas não na ordem da criação da lista, pois só 1 `6` existe, e aparece na lista após o `7`.

Se você tentar criar um `set` com um objeto mutável, irá receber a seguinte mensagem de erro:

In [87]:
{[1]}

TypeError: unhashable type: 'list'

Aqui, `unhashable` significa que um objeto não possui a função `.__hash__`, que também significa que a função `hash` não o aceita. Isso é geralmente o caso de objetos mutáveis, por isso que venho utilizando esse termo. Um `hash` é uma operação matemática feita em um objeto que sempre retorna o mesmo valor se um objeto tiver o mesmo conteúdo, difere grandemente com pequenas alterações no conteúdo do objeto, e que é, idealmente, único para cada objeto.

In [88]:
hash((1, 2, 3)), hash((1, 2, 3)), hash((1, 2, 4))

(529344067295497451, 529344067295497451, -4363729961677198915)

### Métodos de `set`

`set` apresenta muitos métodos da teoria de conjuntos:

* `.union` junta dois conjuntos em um novo conjunto.

In [89]:
set1 = {1, 2, 3, 4, 5}
set2 = {3, 4, 5, 6, 7}
união = set1.union(set2)
print(set1, união)

{1, 2, 3, 4, 5} {1, 2, 3, 4, 5, 6, 7}


* `.difference(outro_set)` remove os elementos presentes em `outro_set` e retorna um `set` novo.

In [90]:
diferença = set1.difference(set2)
print(set1, diferença)

{1, 2, 3, 4, 5} {1, 2}


* `.difference_update(outro_set)` realiza o mesmo que `difference`, mas *in-place*.

In [91]:
diferença2 = set1.difference_update(set2)
print(set1, diferença2)

{1, 2} None


* `.intersection` retorna os elementos presentes em ambos os conjuntos.

In [92]:
set1 = {1, 2, 3, 4, 5}
set2 = {3, 4, 5, 6, 7}
set1.intersection(set2) # vide também intersection_update

{3, 4, 5}

* `.discard` e `.remove` são similares, onde o primeiro remove um elemento se existir, mas não lança um erro se o elemento não existir, enquanto o segundo lança o erro.

In [93]:
set1.discard(1000)

* `symmetric_difference` retorna os elementos que aparecem ou em um ou no outro conjunto.

In [94]:
set1.symmetric_difference(set2) # vide também symmetric_difference_update

{1, 2, 6, 7}

* `.add` age como `.append` de uma lista.
* `.pop` age igual a `.pop` de uma lista.
* `.copy` age igual a `.copy` de uma lista
* `.issubset` retorna `True` se um conjunto é subconjunto de outro.

In [95]:
set1 = {3, 4, 5}
set2 = {1, 2, 3, 4, 5, 6, 7}
set1.issubset(set2)

True

In [96]:
set2.issubset(set1)

False

* `.issuperset` retorna `True` se um conjunto engloba outro conjunto.

In [97]:
set2.issuperset(set1)

True

In [98]:
set1.issuperset(set2)

False

* `.isdisjoint` retorna `True` se os conjuntos não possuem elementos em comum.

In [99]:
{-1, -2, -3}.isdisjoint({1, 2, 3})

True

In [100]:
{1, 0, -1}.isdisjoint({1, 2, 3})

False

Se deseja um `set` imutável, pode utilizar `frozenset`. Nesse caso, qualquer operação que altera um `frozenset` é proibida, mas operações que criam um `frozenset` com uma modificação desejada são possíveis.

In [101]:
set1 = {1, 2, 3}
fset1 = frozenset((1, 2, 3, 4))
fset1.difference(set1), set1.difference(fset1)

(frozenset({4}), set())

## Dicionários: correlações entre chaves e valores

Um dicionário é uma das estruturas de dados mais poderosas em Python, e está por trás de muito da funcionalidade da linguagem. Um dicionário faz uma correlação entre **chaves** e **valores**, sendo as **chaves únicas** e **imutáveis**. Os valores podem ser qualquer coisa. É essencial que as chaves tenham essas características porque, se fossem mutáveis, haveria uma chance das chaves mudarem durante a execução do código, tornando a procura por uma chave algo incerto.

Antigamente, dicionários não possuíam ordem, isto é, à medida que elementos eram adicionados ao dicionário, não era garantido que apareceriam nessa mesma sequência depois. Hoje em dia, a ordem é garantida mas, por boas práticas, é melhor você não depender disso em um dicionário, pois é contra sua natureza.

### Criação

Para declarar um dicionário, você pode utilizar a sintaxe `{chave1:valor1, chave2:valor2, ...}` ou `dict(chave1=valor1, chave2=valor2, ...)`. A segunda sintaxe irá presumir que as chaves são todas strings, enquanto que na primeira elas podem ser de qualquer tipo imutável.


In [102]:
dic1 = {'a': 50, 'b': 20}
dic2 = dict(a=50, b=20)
dic1, dic2

({'a': 50, 'b': 20}, {'a': 50, 'b': 20})

Para declarar um dicionário vazio, utilize

In [103]:
dic_vazio1 = {}
dic_vazio2 = dict()
dic_vazio1, dic_vazio2

({}, {})

Se você possuir um iterável que possui como itens pares de valores, `dict` irá tentar converter isso num dicionário.

In [104]:
pares = [('a', 50), ('b', 20)]
dic3 = dict(pares)
dic3

{'a': 50, 'b': 20}

### Acessando, modificando e adicionando elementos

Para acessar os elementos de um dicionário, basta utilizar a mesma notação de listas e tuplas, `[]`, mas fornecendo a chave ao invés do índice.

In [105]:
dic1['a']

50

In [106]:
dic1['a'] = 20
dic1

{'a': 20, 'b': 20}

Para adicionar um elemento, basta agir como se sua chave já existisse.

In [107]:
dic1['c'] = 30
dic1

{'a': 20, 'b': 20, 'c': 30}

Se você tentar acessar um elemento que não existe, um `KeyError` será lançado.

In [108]:
dic1['d']

KeyError: 'd'

Para contornar isso, você pode utilizar o método `.get`, que aceita uma chave, ou uma chave e um valor padrão. Se não achar, retorna `None` ou o valor padrão.

In [109]:
dic1.get('d'), dic1.get('d', 20)

(None, 20)

Se você tentar utilizar algo imutável como uma chave, irá ver a mesma mensagem de erro que já vimos, acusando o objeto de não ser `hashable`.

In [110]:
dic1[['aaa', 'bbb']] = 100

TypeError: unhashable type: 'list'

Ao invés de uma lista, pode utilizar uma tupla.

In [111]:
dic1[('aaa', 'bbb')] = 100
dic1

{'a': 20, 'b': 20, 'c': 30, ('aaa', 'bbb'): 100}

Mas se a tupla contiver elementos mutáveis, a mesma mensagem de erro será lançada.

In [112]:
dic1[(['aaa', 'bbb'])] = 100

TypeError: unhashable type: 'list'

### Métodos de `dict`

Além de `get`, temos os seguintes métodos de interesse.

* `.pop(chave)` retorna o valor e remove a chave do dicionário.

In [113]:
dic1 = {1:'aaa', 2:'bbb'}
dic1.pop(1), dic1

('aaa', {2: 'bbb'})

* `.popitem()` remove a última chave adicionada como uma tupla (chave, valor).

In [114]:
dic1 = {1:'aaa', 2:'bbb'}
dic1.popitem(), dic1

((2, 'bbb'), {1: 'aaa'})

* `.update(dict)` irá atualizar as chaves do dicionário atual com as chaves do novo dicionário, alterando os valores. Se uma chave não existir, é criada.

In [115]:
dic1 = {1:2, 2:3}
dic2 = {1:3, 2:5, 3:4}
dic1.update(dic2)
dic1

{1: 3, 2: 5, 3: 4}

* `.values()` irá retornar um iterável com todos os valores do dicionário.
* `.keys()` irá retornar um iterável com todas as chaves do dicionário.
* `.items()` irá retornar um iterável com tuplas (chave, valor) de todo o dicionário.

Esse iteráveis não são como listas, são objetos específicos de dicionários, respectivamente, `dict_values`, `dict_keys`, `dict_items`, mas você pode transformá-los em listas utilizando `list`.

In [116]:
dic1 = {1: 'aaa', 2: 'bbb'}
dic1.values(), dic1.keys(), dic1.items()

(dict_values(['aaa', 'bbb']),
 dict_keys([1, 2]),
 dict_items([(1, 'aaa'), (2, 'bbb')]))

(sec:range)=
## `range`: sequências de valores

`range` gera uma sequência de números inteiros definidos por um início, fim e passo. Uma utilidade de básica de `range` é gerar uma sequência de números, ou de índices, para iterar depois. Mas `range` não gera todos os valores, na verdade ela computa esses valores à medida que são necessários. Logo, seu tamanho em memória é sempre pequeno. Um range com 10 milhões de valores é igual a um range com 5 valores, ao contrário de uma lista, que precisaria computar todos esses valores.

### Criação

A função `range` aceita:

* Um valor de fim, presume que começa do zero e tem passo 1
* Um valor de início e fim, e presume passo 1,
* Um valor de início, fim e passo, e não presume nada.

Como sempre, os índices de final **não** são incluídos. O passo pode ser negativo, e isso significa que os valores irão do maior ao menor.

In [117]:
r1 = range(10)
r1, list(r1)

(range(0, 10), [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [118]:
r2 = range(1, 10)
r2, list(r2)

(range(1, 10), [1, 2, 3, 4, 5, 6, 7, 8, 9])

In [119]:
r3 = range(1, 10, 3)
r3, list(r3)

(range(1, 10, 3), [1, 4, 7])

In [120]:
r4 = range(10, 1, -1)
r4, list(r4)

(range(10, 1, -1), [10, 9, 8, 7, 6, 5, 4, 3, 2])

Objetos `range` possuem as funções `.count` e `.index`, que agem igualmente aos seus análogos em listas. Também possuem os parâmetros definindo o início, fim e passo.

## Utilize `in` para checar se um elemento está contido em um iterável

Suponha que você tenha uma lista com muitos elementos, e deseja saber se um novo elemento faz parte dela. Você poderia utilizar um método como `lista.count` para ver se há mais de 1 elemento, mas a maneira mais conveniente é utilizando o operador `in`.

In [121]:
lista = [1, 2, 3, 4, 5]
if 3 in lista:
    print('Achei')
else:
    print('Não encontrado')

if 6 in lista:
    print('Achei')
else:
    print('Não encontrado')

Achei
Não encontrado


(sec:for_loop)=
## `for` loop, o tipo mais comum de loop

Para começarmos uma discussão sobre loops, utilizaremos o loop `for`. Esse loop possui a seguinte sintaxe:

```
for elemento in iterável:
    ...
```

A cada passo (iteração), o i-ésimo elemento será buscado e colocado na variável `elemento` (você pode dar qualquer nome à essa variável). Depois, você pode operar nesse elemento como quiser, mas lembre-se que, dependendo da mutabilidade desse objeto, você pode estar alterando o iterável, ou não!

Quando os elementos do iterável acabam, o loop termina também.

Vejamos um exemplo:

In [122]:
lista = [1, 2, 3, 4, 5]
for número in lista:
    print(número ** 2, end=' ')

1 4 9 16 25 

Como vimos `range`, podemos substituir este código por isto:

In [123]:
for número in range(1, 6):
    print(número ** 2, end=' ')

1 4 9 16 25 

Podemos armazenar os valores de cada iteração declarando algo fora do loop como um acumulador.

In [124]:
soma = 0
for número in range(1, 10000, 7):
    soma += número
soma

7143571

In [125]:
texto = ''
for palavra in ['atirei', 'o', 'pau', 'no', 'ga', 'to', 'to']:
    texto = texto + palavra + ' '
texto

'atirei o pau no ga to to '

Isso é *quase* equivalente ao que vimos antes, com a função `join`. Consegue ver a diferença?

In [126]:
texto = ' '.join(['atirei', 'o', 'pau', 'no', 'ga', 'to', 'to'])
texto

'atirei o pau no ga to to'

In [127]:
quadrados = []
for número in range(0, 10, 1):
    quadrados.append(número ** 2)
quadrados

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

Podemos utilizar *tuple unpacking* com loops também. Aqui, usamos essa ferramenta para iterar pelos pares chave, valor de um dicionário.

In [128]:
dic1 = {'a': 10, 'b': 20, 'c': 30}
for key, val in dic1.items():
    print(key, val // 8)

a 1
b 2
c 3


Veja como seria sem *tuple unpacking*

In [129]:
dic1 = {'a': 10, 'b': 20, 'c': 30}
for par in dic1.items():
    print(par[0], par[1] // 8)

a 1
b 2
c 3


## `while` execução checando uma condição

O loop `while` testa uma condição a cada iteração. Quando a condição se torna falsa, o loop termina.

```
while cond:
    (...)
```

Veja um exemplo:

In [130]:
lista = [1, 2, 3, 4, 5]
while len(lista) != 0:
    print(lista.pop())

5
4
3
2
1


A primeira coisa feita é testar a condição `len(lista) != 0`. Se essa condição for verdadeira, a próxima iteração do loop começa. Neste caso, a função `.pop()` remove um elemento do final da lista e o retorna. Logo, `print` receberá `5`, e a lista terá 4 elementos. Como o bloco de código terminou, a condição do loop é testada novamente. Como `4!=0`, o bloco de código executa, removendo um elemento de `lista`, e assim por diante até acabarem os elementos de `lista`.

Um problema de loops, em especial o loop `while`, é que podem ocorrer infinitamente, e o loop não termina. Se isso ocorrer em uma célula de um notebook, você pode apertar o botão de parar para forçar a parada de execução. Se estiver rodando um script pelo terminal, ou estiver no REPL, você pode utilizar o comando `CTRL-C` para parar a execução do comando.

De vez em quando, loops infinitos são desejados. Por exemplo, se você fizer uma interface de usuário, você irá querer que o código que mostra a interface sempre seja executado, para mantê-la interativa. Quando o usuário quiser fechar o programa, você precisa modificar o fluxo de execução de um loop, forçando sua saída "prematura".

### Modificando o fluxo em um loop

Existem duas *keywords* que funcionam para modificar a execução de um loop. 

* Quando a *keyword* `continue` é encontrada, o loop volta à sua linha inicial. O resto do bloco de código do loop é ignorado. Você pode utiliar isso para, por exemplo, ignorar um arquivo com base em seu nome.
* Quando a *keyword* `break` é encontrada, o loop para de ser executado imediatamente, e a execução do programa continua na primeira linha após o bloco de código.

Um exemplo do uso de `continue`.

In [131]:
arquivos = ['foto.jpg', 'documento.pdf', 'arquivo1.csv', 'arquivo2.csv']
for arquivo in arquivos:
    if not arquivo.endswith('csv'):
        continue
    print(arquivo)

arquivo1.csv
arquivo2.csv


Aqui, utilizamos o método `.endswith` para ignorar arquivos que não são `.csv`, detectando se o nome do arquivo não termina em csv.

Como mencionei, loops `while` tem uma tendência de continuarem infinitamente. O loop a seguir é infinito, mas resguardado pelo fato que há um limite máximo de iterações. Quando atingido, `break` é ativado.

In [132]:
máximo_segurança = 50
contador = 0

while True:
    contador += 1
    if contador >= máximo_segurança:
        print('Atingi o máximo!')
        break
    print(contador, end=' ')

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 Atingi o máximo!


Existe uma *keyword* um pouco controversa, que até mesmo o criador da linguagem se arrepende de ter chamado disso. Após um loop, você pode adicionar a keyword `else` que irá executar um bloco de código **se o loop tiver terminado sozinho, sem o uso de `break`**.

In [133]:
lista = [1, 2, 3, 4]
for num in lista:
    if num % 5 == 0:
        break
    print(num, end=' ')
else:
    print('Finalizado')

1 2 3 4 Finalizado


In [134]:
lista = [1, 2, 3, 4, 5]
for num in lista:
    if num % 5 == 0:
        break
    print(num, end=' ')
else:
    print('Finalizado')

1 2 3 4 

O uso disso é bem limitado, mas é bom saber que isso existe.

## Loops aninhados

Do mesmo jeito que vimos condicionais aninhados, loops aninhados também podem ser utilizados. Note, porém, que a complexidade disso é geralmente maior que em loops planos, então evite de utilizar muito. Porém, loops aninhados são essenciais quando as estruturas de dados que temos também são aninhadas. Para exemplificar isso, irei demonstrar como fazer uma multiplicação matricial manualmente. As definições desta seção foram baseadas [no artigo da Wikipedia](https://en.wikipedia.org/wiki/Matrix_multiplication)

Suponha que tenhamos duas matrizes, $\mathbf{A}$, do formato $m \times n$ e $\mathbf{B}$, do formato $n \times p$. Duas matrizes podem ser multiplicadas se o número de colunas da matriz à esquerda ($\mathbf{A}$) for igual ao número de linhas da matriz à direita ($\mathbf{B}$), e a matriz resultante $\mathbf{C}$ tem o formato $m$ por $p$. Os elementos $ij$ da matriz $\mathbf{C}$ são obtidos por:

$$
c_{ij} = \sum_{k=1}^n a_{ik} b_{kj}
$$

ou seja, soma-se a multiplicação de todos os elementos da linha de uma matriz com a coluna da outra matriz.

In [135]:
A = [
    [1, 2, 3],
    [4, 5, 6],
]
B = [
    [-1, -2],
    [4, 5],
    [-7, -8]
]

In [136]:
def mult_matriz(A, B, debug=False):
    # Assegurar que o número de linhas de A é igual ao número de colunas de B
    # Lembrando que estamos armazenando as matrizes como listas aninhadas, onde
    # o primeiro nível armazena as linhas e o segundo nível as colunas
    assert len(A[0]) == len(B), "Tamanho das matrizes é incompatível"
    # Estamos presumindo que o formato das matrizes é regular
    # i.e., não possuem um número irregular de colunas
    linhas_destino = len(A)
    colunas_destino = len(B[0])
    n = len(B)
    
    # Criando matriz de destino
    dest = []
    for i in range(linhas_destino):
        temp = []
        for j in range(colunas_destino):
            temp.append(0)
        dest.append(temp)
    if debug:      
        print(f'{dest=}')

    for i in range(linhas_destino):
        for j in range(colunas_destino):
            acumulador = 0
            for k in range(n):
                op = A[i][k] * B[k][j]
                acumulador += op
                if debug:
                    print(f'{i=}, {j=}, {k=}, {A[i][k]=}, {B[k][j]=}, {op=}')
            print(f'{acumulador=}')
            dest[i][j] = acumulador
    return dest
    
res = mult_matriz(A, B, debug=True)
res

dest=[[0, 0], [0, 0]]
i=0, j=0, k=0, A[i][k]=1, B[k][j]=-1, op=-1
i=0, j=0, k=1, A[i][k]=2, B[k][j]=4, op=8
i=0, j=0, k=2, A[i][k]=3, B[k][j]=-7, op=-21
acumulador=-14
i=0, j=1, k=0, A[i][k]=1, B[k][j]=-2, op=-2
i=0, j=1, k=1, A[i][k]=2, B[k][j]=5, op=10
i=0, j=1, k=2, A[i][k]=3, B[k][j]=-8, op=-24
acumulador=-16
i=1, j=0, k=0, A[i][k]=4, B[k][j]=-1, op=-4
i=1, j=0, k=1, A[i][k]=5, B[k][j]=4, op=20
i=1, j=0, k=2, A[i][k]=6, B[k][j]=-7, op=-42
acumulador=-26
i=1, j=1, k=0, A[i][k]=4, B[k][j]=-2, op=-8
i=1, j=1, k=1, A[i][k]=5, B[k][j]=5, op=25
i=1, j=1, k=2, A[i][k]=6, B[k][j]=-8, op=-48
acumulador=-31


[[-14, -16], [-26, -31]]

Você pode verificar o resultado manualmente:

$$
A_{2\times3} = 
    \left[ \begin{array}{ccc}
        1 & 2 & 3 \\
        4 & 5 & 6 \\
    \end{array} \right]
$$

$$
B_{3\times2} = 
    \left[ \begin{array}{cc}
        -1 & -2 \\
        4 & 5 \\
        -7 & -8 \\
    \end{array} \right]
$$

$$
C_{2\times2} = 
    \left[ \begin{array}{cc}
        1 \times -1 + 2 \times 4 + 3 \times -7 & 1 \times -2 + 2 \times 5 + 3 \times -8 \\
        4 \times -1 + 5 \times 4 + 6 \times -7 & 4 \times -2 + 5 \times 5 + 6 \times -8 \\
    \end{array} \right]
$$

$$
C_{2\times2} = 
    \left[ \begin{array}{cc}
        -14 & -16 \\
        -26 & -31 \\
    \end{array} \right]
$$

Na função acima, eu utilizei uma flag `debug`, que posso colocar como `True` se eu quiser acompanhar o desenvolvimento da função enquanto ela está rodando. Mais para o futuro, iremos aprender como utilizar um *debugger* para isso, mas por enquanto, utilizar vários `print` se torna a maneira mais conveniente de se fazer isso. Além disso, utilizei um artifício de `f-string`s, onde, se você colocar o nome de uma variável seguido de igual, a formatação será `nome=valor`, facilitando o acompanhamento.

Além disso, eu iterei duas vezes pelo número de linhas e colunas. Na primeira vez, eu criei a matriz de destino. Na segunda, eu de fato calculei os valores de cada célula. Isso é redundante, mas acredito que seja um pouco mais fácil de acompanhar.

É possível realizar tudo isso de uma vez só. Veja se você consegue fazer isso sozinho. Uma maneira é a seguinte:

```python
    dest = []
    for i in range(linhas_destino):
        coluna = []
        for j in range(colunas_destino):
            temp = 0
            for k in range(n):
                temp += A[i][k] * B[k][j]
            coluna.append(temp)
        dest.append(coluna)
    return dest
```

Substitua isso por tudo entre `dest = []` até `return`.

## Operações recursivas

Em paralelo a loops, temos as funções recursivas. Uma função recursiva é uma função que chama a si mesma. Em teoria, tudo o que pode ser feito com recursão, pode ser feito com uma iteração, e vice-versa. O exemplo clássico de uma operação recursiva é o cálculo da sequência de Fibonacci. Tal sequência é definida como

$$
F_{i} = F_{i-1} + F_{i-2}
$$

sendo que $F_0=0$ e $F_1=1$.

Os primeiros valores da sequência são 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, ...

Para resolver isso utilizando uma função recursiva, primeiro precisamos definir um caso base. Esse caso limita nossa função recursiva e a impede de repetir infinitamente (como um loop). Depois, definimos os casos derivados. Aqui, os casos base são $F_0$ e $F_1$, e o caso derivado é $F_i$.

In [137]:
def fibonacci_rec(n):
    if n == 0:
        return 0
    if n == 1:
        return 1
    return fibonacci_rec(n-1) + fibonacci_rec(n-2)
    
for i in range(10):
    print(fibonacci_rec(i), end=' ')

0 1 1 2 3 5 8 13 21 34 

Para entender como isso funcionou, vamos estudar o caso `n==4`. Cada nível de indentação é um nível de recursão.

* `n==4`: Os dois primeiros testes falham. A função chega em no caso `n-1`, `fibonacci_rec(3)`.
    * `n==3`: Novamente, os dois primeiros testes falham, então a função chega em `n-1`, `fibonacci_rec(2)`.
        * `n==2`: Novamente, os dois primeiros testes falham, então a função chega em `n-1`, `fibonacci_rec(1)`.
            * `n==1`: Aqui o valor `1` é retornado.
        * `n==2`, com o caso `n-1` calculado: Como voltamos com o resultado anterior, avaliamos `n-2`, `fibonacci_rec(0)`
            * `n==0`: Aqui o valor `0` é retornado.
        * `n==2`, com os casos `n-1` e `n-2` resolvidos: Temos os dois primeiros valores, 0 e 1. São somados e retornados.
    * `n==3`, com o caso `n-1` resolvido, igual a 1. Agora temos que resolver o caso `n-2==1`.
        * `n==1`: O valor `1` é retornado.
    * `n==3`, com o caso `n-1` resolvido, igual a 1, e o caso `n-2` resolvido, igual a 1. Somamos, obtemos `2` e retornamos.
* `n==4`, com o caso `n-1` resolvido, igual a `2`. Passamos para o caso `n-2`, ou `2`.
    * `n==2`: Novamente, os dois primeiros testes falham, então a função chega em `fibonacci_rec(1)`.
        * `n==1`: Aqui o valor `1` é retornado.
    * `n==2`, com o caso `n-1` calculado: Como voltamos com o resultado anterior, avaliamos `fibonacci_rec(0)`
            * `n==0`: Aqui o valor `0` é retornado.
    * `n==2`, com os casos `n-1` e `n-2` resolvidos: Temos os dois primeiros valores, 0 e 1. São somados e voltamos um nível.
* `n==4`, com o caso `n-1` resolvido, igual a 2, e o caso `n-2` resolvido, igual a 1. Somamos, totalizando 3, e retornamos.

Foi confuso? Se disser que não e for sua primeira vez, não vou acreditar. Recursão é algo naturalmente complexo e é preferível evitar esse tipo de construção. Há algumas estruturas de dados que são mais confortavelmente exploradas com iteração, como árvores, mas estão fora do escopo deste livro.

Como disse que é possível resolver qualquer problema recursivo por métodos iterativos, aqui vai o código equivalente, utilizando somente iterações.

In [138]:
def fibonacci_it(n):
    começo = [0, 1]
    for i in range(2, n+1):
        começo.append(começo[i-1] + começo[i-2])
    return começo[n]
    
for i in range(10):
    print(fibonacci_it(i), end=' ')

0 1 1 2 3 5 8 13 21 34 

Eu, pessoalmente, acho essa solução bastante mais intuitiva. Note que esta função naturalmente armazena todos os números à medida que encontramos mais valores. Existem maneiras de "memorizar" essa lista entre chamadas da função, permitindo que os cálculos de números grandes sejam mais rápidos.

Na implementação abaixo eu modifiquei o código de forma a manter somente três números na memória. `n`, `n-1` e `n-2`. Aqui, utilizei o único "operador ternário" em Python, também conhecido como expressão condicional ([*conditional expression*](https://docs.python.org/3/reference/expressions.html#conditional-expressions)) de forma a considerar a condição onde `n==0`.

In [139]:
def fibonacci_it(n):
    primeiro, segundo = 0, 1
    for i in range(2, n+1):
        terceiro = primeiro + segundo
        primeiro = segundo
        segundo = terceiro
    return segundo if n > 0 else 0
    
for i in range(10):
    print(fibonacci_it(i), end=' ')

0 1 1 2 3 5 8 13 21 34 

## Utilizando `enumerate` para acompanhar uma lista com um índice

## Percorrendo dois iteráveis ao mesmo tempo com `zip`

### Utilizando `zip` para ordenar duas listas correlacionadas na mesma sequência

## *Comprehensions*: a junção da criação de estruturas de dados com loops

## Exercícios resolvidos

Como finalmente adquirimos uma quantidade suficiente de conhecimento, os exercícios resolvidos poderão ser bem mais interessantes e complexos.

### FizzBuzz

Existe uma pergunta muito famosa realisada em entrevistas técnicas para julgar a abilidade de uma pessoa em uma linguagem de programação. É o teste do FizzBuzz.

Sua tarefa é escrever uma função que aceita um número inteiro. Você deve iterar de 1 até esse número (incluso), e a cada iteração, se for o número for divisível por 3, escreva `Fizz`, se for divisível por 5, escreva `Buzz`, e se for divisível por 3 e 5, escreva `FizzBuzz`. Caso contrário, escreva o número em si.

In [140]:
def FizzBuzz(n):
    for i in range(1, n+1):
        if (i % 3 == 0) and (i % 5 == 0):
            print('FizzBuzz', end='')
        elif i % 3 == 0:
            print('Fizz', end='')
        elif i % 5 == 0:
            print('Buzz', end='')
        else:
            print(i, end='')
        print(', ', end='')
FizzBuzz(30)

1, 2, Fizz, 4, Buzz, Fizz, 7, 8, Fizz, Buzz, 11, Fizz, 13, 14, FizzBuzz, 16, 17, Fizz, 19, Buzz, Fizz, 22, 23, Fizz, Buzz, 26, Fizz, 28, 29, FizzBuzz, 

No primeiro exemplo, eu utilizei o fato que o operador módulo é a melhor maneira de detectar se um número é divisível por outro, e chequei as 3 condições. Divisível por 15, por 5 e por 3. Se fossem, eu escrevi a palavra apropriada. Neste exemplo, decidi compactar um pouco o output colocando tudo em uma única linha.

A seguir eu modifiquei essa função um pouco, dessa vez testando as condições de maneira diferente. Veja se você consegue prever o que ocorreria, e se o resultado seria certo.

In [141]:
def FizzBuzz(n):
    for i in range(1, n+1):
        if i % 3 == 0:
            print('Fizz', end='')
        elif i % 5 == 0:
            print('Buzz', end='')
        elif (i % 3 == 0) and (i % 5 == 0):
            print('FizzBuzz', end='')
        else:
            print(i, end='')
        print(', ', end='')
FizzBuzz(30)

1, 2, Fizz, 4, Buzz, Fizz, 7, 8, Fizz, Buzz, 11, Fizz, 13, 14, Fizz, 16, 17, Fizz, 19, Buzz, Fizz, 22, 23, Fizz, Buzz, 26, Fizz, 28, 29, Fizz, 

Note que `FizzBuzz` nunca aparece, somente `Fizz` ou `Buzz`. Isso ocorre porque os condicionais estão ligados. Primeiro, o loop testa se o número é divisível por 3. Se for, o resto da cadeia de condicionais é ignorada. Depois, testa se é por 5, e por último por 15. Porém, um número divisível por 15 é divisível por 3 e 5 também. Logo, essa condição nunca será atingida.

Se eu remover a ligação entre os condicionais, utilizando somente `if`s, veja o que ocorre.

In [142]:
def FizzBuzz(n):
    for i in range(1, n+1):
        if i % 3 == 0:
            print('Fizz', end='')
        if i % 5 == 0:
            print('Buzz', end='')
        if (i % 3 == 0) and (i % 5 == 0):
            print('FizzBuzz', end='')
        if (i % 3 != 0) and (i % 5 != 0):
            print(i, end='')
        print(', ', end='')
FizzBuzz(30)

1, 2, Fizz, 4, Buzz, Fizz, 7, 8, Fizz, Buzz, 11, Fizz, 13, 14, FizzBuzzFizzBuzz, 16, 17, Fizz, 19, Buzz, Fizz, 22, 23, Fizz, Buzz, 26, Fizz, 28, 29, FizzBuzzFizzBuzz, 

(Note que tive que modificar o `else` para um `if`, para preservar parte da lógica). Agora `FizzBuzz` está aparecendo duplicado. Como os condicionais não estão ligados, todos estão sendo testados em toda a iteração. Isso é um pequeno desperdício, mas também causa um problema ao passar pelo teste de FizzBuzz. Como as duas condições acima são verdadeiras neste caso, ela é executada também. E se removermos essa condição?

In [143]:
def FizzBuzz(n):
    for i in range(1, n+1):
        if i % 3 == 0:
            print('Fizz', end='')
        if i % 5 == 0:
            print('Buzz', end='')
        if (i % 3 != 0) and (i % 5 != 0):
            print(i, end='')
        print(', ', end='')
FizzBuzz(30)

1, 2, Fizz, 4, Buzz, Fizz, 7, 8, Fizz, Buzz, 11, Fizz, 13, 14, FizzBuzz, 16, 17, Fizz, 19, Buzz, Fizz, 22, 23, Fizz, Buzz, 26, Fizz, 28, 29, FizzBuzz, 

Agora, precisamos somente testar pelas duas condições de divisão por 3 e por 5. Porém, a condição base, onde imprimimos o número em si, requer mais duas divisões. Podemos contornar isso utilizando uma *flag*.

In [145]:
def FizzBuzz(n):
    for i in range(1, n+1):
        printed = False
        if i % 3 == 0:
            print('Fizz', end='')
            printed = True
        if i % 5 == 0:
            print('Buzz', end='')
            printed = True
        if not printed:
            print(i, end='')
        print(', ', end='')
FizzBuzz(30)

1, 2, Fizz, 4, Buzz, Fizz, 7, 8, Fizz, Buzz, 11, Fizz, 13, 14, FizzBuzz, 16, 17, Fizz, 19, Buzz, Fizz, 22, 23, Fizz, Buzz, 26, Fizz, 28, 29, FizzBuzz, 

Você pode continuar brincando com este problema, tentando abordagens diferentes, outros tipos de função, e implementar alguns testes para garantir que o resultado está correto.

### Contando palavras em um arquivo de texto

O [projeto Gutenberg](www.gutenberg.org) possui um acervo muito grande de livros totalmente gratuitos, que não possuem mais copyright e podem ser distribuídos livremente. Baixe um livro em formato de texto (*plain text*) e coloque na pasta *dados* deste capítulo. Eu já baixei coloquei o arquivo `iracema.txt` lá, com o conteúdo do texto de José de Alencar. Iremos então contar o número de palavras neste documento.

A melhor maneira de acompanhar isso é abrir o texto em uma janela à parte.

Primeiro, note que o livro começa com um cabeçalho em inglês. Isso precisará ser descartado. Depois temos uma página que parece ser uma cópia da capa, um índice, uma biografia, um prefácio, e só então o livro começa, na linha 452. Somente após isso começaremos a contar as palavras.

Porém, para contar as palavras, não devemos distinguir letras maiúsculas de minúsculas, devemos remover a pontuação e outros caracteres de pouco interesse. Depois, seria de mais interesse remover palavras muito comuns, como artigos, preposições, etc, que acabam poluindo nossa contagem.

O livro termina na linha 3800. Depois disso temos algumas notas e uma seção em inglês adicionada pelo Projeto Gutenberg.

Para fazer tudo isso, utilizaremos a função `open`. Essa função aceita um caminho até um arquivo, e pode abri-lo no modo leitura (que faremos), no modo escrita, que apaga tudo e começa a escrever do zero, ou no modo de adição, onde texto é adicionado. Para isso, é bom saber a codificação do arquivo. Codificação é a maneira de traduzir os bytes de um arquivo em letras. As codificações mais comuns que encontrei no meu trabalho são, em primeiro lugar, `utf8`, seguido de `latin1` e por último `utf16`. `open` retorna um *file handle*, que permite que você avance e volte no arquivo, e informa o sistema operacional que você está utilizando o arquivo. **Sempre que você abre um arquivo com `open`, você precisa fechá-lo**, senão muitos problemas podem ocorrer, como dados não salvos ou problemas em reabrir um arquivo.

In [146]:
linha_início_texto = 452
linha_final_texto = 3800

handle = open('./dados/iracema.txt', 'r', encoding='utf8')
contagem_palavras = {} # Dicionário vazio para armazenar tudo

for i, linha in enumerate(handle):
    if i < linha_início_texto:
        continue
    if i > linha_final_texto:
        break
    
    linha = linha.strip() # Remove espaços e outros caracteres não visíveis do início e fim.
    linha = linha.strip(',.!?-;:') # Remove pontuação
    # No texto, há várias junções como "d'ella". Vamos considerar isso como uma palavra só
    
    if len(linha) == 0: # Pulamos linhas vazias
        continue

    # Remover linhas que descrevem o número de capítulos.
    # I, II, XIV, etc
    if linha.isupper():
        continue
    
    linha = linha.lower() # Transforma tudo em caixa baixa.
    palavras = linha.split() # Separa a linha em várias palavras pelos espaços.

    # Vamos contar as palavras
    for palavra in palavras:
        if palavra not in contagem_palavras.keys():
            contagem_palavras[palavra] = 1
        else:
            contagem_palavras[palavra] += 1

handle.close()
num_total_palavras = sum(contagem_palavras.values())
print(f'{num_total_palavras=}')

num_total_palavras=21968


In [147]:
# Separando em outra célula para poder manipular a lista de palavras em precisar
# re-analisar todo o texto
# Transformando o dicionário em lista para poder ser ordenada
lista_palavras = list(contagem_palavras.items())
lista_palavras.sort(key = lambda x: x[1], reverse=True)
print(lista_palavras[:10])

[('o', 1254), ('a', 963), ('de', 664), ('e', 621), ('que', 547), ('do', 540), ('da', 468), ('os', 312), ('para', 226), ('as', 215)]


In [148]:
# Removendo as palavras de pouco interesse. Você pode incluir mais palavras se desejar
pouco_interesse = [
    'o', 'a', 'de', 'e', 'que', 'do', 'da', 'os', 'para', 'as', 'seu', 'como', 'na',
    'dos', 'se', 'em', 'com', 'no', 'ao', 'sua', 'á', 'com', 'é', 'elle', 'das', 'quando',
    'onde', 'seus', 'ella', 'uma', 'um', 'mais', 'teu', 'mas', 'já', 'te', 'por',
    'nos', 'tua', 'tu', 'foi', 'porque', 'entre', 'sobre', 'ainda', 'depois', 'só',
    'lhe', 'assim', 'era', 'até', 'aos', 'tem', 'não'
]
for palavra in pouco_interesse:
    if palavra in contagem_palavras.keys():
        contagem_palavras.pop(palavra)
lista_palavras = list(contagem_palavras.items())
lista_palavras.sort(key = lambda x: x[1], reverse=True)
print(lista_palavras[:50])
num_total_palavras_interessantes = sum(contagem_palavras.values())
print(f'{num_total_palavras_interessantes=}')

[('guerreiro', 180), ('iracema', 170), ('virgem', 95), ('guerreiros', 88), ('poty', 81), ('olhos', 78), ('irmão', 76), ('martim', 76), ('cabana', 75), ('grande', 67), ('chefe', 59), ('extrangeiro', 57), ('filha', 56), ('terra', 49), ('nas', 47), ('araken', 47), ('voz', 45), ('pagé', 44), ('branco', 43), ('christão', 42), ('coração', 41), ('cauby', 40), ('pela', 40), ('campos', 35), ('sol', 34), ('mar', 34), ('tupan', 34), ('alma', 34), ('esposa', 34), ('seio', 33), ('velho', 32), ('filho', 32), ('margens', 31), ('irapuam', 30), ('ás', 29), ('vae', 28), ('elles', 28), ('tabajaras', 28), ('passo', 28), ('disse', 27), ('sangue', 26), ('peito', 26), ('luz', 25), ('sombra', 25), ('corpo', 25), ('pelo', 25), ('mão', 25), ('taba', 25), ('nome', 25), ('alegria', 25)]
num_total_palavras_interessantes=12672


In [149]:
# Utilizando algumas list comprehensions, podemos calcular a 
# frequência de uso das palavras
lista_palavras_frequencia = [
    (palavra, contagem / num_total_palavras * 100)
    for palavra, contagem in lista_palavras
]
print(lista_palavras_frequencia[:10])

[('guerreiro', 0.8193736343772761), ('iracema', 0.7738528769118718), ('virgem', 0.4324471959213401), ('guerreiros', 0.4005826656955572), ('poty', 0.3687181354697742), ('olhos', 0.35506190823015293), ('irmão', 0.3459577567370721), ('martim', 0.3459577567370721), ('cabana', 0.3414056809905317), ('grande', 0.3049890750182083)]


Se desejar, pode até tentar juntar palavras que diferem somente de um plural ou não, mas não farei isto aqui, porque isso é um problema um tanto mais complexo, da área de processamento de linguagem natural. Por exemplo, `deu` e `deus` diferem só no `s`, mas não são plurais um do outro. Logo, o código a seguir não funcionaria apropriadamente.

```python
plurais = {}
for palavra, soma in contagem_palavras.items():
    if palavra.endswith('s') and palavra[:-1] in contagem_palavras:
        print(palavra)
        plurais[palavra] = 0
contagem_palavras.update(plurais)
```

Idealmente, teríamos um dicionário que possui os plurais de todas as palavras e usaríamos isso para fazer essa correção. Existem bibliotecas com essa informação, mas como não ap

### Métodos de derivadas numéricas

Derivada pra frente, derivada pra trás, derivada central

In [None]:
def meu_range(arg1, arg2 = None, arg3 = None):
    if arg2 is None and arg3 is None:
        final = arg1
        início = 0
        passo = 1
    elif arg3 is None:
        início = arg1
        final = arg2
        passo = 1
    else:
        início = arg1
        final = arg2
        passo = arg3
    
    yield início
    valor = início + passo
    while valor < final:
        yield valor
        valor = valor + passo