# Estrutura de Dados

O Python possui diversas ferramentar para lidar com estrutura de dados.<br>
As que veremos a seguir são :
- lists
- tuples
- sets
- dictionaries

# 1. Listas - Parte 2

Vamos nos aprofundar mais nas listas e no que elas podem fazer.<br>
As listas possuem diversos métodos.

## 1.1. list.append(x)

Adiciona um item ao final da lista.<br>
Equivalente a fazer `lista[len(lista):] = [novo_item]`.

In [None]:
numeros = [1,2,3,4]
print(numeros)

numeros.append(5)
print(numeros)

numeros[len(numeros):] = [6]
print(numeros)

## 1.2. list.extend(iterable)

Extende uma lista adicionando todos os itens do iterável.<br>
Equivalente a fazer `lista[len(lista):] = iterable`.

In [None]:
numeros = [1,2,3,4]
outros_numeros = [9,8,7,6]
print(numeros)

numeros.extend(outros_numeros)
print(numeros)

mais_numeros = [10,11,12]
numeros[len(numeros):] = mais_numeros
print(numeros)

## 1.3. list.insert(i, x)

Insere um item em uma posição específica. O primeiro argumento (`i`) é o índice onde o elemento será inserido. Logo, `lista.insert(0, x)` vai insrir na primeira posição da lista, e `lista.insert(len(lista), x)` é equivalente ao `lista.append(x)`. Retorna `None`.

In [None]:
numeros = [1,2,3,4]
print(numeros)

numeros.insert(0, 'f')
print(numeros)

numeros.insert(len(numeros), 'b')
print(numeros)

## 1.4. list.remove(x)

Remove da lista a primeira ocorrência onde o valor é igual ao `x`. Vai gerar um `ValueError` se não encontrar o item. Retorna `None`.

In [None]:
numeros = [1,2,3,4]
print(numeros)

numeros.remove(2)
print(numeros)

numeros.remove(5)
print(numeros)

## 1.5. list.pop([i])

Remove o item dada uma posição da lista e retorna ele. Se nenhum índice for especificado, `lista.pop()` remove e retorna o último item da lista. (Os colchetes entre o `i` apenas indicam que o parâmetro é opcional. É usado com muita frequência nas referências do Python). Vai gerar um `IndexError` caso o índice não exista.

In [None]:
numeros = [1,2,3,4]
print(numeros)

ultimo = numeros.pop()
print(numeros)
print(ultimo)

especifico = numeros.pop(0)
print(numeros)
print(especifico)

especifico = numeros.pop(6)

## 1.6. list.clear()

Remove todos os itens da lista. Equivalente ao `del lista[:]`.

In [None]:
numeros = [1,2,3,4]
print(numeros)

numeros.clear()
print(numeros)

numeros = [1,2,3,4]
print(numeros)
del numeros[:]
print(numeros)

## 1.7. list.index(x[, start[, end]])

Retorna o índice da lista do primeiro item que o valor é igual ao `x`. Vai gerar um `ValueError` se o item não estiver na lista.<br>
O argumento opcional `start` e `end` são interpretados como uma notação de fatiamento e são usados para limitar a busca a uma subsequência da lista.

In [None]:
animais = ['cachorro', 'gato', 'cavalo', 'caturrita']
indice = animais.index('gato')
print(indice)
print(animais[indice])

## 1.8. list.count(x)

Retorna o número de vezes que o `x` aparece na lista.

In [None]:
numeros = [1,2,3,4,5,6,1,5,6,9,5,6,9,7,5]
qtd = numeros.count(5)
print(qtd)

## 1.9. list.sort(*, key=None, reverse=False)

Ordena os itens de uma lista. Retorna `None`. Para usar os argumentos opcionais, é ncessário chamá-los usando os argumentos nomeados.
- `key` : especifica a função de um argumento que é usada para comparar cada elemento no iterável (exemplo : `key=str.lower`). O valor padrão é `None` (que compara os elementos diretamente).
- `reverse` : é um valor booleano. Se usado com `True`, então a lista de elementos é ordenada como se cada comparação fosse revertida.

In [None]:
numeros = [1,2,3,4,5,6,1,5,6,9,5,6,9,7,5]
print(numeros)
numeros.sort()
print(numeros)
numeros.sort(reverse=True)
print(numeros)

In [None]:
animais = ['cachorro', 'gato', 'cavalo', 'caturrita', 'GATO', 'GAFANHORO']
animais.sort()
print(animais)
animais.sort(key=str.lower)
print(animais)

Repare que nem todos os dados podem ser comparados ou ordendos.<br>
For exemplo, `[None, 'cavalo', 10]` não podem ser ordenados porque inteiros não podem ser comparados com `strings` e `None` não pode ser comparado com outros tipos.<br>
Também, há alguns tipos que não tem uma ordem de relação definida. Por exemplo, `3+4j < 5+7j` não é uma comparação válida.

## 1.10. list.reverse()

Reverte os elementos da lista.

In [None]:
numeros = [1,2,3,4,5,6,1,5,6,9,5,6,9,7,5]
print(numeros)
numeros.reverse()
print(numeros)

## 1.11. list.copy()

Retorna uma cópia rasa (`shallow copy`) da lista. Equivalente a `lista[:]`.

In [None]:
animais = ['cachorro', 'gato', 'cavalo', 'caturrita']
copia = animais.copy()
animais.append('morcego')
print(animais)
print(copia)

## 1.12. Listas como Pilhas

Os métodos das listas tornam muito fácil trabalhar com elas como se fossem pilhas, onde o último elemento adicionando é o primeiro elemento recuperado (`last-in, first-out` - `lifo`). Para adicionar um item ao topo da pilha, use `.append()`. Para recuperar um item do topo da pilha, use `.pop()` sem um índice explícito.

In [None]:
pilha_animais = ['cachorro', 'gato', 'cavalo', 'mula']
print(pilha_animais)

pilha_animais.append('grilo')
pilha_animais.append('dragão')
print(pilha_animais)

ultimo = pilha_animais.pop()
print(pilha_animais)
print(ultimo)

ultimo = pilha_animais.pop()
ultimo = pilha_animais.pop()
print(pilha_animais)
print(ultimo)

## 1.13. Compreensão de Listas (List Comprehensions)

Compreensão de listas é uma maneira concisa de criar listas. Muitas aplicações criam novas listas onde cada elemento resulta de alguma operação aplicada a cada item de outra sequência ou iterável, ou criar uma sublista de elmentos que satisfazem determinada condição.

In [None]:
# forma 'tradional'
quadrados = []
for x in range(10):
    quadrados.append(x**2)
print(quadrados)

Note que desse modo cria (ou sobreescreve) uma variável chamada de `x` que ainda existe depois da repetição terminar. Nós podemos calcular a lista de quadrados sem efeito colateral usando compreensão de listas, que é mais concisa e mais fácil de ler.

In [None]:
quadrados = [x**2 for x in range(10)]
print(quadrados)

A compreensão de listas consiste em conchetes `[]` contendo uma expressão seguido de uma cláusula `for` e então zero ou mais cláusulas `for` ou `if`. O resultado será uma nova lista resultante da verificação da expressão no contexto das cláusulas `for` e `if` que seguem.<br>
Por exemplo : essa comparação de listas combina elementos de duas listas se eles não forem iguais.

In [None]:
resultado = [(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]
print(resultado)

In [None]:
# equivalente
resultado = []
for x in [1,2,3]:
    for y in [3,1,4]:
        if x != y:
            resultado.append((x, y))
print(resultado)

Repare que a ordem das cláusulas `for`s e `if` são as mesmas em ambos os códigos.

In [None]:
lista = [-4, -2, 0, 2, 4]

# cria uma nova lista com os valores duplicados
print(f'Lista duplicada : {[x*2 for x in lista]}')

# filtra a lista para excluir os valores negativos
print(f'Lista positivos : {[x for x in lista if x >= 0]}')

# aplica uma função a todos os elementos
print(f'Lista absolutos : {[abs(x) for x in lista]}')

# chama um método em cada elemento da lista
frutas = ['   banana   ', '   laranga', 'bergamota   ']
print(f'Frutas sem espaços : {[fruta.strip() for fruta in frutas]}')

# cria uma lista de tuplas com dois valores como (numero, quadrado)
print(f'Tuplas : {[(x, x**2) for x in range(10)]}')
# a tupla precisa estar entre parêntesos, senão ocorre o erro :
# SyntaxError: f-string: did you forget parentheses around the comprehension target?

# junta uma lista de listas em outra lista com dois 'for'
listas = [[1,2,3], [4,5,6], [7,8,9]]
print(f'Uma lista : {[num for lista in listas for num in lista]}')

Compreensão de listas pode conter expressões complexas e funções aninhadas.

In [None]:
from math import pi
print(f'Decimais do PI : {[str(round(pi, i)) for i in range(1, 6)]}')

## 1.14. Compreensão de Listas Aninhadas

A expressão inicial de uma compreensão de lista pode ser qualquer expressão, incluindo outra compreensão de lista.

A compreensão de lista abaixo vai transpor as linhas e colunas da matriz.

In [None]:
matriz = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]

transposta = [[linha[i] for linha in matriz] for i in range(4)]
print(f'Matriz transposta : {transposta}')

Como vimos, a compreensão de lista mais interna é resolvida no contexto do `for` mais externo. Veja os equivalentes :

In [None]:
matriz = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]

transposta = []
for i in range(4):
    transposta.append([linha[i] for linha in matriz])
print(f'Matriz transposta : {transposta}')

In [None]:
matriz = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]

transposta = []
for i in range(4):
    transposta_linha = []
    for linha in matriz:
        transposta_linha.append(linha[i])
    transposta.append(transposta_linha)
print(f'Matriz transposta : {transposta}')

## Links

- https://docs.python.org/3/tutorial/datastructures.html#more-on-lists
- https://docs.python.org/3/library/functions.html#sorted
- https://peps.python.org/pep-0202/

# 2. del

Há uma maneira de remover um item de uma lista através de seu índice em vez de seu valor : a declaração [del](https://docs.python.org/3/reference/simple_stmts.html#del). Ela é diferente do método `pop()` que retorna um valor. A declaração `del` pode ser usada para remover segmentos de uma lista ou limpar toda a lista (que foi visto antes pela atribuição de uma lista vazia para o segmento).

In [None]:
numeros = [-5, 1, 42, 66.66, 456, 1234,5]
print(numeros)

del numeros[0]
print(numeros)

del numeros[2:4]
print(numeros)

del numeros[:]
print(numeros)

O `del` também pode ser usado para declarar variáveis inteiras.

In [None]:
numeros = [-5, 1, 42, 66.66, 456, 1234,5]
print(numeros)

del numeros
# NameError: name 'numeros' is not defined
print(numeros)

Tentar usar a variável `numeros` depois do `del` irá gerar um erro (ao menos até outro valor ser associado à variável). Mais tarde veremos outros usos para o `del`.

# 3. Tuplas e Sequências

Nós vimos que listas e strings têm muitas propriedades em comum, como as operações com índices e repartimentos. Elas são dois exemplos de [tipos de dados de sequência](https://docs.python.org/3/library/stdtypes.html#typesseq). Há ainda outro tipo de sequência : a tupla (`tuple`).

A tupla consiste de uma série de valores separados por vírgulas.

In [None]:
tupla  = 123456, 654321, 'bom dia!'
print(tupla[0])
print(tupla)

# tuplas também podem ser aninhadas
outra_tupla = tupla, (1, 2, 3, 4, 5)
print(outra_tupla)

# tuplas são imutáveis
# TypeError: 'tuple' object does not support item assignment
tupla[0] = 8888

# mas elas podem conter objetos mutáveis
tupla = ([1, 2, 3], [3, 2, 1])
print(tupla)

Como você pode ver, as saídas das tuplas são sempre cercadas por parênteses `()`, o que quer dizer que as tuplas são interpretadas corretamente. Elas podem ser declaradas com ou sem parênteses, embora muitas vezes os parênteses sejam necessários de qualquer jeito (se a tupla for parte de uma expressão maior). Não é possível atribuir um valor individual a um item de uma tupla, contudo, é possível criar tuplas que contem objetos mutáveis, como as listas.

Embora as tuplas possem parecer similar às listas, elas são usadas em diferentes situações e para diferentes propósitos. Tuplas são [imutáveis](https://docs.python.org/3/glossary.html#term-immutable) e geralmente contem uma sequência heterogênea de elementos que são acessados via desempacotamento (mais sobre isso abaixo) ou indexando (ou até mesmo com atributos, como no caso de [namedtuples](https://docs.python.org/3/library/collections.html#collections.namedtuple)). Listas são [mutáveis](https://docs.python.org/3/glossary.html#term-mutable) e seus elementos são geralmente homogêneos e são acessados pela iteração da lista.

Um problema especial é a construção das tuplas contendo 0 ou 1 item : a sintaxe tem alguns passos extras para serem realizados. Tuplas vazias são construídas usando um par de parênteses vazios; uma tupla com um item é construindo colocando uma vírgula após o valor (não é o suficiente apenas colocar o valor único entre parênteses). É feio, mas eficiente.

In [None]:
vazio = ()
unico = 'buenas', # repare na vírgula no final
print(len(vazio))
print(len(unico))
print(unico)

A declaração `tupla = 123456, 654321, 'bom dia!'` é um exemplo de empacotamento de tupla. Os valores `123456`, `654321` e `bom dia!` são empacotados juntos em uma tupla. A operação reversa também é possível.

In [None]:
tupla  = 123456, 654321, 'bom dia!'
valor1, valor2, valor3 = tupla
print(tupla)
print(valor1)
print(valor2)
print(valor3)

Isso é chamado de desempacotamento de sequência e funciona para qualquer sequência do lado direito. Desempacotamento de sequência requer que haja a quantidade de variáveis igual à quantidade de valores que tupla tiver. Repare que atribuições múltiplas nada mais é que a combinação de empacotamento e desempacotamento de tuplas.

# 4. Sets

Python também tem o tipo `sets`. Um `set` é uma coleção desordenada sem elementos duplicados. Usos básicos incluem teste dos elementos e eliminação de entradas duplicadas. `Sets` também suportam operações matemáticas como `união`, `inseção`, `diferença` e `diferença simétrica`.

Chaves ou a função [set()](https://docs.python.org/3/library/stdtypes.html#set) podem ser usadas para criar `sets`. Nota : para criar um `set` vazio você precisa usar `set()` e não `{}`. O `{}` cria um dicionário vazio, uma estrutura de dados que será visto adiante.

In [None]:
cesta = {'maçã', 'laranja', 'bergamota', 'laranja', 'banana'}
print(cesta) # mostra que as duplicadas foram removidas

print('laranja' in cesta) # teste rápido se o item está no set
print('pepino' in cesta)

# demonstração das operações set de duas palavras
set1 = set('abracadabra')
set2 = set('alakazam')
print(set1) # letras únicas no set1
print(set1 - set2) # letras em set1 mas não em set2
print(set1 | set2) # letras em set1 ou em set2
print(set1 & set2) # letras em set1 e em set2
print(set1 ^ set2) # letras em set1 ou em set2, mas não em ambos

Assim como a [compreensão de listas](https://docs.python.org/3/tutorial/datastructures.html#tut-listcomps), compreensão de set também está disponível.

In [None]:
um_set = {l for l in 'abracadabra' if l not in 'abc'}
print(um_set)

# 5. Dicionários

Outra estrutura de dados útil **built-in** do Python é o dicionário ([dictionary](https://docs.python.org/3/library/stdtypes.html#typesmapping)). Dicionários são encontrados em outras linguagens com `memórias associativas` ou `arrays associativos`. Diferente das sequências, que são indexadas por uma série de números, dicionário são indexados por chvaes (`keys`), que podem ser de qualquer tipo `imutável` (string e números sempre podem ser chaves). Tuplas podem ser usadas como chaves se elas contem apenas strings, números ou tuplas (se a tupla contem qualquer objeto mutável direto ou indiretamente, ela não pode ser usada como uma chave). Você não pode usar listas como chaves, já que as listas podem ser modificadas usando atribuição pelo índice, atribuição por repartição ou métodos como `append()` ou `extend()`.

É melhor pensar num dicionário como um conjunto de pares `chave : valor`, com a condição de que as chaves sejam únicas (dentro do mesmo dicionário). Um par de chaves `{}` cria um dicionário vazio. Colocando uma vírgula separando os pares `chave : valor` dentro das chaves adiciona o valor par inicial de `chave : valor` ao dicionário (esta também é a forma como os dicionários são escritos nas saídas).

As operações principais em um dicionário são de armazenas um valor com alguma chave e extrair o valor dado a chave. É também possível deletar um par `chave : valor` com o comando `del`. Se você armazenar uma chave que já está em uso, o valor antigo associado à chave será apagado. É um erro extrair um valor de uma chave inexistente.

Usar a função `list(d)` em um dicionário retorna uma lista de todas as chaves usadas nele na ordem inserida (se você quiser ordenar, basta usar `sorted(d)`). Para verificar se uma única chave está presente no dicionário, use o comando [in](https://docs.python.org/3/reference/expressions.html#in).

In [None]:
pessoa = {'nome':'fulano', 'idade':20}
print(pessoa)
pessoa['telefone'] = '555.555'
print(pessoa['nome'])
print(pessoa['idade'])

del pessoa['telefone']
print(pessoa)

pessoa['altura'] = 1.5
print(list(pessoa))

print(sorted(pessoa))
print('nome' in pessoa)
print('idade' not in pessoa)

O construtor [dict()](https://docs.python.org/3/library/stdtypes.html#dict) cria dicionário diretamente das sequências dos pares chave-valor.

In [None]:
pessoa = dict([('nome', 'fulano'), ('idade', 20)])
print(pessoa)

Também, compreensão de dicionários podem ser usados para criar dicionários.

In [None]:
print({x: x**2 for x in (2, 4, 6)})

Quando as chaves são string simples, é, às vezes, mais de especificar os pares usando argumentos nomeados.

In [None]:
print(dict(nome='fulano', idade=20))

# 6. Técnicas de Repetições

Quando realizamos uma repetição através de dicionários, a chave e  o valor correspondente podem ser recuperados ao mesmo tempo usando o método `.item()`.

In [None]:
cavaleiros = {'gallahad': 'o puro', 'robin': 'o bravo'}
for chave, valor in cavaleiros.items():
    print(chave, valor)

Quando realizamos uma repetição através de uma sequência, o índice da posição e o valor correspondente podem ser recuperados da mesma maneira usando a função [enumerate()](https://docs.python.org/3/library/functions.html#enumerate).

In [None]:
for indice, valor in enumerate(['tic','tac','toe']):
    print(indice, valor)

A repetição sobre dois ou mais sequências ao mesmo tempo, as entradas podem ser pareadas com a função [zip()](https://docs.python.org/3/library/functions.html#zip).

In [None]:
perguntas = ['nome', 'missao', 'cor favorita']
respostas = ['lancelot', 'o cálice sagrado', 'azul']

for p, r in zip(perguntas, respostas):
    print(f'Qual é seu {p}? É {r}.')

Para repetir sobre uma sequência de trás para frente, primeiro especifique a sequência crescente e então chame a função [reversed()](https://docs.python.org/3/library/functions.html#reversed).

In [None]:
for i in reversed(range(1, 24, 2)):
    print(i, end=' ')

Para repetir sobre uma sequência ordenada, use a função [sorted()](https://docs.python.org/3/library/functions.html#sorted) que retorna uma nova lista ordenada enquando deixa a lista original inalterada.

In [None]:
cesta = ['maçã', 'laranja', 'bergamota', 'laranja', 'banana']
for i in sorted(cesta):
    print(i, end=' ')

Usando [set()](https://docs.python.org/3/library/stdtypes.html#set) em uma sequência elimina os elementos duplicados. O uso do [sorted()](https://docs.python.org/3/library/functions.html#sorted) em commbinação com o [set()](https://docs.python.org/3/library/stdtypes.html#set) sobre as sequências é uma maneira idiomática de repetir sobre os elementos únicos de uma sequência ordenada.

In [None]:
cesta = ['maçã', 'laranja', 'bergamota', 'laranja', 'banana']
for i in sorted(set(cesta)):
    print(i, end=' ')

Às vezes é tentador mudar uma lista enquanto você está repetindo sobre ela, contudo geralmente é mais seguro e simples criar uma nova lista.

In [None]:
import math

varios_dados = [3.17, float('NaN'), 51.7, 55.3, 52.5, float('NaN'), 47.8]
dados_filtrados = []

# filtra os dados numéricos
for valor in varios_dados:
    if not math.isnan(valor):
        dados_filtrados.append(valor)

print(dados_filtrados)

# 7. Mais nas Condições

As condições usadas nas cláusulas `while` e `if` podem conter qualquer operador, não apenas comparações.

Os operadores de comparações `in` e `not in` fazem parte do grupo de testes que determinam se um valor está (ou não está) em um container. Os operadores `is` e `is not` comparam se dois objetos são realmente o mesmo objeto. Todos os operdores de comparação tem a mesma prioridade, que menor que todos os operadores numéricos.

In [None]:
cesta = ['maçã', 'laranja', 'bergamota', 'laranja', 'banana']
cesta2 = cesta

print('laranja' in cesta)
print('banana' not in cesta)

print(cesta is cesta2)

Comparações podem ser encadeadas.

In [None]:
x = 10

if 5 < x < 15:
    print(f'x é maior que 5 e menor que 15')

a, b, c = 1, 2, 5
print(a < b == c)

Comparações podem ser combinados com operadores Booleanos `and` e `or`, e a comparação resultante (ou qualquer outra comparação booleana) podem ser negados com `not`. Os operadores Booleanos tem menor prioridade do que os operadores de comparação. Entre eles, o `not` tem a prioridade mais alta e o `or` tem a mais baixa, logo que `A and not B or C` é equivalente a `(A and (not B) or C)`. Como sempre, parênteses podem ser usados para expressar as composições desejadas.

Os operadores Booleanos `and` e `or` são então chamados `operadores de circuitos` : os argumentos deles são calculados da esquerda para a direita, e o cálculo é interrompido assim que o resultado é determinado. Por exemplo, se `A` e `C` são verdadeiros, mas `B` é falso, `A and B and C` não calcula a expressão `C`. Quando usados como um valor geral e não como um Booleano, o valor retornado do operador de circuito é o cálculo do último argumento.

É possível associar o resulado de uma comparação ou outra expressão Booleana para uma variável.

In [None]:
nome1, nome2, nome3 = '', 'Ferrari', 'Ford'
nao_null = nome1 or nome2 or nome3
print(nao_null)

# 8. Comparando Sequências e Outros Tipos

Objetos de sequência podem ser comparados a outros objetos com o mesmo tipo de sequência. A comparação usa a ordem lexicográfica (ordem alfabética). Primeiro os dois primeiros itens são comparados, se eles forem diferentes isso determina o resultado da comparação; se eles forem iguais, os próximos dois itens são comparados e assim por diante até o final da sequência. Se dois itens comparados forem também forem sequências do mesmo tipo, a comparação lexicográfica será feita recursivamente. Se todos os itens da lista forem iguais, as sequências são consideradas iguais.

In [None]:
print((1,2,3) < (1,2,4))
print([1,2,3] < [1,2,4])
print('ABC' < 'C' < 'Pascal' < 'Python')
print((1,2,3,4) < (1,2,4))
print((1,2) < (1,2,-1))
print((1,2,3) == (1.0,2.0,3.0))
print((1,2,('aa','ab')) < (1,2,('abc','a'),4))

Veja que comparando objetos de diferentes tipos com `<` ou `>` é previsto que os objetos tenham métodos de comparação apropriados. Por exemplo : tipos numéricos mistos são comparados de acordo com seu valor numérico, então `0` e igual a `0.0`, etc. Caso contrário, em vez de trazer uma comparação ordenada, o interpretador vai levantar uma exceção [TypeError](https://docs.python.org/3/library/exceptions.html#TypeError).