# Coleções (listas, tuplas, conjuntos e dicionários)

## $ \S 1 $ Listas

### $ 1.1 $ O tipo `list`

Uma __lista__ (isto é, um objeto do tipo `list`) consiste em zero, um ou vários objetos ordenados em sequência. Em Python, uma lista pode ser __heterogênea__, significando que seus elementos podem ser de qualquer tipo, e estes tipos não precisam coincidir. Por exemplo, pode-se criar uma lista que contém inteiros, números de ponto flutuante e strings; ou uma lista cujos elementos podem ser números complexos ou funções. Em particular, listas em Python têm a importante propriedade de __fechamento__: é permitido fazer listas de listas, ou listas de listas de listas, etc. Finalmente, em contraste com os arrays de algumas outras linguagens de programação, listas são __dinâmicas__ (não _estáticas_), significando que seus comprimentos podem mudar durante a execução.

Uma lista é representada usando _colchetes_ na forma `[<elementos>]`, com os elementos separados por vírgulas.

__Exemplo:__

In [3]:
# Aqui está uma lista de strings (onde cada string consiste em um emoji):
frutas = ["🍑", "🥝", "🍉", "🥥", "🍋", "🍐"]

# Aqui está uma lista consistindo de elementos de vários tipos distintos:
numeros = [0, 'oito', -53, 12.34, (3 + 4j)]

# Esta lista tem um único elemento:
magos = ['Delfador']

print(frutas)
print(numeros)
print(magos)

['🍑', '🥝', '🍉', '🥥', '🍋', '🍐']
[0, 'oito', -53, 12.34, (3+4j)]
['Delfador']


A __lista vazia__ é a única lista que não tem elementos. Existem pelo menos duas maneiras de instanciá-la:

In [4]:
empty1 = []         # primeira maneira
empty2 = list()     # segunda maneira

# Elas representam o mesmo objeto:
print(empty1 == empty2)

True


Assim como para strings, a função `len` pode ser usada para contar o número de itens em uma lista.

In [5]:
print(len(magos))
print(len(frutas))

1
6


In [None]:
nova_lista = frutas + magos   # Podemos concatenar duas listas usando '+'
print(nova_lista)

Listas podem ser __concatenadas__ com o operador `+`, __repetidas__ por "multiplicação" com inteiros positivos usando `*` e __fatiadas__ com o operador `:`. Note que nenhuma dessas operações _modifica_ a lista original; em vez disso, elas criam uma _nova_ lista. Lembre-se que tudo isso também é verdade para strings.

__Exercício:__ Seja _filmes_ a lista na célula de código abaixo. Determine a saída das seguintes declarações:

(a) `filmes * 2`

(b) `filmes + ["Glória Feita de Sangue", "Tempos Modernos"]`

(c) `["Guerra nas Estrelas", "O Terceiro Homem"] + filmes`

(d) `filmes[:2]`

(e) `filmes[::-1]`

(f) `filmes + []`

(g) `filmes + "erro"`

In [8]:
filmes = ["...E o Vento Levou",
         "Interestelar",
         "E.T.",
         "A Felicidade Não se Compra",
         "Rain Man",
         "Rambo"]

### $ 1.2 $ Modificando listas

Em contraste com strings, listas são objetos __mutáveis__, significando que seus elementos individuais podem ser modificados por atribuições.

__Exercício:__ Seja _filmes_ a lista na próxima célula de código. Qual é o valor de _filmes_ após cada uma das declarações abaixo ser executada em sequência pelo interpretador?

(a) `filmes[1] = "Forrest Gump"`

(b) `filmes[2:4] = ["Tempos Modernos", "Glória Feita de Sangue"]`

(c) `filmes[-1] = "Ladrões de Bicicleta"`

(d) `filmes += ["A Vida dos Outros"]`

In [9]:
filmes = ["...E o Vento Levou",
         "Interestelar",
         "E.T.",
         "A Felicidade Não se Compra",
         "Rain Man",
         "Rambo"]

⚠️ Para _modificar_ o elemento no índice $ k $ de uma lista, a lista deve ter itens associados a cada índice entre $ 0 $ e $ k - 1 $. Tentar acessar de qualquer forma o $ k $-ésimo elemento de uma lista de comprimento $ \le k $ gera um `IndexError`.

__Exemplo:__

In [10]:
# Uma lista longa pode ser dividida em várias linhas para melhor legibilidade:
planetas = [
    "Terra",
    "Marte",
    "Júpiter",
    "Saturno",
    "Netuno"
]
planetas[5] = "Kepler-452b"

IndexError: list assignment index out of range

### $ 1.3 $ Alguns métodos de lista

Listas suportam vários métodos úteis (lembre-se que um __método__ é uma função associada a uma classe ou tipo específico). Aqui estão exemplos de como alguns deles são usados.

__Exemplos:__ Talvez o método de lista mais frequentemente usado seja `append`, que pode ser usado para adicionar um elemento ao final de uma lista:

In [11]:
frutas = ["🍑", "🥝", "🍉", "🥥", "🍋", "🍐"]

frutas.append("🍎")     # Anexa uma maçã ao final da lista
print(frutas)

['🍑', '🥝', '🍉', '🥥', '🍋', '🍐', '🍎']


Mais genericamente, podemos usar `insert` para inserir um elemento em uma posição específica:

In [12]:
frutas.insert(1, "🫐")     # Insere mirtilos como a fruta no índice 1
print(frutas)

['🍑', '🫐', '🥝', '🍉', '🥥', '🍋', '🍐', '🍎']


O método `index` retorna o índice da primeira ocorrência de um elemento em uma lista. Se não houver tal elemento, ele produz um `ValueError`.

In [13]:
print(frutas.index('🥥'))

4


In [14]:
frutas.index('🏫')

ValueError: '🏫' is not in list

Com `remove` podemos remover (no local) a _primeira ocorrência_ de um elemento de uma lista. Novamente, tentar remover um elemento que não está atualmente na lista gera um `ValueError`.

In [15]:
frutas.remove('🍋')
print(frutas)

['🍑', '🫐', '🥝', '🍉', '🥥', '🍐', '🍎']


Talvez o método de lista mais útil seja `sort`, que eficientemente ordena a lista dada no local. Similarmente, `reverse` faz o que seu nome sugere:

In [16]:
frutas.sort()            # Ordena a lista
print(frutas)

frutas.reverse()         # Inverte a ordem dos elementos na lista
print(frutas)

['🍉', '🍎', '🍐', '🍑', '🥝', '🥥', '🫐']
['🫐', '🥥', '🥝', '🍑', '🍐', '🍎', '🍉']


O último método que consideraremos é `pop`, que é essencialmente o inverso de `append`: quando chamado sem argumentos, ele remove o último item da lista e o retorna como saída.

In [17]:
print(frutas)

a = frutas.pop()        # Use 'pop' sem argumentos para remover o
print(frutas)           # último item e retorná-lo como saída

b = frutas.pop(2)       # Remove o elemento com índice 2
print(frutas)           # e retorna-o como saída

print(a, b)

['🫐', '🥥', '🥝', '🍑', '🍐', '🍎', '🍉']
['🫐', '🥥', '🥝', '🍑', '🍐', '🍎']
['🫐', '🥥', '🍑', '🍐', '🍎']
🍉 🥝


__Exercício:__ Seja _planetas_ a lista fornecida na célula de código abaixo, representando os planetas do nosso sistema solar. Descreva a lista e a saída após cada uma das seguintes declarações ser executada em sequência pelo interpretador.

(a) `planetas.insert(1, "Vulcano")`

(b) `planetas = planetas + ["Plutão"]`

(c) `planetas.remove("Vulcano")`

(d) `planetas.sort(reverse=True)`

(e) `planetas.index("Marte")`

(f) `planetas.append("Planeta X")`

(g) `planetas.pop(2)`

(h) `planetas.reverse()`

In [None]:
planetas = ["Mercúrio", "Vênus", "Terra", "Marte", "Júpiter", "Saturno", "Urano", "Netuno"]

__Exercício:__ O que é `[] * 3`? O que é `[[]] * 3`? O que é `[[]] * (-1)`?

## $ \S 2 $ Tuplas

### $ 2.1 $ O tipo `tuple`

Outro tipo de dado sequencial é `tuple`, o tipo das __tuplas__. Como uma lista, uma tupla consiste em uma sequência ordenada de objetos de tipos possivelmente distintos, separados por vírgulas. Também como para listas, os tipos dos elementos contidos em uma tupla são completamente arbitrários e a formação de tuplas goza da propriedade de fechamento, permitindo-nos criar tuplas de tuplas, etc.

Tuplas são delimitadas por _parênteses_ `()` em vez de colchetes. A razão de ser das tuplas é que elas são __imutáveis__, de modo que, como strings mas diferentemente de listas, seus elementos individuais _não podem_ ser modificados. Tentar fazê-lo gerará um `TypeError`.

__Exemplo:__

In [None]:
t = (8, 'Ana', 23.49, [1, 2, 3])
print(t, type(t))

📝 Na verdade, os parênteses delimitadores não são estritamente necessários para definir uma tupla. Em vez disso, é a presença de vírgulas `,` que faz uma sequência de valores ser uma tupla. No entanto, geralmente é uma boa ideia incluí-los como delimitadores para clareza, especialmente em expressões mais complexas.

In [None]:
numeros = 1, 2, 3  # <--- Isto é uma tupla!
print(numeros, type(numeros))

unico = 1,  # <--- Isto também é uma tupla! A vírgula é necessária para distingui-la do número 1
print(unico, type(unico))

In [None]:
tupla_vazia1 = ()       # Esta é a tupla vazia
tupla_vazia2 = tuple()  # Outra maneira de instanciar a tupla vazia

print(tupla_vazia1, type(tupla_vazia1))
print(tupla_vazia1 == tupla_vazia2)

In [None]:
# A linha seguinte resultará em um erro de sintaxe, em vez da tupla vazia:
nao_e_tupla = ,  # A vírgula por si só não define uma tupla. Parênteses são necessários aqui.

### $ 2.2 $ Operações em tuplas

Como para os outros tipos sequenciais que consideramos (strings e listas), tuplas podem ser concatenadas com `+`, seus comprimentos podem ser calculados usando `len`, e podemos acessar seus elementos e fatiá-los usando `[]` e `[:]`.

__Exercício:__ A tupla na célula de código abaixo registra alguns dados sobre um cientista famoso. Descreva a saída e o efeito das seguintes declarações:

(a) `registro[0]`

(b) `registro[2]`

(c) `registro[-1]`

(d) `registro[:]`

(e) `len(registro)`

(f) `registro + registro`

(g) `registro *= 2`

(h) `registro[4] = 'Estados Unidos'`

(i) `print(registro[0], registro[1])`

In [None]:
registro = ('Albert', 'Einstein', 'físico', 26, 'Alemanha')

Para converter uma tupla em uma lista, use `list` como uma função. Similarmente, para converter uma lista em uma tupla, aplique `tuple` a ela.

__Exemplo:__

In [None]:
cientista = ('Marie', 'Curie', 'química', 32, 'Polônia')
dados = list(cientista)
print(dados, type(dados))

### $ 2.3 $ Alguns avisos

⚠️ Para definir uma tupla consistindo de um único item, uma vírgula ainda deve ser usada, para que a tupla possa ser diferenciada de uma expressão entre parênteses:

In [None]:
idioma = ('Sindarin', )         # Para definir uma tupla não vazia, devemos incluir uma vírgula!
print(idioma, type(idioma))

ling = ('Sindarin')               # Isto não é uma tupla, mas sim uma string;
print(ling, type(ling))           # os parênteses não têm papel neste caso.

<div class="alert alert-warning"> Mesmo se $ x $ e $ y $ são duas tuplas ou listas de mesmo comprimento e cujos itens são do mesmo tipo numérico, <code>x + y</code> _não_ é obtido somando seus respectivos elementos; é, em vez disso, a _concatenação_ de $ x $ e $ y $. Similarmente, se $ a $ é um escalar, então <code>a * x</code> não é o resultado obtido multiplicando cada item de $ x $ por $ a $, mesmo se $ a $ é um inteiro. </div>

⚠️ Nem listas nem tuplas são estruturas de dados adequadas para representar _vetores_ no sentido da álgebra linear. O tipo mais adequado para esta tarefa é um `ndarray` (abreviação de _array $n$-dimensional_), fornecido pelo módulo [__NumPy__](https://scipy.github.io/old-wiki/pages/Numpy_Example_List.html), que consideraremos mais tarde.

## $ \S 3 $ Outros tipos de dados iteráveis comuns

Embora não os discutiremos em detalhe, Python também fornece alguns outros tipos de dados iteráveis além de strings, listas e tuplas. Os dois mais importantes e úteis são __conjuntos__ (tipo: `set`), que se comportam muito como conjuntos na matemática, e __dicionários__ (tipo: `dict`), que consistem em pares chave-valor e são também chamados de _tabelas hash_ ou _arrays associativos_ em outras linguagens de programação. Tanto conjuntos quanto dicionários são _mutáveis_, isto é, seus conteúdos podem ser modificados.

### $ 3.1 $ Conjuntos

Para criar um conjunto, podemos listar seus elementos separados por vírgulas e entre chaves `{ }`.

__Exemplo:__

In [18]:
um_dois_tres = {1, 2, 3}
print(um_dois_tres, type(um_dois_tres))

{1, 2, 3} <class 'set'>


In [19]:
# Em conjuntos, repetições não importam. Portanto, um_dois_tres == conjunto_2 se
conjunto_2 = {1, 2, 2, 3, 3, 3, 3, 3}
print(um_dois_tres == conjunto_2)

True


In [20]:
# Similarmente, em conjuntos a ordem em que os elementos são listados é irrelevante:
conjunto_3 = {3, 2, 1}
print(um_dois_tres == conjunto_3)

True


Aqui estão os principais métodos associados a conjuntos, com `a` e `b` denotando conjuntos arbitrários:

| Sintaxe do método         | Sintaxe equivalente | Descrição                                                         |
|-------------------------:|:-------------------:|:------------------------------------------------------------------|
| `conjunto.add(elem)`      |        N/A         | adiciona um elemento ao conjunto.                                  |
| `conjunto.remove(elem)`   |        N/A         | remove um elemento do conjunto.                                    |
| `conjunto.discard(elem)`  |        N/A         | remove um elemento do conjunto se ele for um membro.               |
| `conjunto.pop()`         |        N/A         | remove e retorna um elemento arbitrário do conjunto.               |
| `a.isdisjoint(b)`       |        N/A         | retorna `True` se `a` não tem elementos em comum com `b`.          |
| `a.issubset(b)`         |      `a <= b`      | retorna `True` se todos os elementos de `a` estão em `b`.          |
| `a.issuperset(b)`       |      `a >= b`      | retorna `True` se todos os elementos de `b` estão em `a`.          |
| `a.union(b)`            |      `a \| b`       | retorna um novo conjunto com elementos que estão em `a` ou em `b`.  |
| `a.intersection(b)`     |      `a & b`       | retorna um novo conjunto com elementos comuns a `a` e `b`.          |
| `a.difference(b)`       |      `a - b`       | retorna um novo conjunto com elementos em `a` que não estão em `b`. |
| `a.symmetric_difference(b)` |    `a ^ b`     | retorna um novo conjunto com elementos em `a` ou em `b`, mas não em ambos. |

__Exercício:__ Seja $ A = \{1, 2, 3, 4, 5\} $ e $ B = \{-3, -1, 1, 3, 5, 7\} $. Usando Python, calcule:
* A união $ A\cup B $;
* A interseção $ A \cap B $;
* As diferenças $ A \smallsetminus B $ e $ B \smallsetminus A $;
* A diferença simétrica $ A \,{\Delta}\, B = \big(A \smallsetminus B\big) \cup \big(B \smallsetminus A\big) $;
* O número de elementos em cada conjunto (usando a função `len`).

### $ 3.2 $ Dicionários

Dicionários permitem criar um objeto iterável cujos valores não precisam ser referenciados pelos inteiros $ 0,\,1,\,2,\, \dots $, como é o caso para listas e tuplas. Em vez disso, pode-se usar __chaves__ de qualquer tipo imutável como índices. Isso permite uma manipulação de dados mais flexível e intuitiva. Note, entretanto, que dicionários e conjuntos usam mais memória do que listas ou tuplas.

__Exemplo:__ Para criar um dicionário, listamos pares chave-valor na forma `<chave>: <valor>` dentro de chaves e separados por vírgulas. Os valores podem ser de qualquer tipo, enquanto as chaves podem ser de qualquer tipo _imutável_. Aqui está um exemplo:

In [21]:
info = {"nome": "Bilbo Baggins",
        "idade": 23,
        "raça": "Hobbit",
        "altura": 110.3,
        "email": "bilbo@hobbitmail.com",
        "amigos": ["Frodo", "Pippin"]}

print(info)
print(type(info))

{'nome': 'Bilbo Baggins', 'idade': 23, 'raça': 'Hobbit', 'altura': 110.3, 'email': 'bilbo@hobbitmail.com', 'amigos': ['Frodo', 'Pippin']}
<class 'dict'>


Podemos acessar os valores armazenados em um dicionário referindo-se à chave correspondente dentro de colchetes:

In [22]:
print(info["nome"])
print(info["amigos"])

Bilbo Baggins
['Frodo', 'Pippin']


## ⚡ $ \S 4 $ Objetos mutáveis e imutáveis

Se listas e tuplas são tão similares, pode não estar claro por que Python fornece ambos os tipos de dados. De fato, tecnicamente poderíamos sempre nos virar usando apenas um deles. No entanto, a versatilidade tem algumas vantagens.

Em alguns casos, um objeto no mundo real pode ser mais adequadamente concebido como tendo uma identidade que é completamente determinada por suas partes. Por exemplo, pensamos em um número racional como $ 2 / 3 $ como um par de inteiros (seu numerador e denominador); se mudarmos o denominador para $ 5 $, o resultado é uma fração diferente.

Em outros casos, entretanto, é melhor pensar na identidade de um objeto como sendo algo distinto da mera totalidade de suas peças. Por exemplo, é mais adequado pensar na conta bancária de alguém como sendo o mesmo objeto de um dia para o outro, mesmo que o endereço do cliente, saldo ou até mesmo seu nome legal possam ter mudado nesse meio tempo.

Até que ponto um objeto mantém sua identidade após ser modificado? Esta é uma questão filosófica difícil que _a priori_ não tem nada a ver com programação, embora afete muito como podemos escolher representar um dado objeto em Python.

### $ 4.1 $ Definições e exemplos

Um objeto em Python é chamado __mutável__ se seu estado ou conteúdo pode ser alterado após ser criado; caso contrário, é chamado __imutável__.
* Strings, inteiros, números de ponto flutuante e tuplas são todos _imutáveis_.
* Exemplos de objetos _mutáveis_ incluem listas, dicionários e conjuntos.

🚫 Como uma tupla é _imutável_, uma tentativa de modificar um ou mais de seus elementos por uma atribuição resulta em um `TypeError`:

In [None]:
coordenadas = (1.2, 5.6)
coordenadas[0] = 3.4

In [None]:
# Uma lista é um objeto mutável:
uma_lista = [1, 2, 3]

# Portanto, modificar um elemento da lista é permitido:
uma_lista[0] = 47
print(uma_lista)    # Saída: [47, 2, 3]

### $ 4.2 $ Entendendo atribuições de objetos mutáveis e imutáveis

Quando vinculamos uma variável a um objeto, à primeira vista o comportamento da atribuição pode parecer diferente dependendo se o objeto é mutável ou imutável. Para dissipar qualquer confusão, é útil pensar na atribuição em termos de __ponteiros__ ou __referências__ a objetos. Quando um objeto é atribuído a uma variável, esta variável não se torna _identificada_ com o objeto; em vez disso, é apenas um _ponteiro_ para a localização de memória que armazena o objeto. Portanto, se reatribuirmos outro objeto ao identificador `x`, esta variável agora se referirá a uma nova localização de memória contendo o novo objeto:

In [None]:
x = 12         # x aponta para a localização de memória contendo o inteiro 12.
y = x          # y aponta para a mesma localização de memória que x
print(x, y)
# Apesar do uso do sinal de igual, y não é igual a x. Eles
# são dois identificadores distintos que atualmente _referem-se_ ao mesmo objeto.

x = 34         # x agora aponta para uma _nova_ localização de memória, contendo o inteiro 34.
print(x, y)    # Entretanto, y ainda aponta para a localização de memória contendo 12.

Neste caso, as declarações de atribuição criam duas referências ao objeto imutável `12`, e a reatribuição de `x` muda seu ponto de referência para um novo objeto, `34`. A mesma descrição também vale quando os objetos envolvidos são mutáveis:

In [None]:
x = [1, 2]     # x aponta para a localização contendo uma lista contendo 1 e 2.
y = x          # y refere-se à mesma localização de memória (objeto lista) que x.
print(x, y)

x = [3, 4]     # x agora aponta para uma _nova_ localização de memória contendo outra lista.
print(x, y)    # Entretanto, y ainda aponta para a localização de memória original.

Finalmente, considere o seguinte exemplo:

In [None]:
x = [1, 2]
y = x
print(x, y)

x[0] = 34      # O objeto lista naquela localização é _modificado_ para [34, 2].
print(x, y)    # Tanto x quanto y ainda apontam para o mesmo objeto.

Usando nosso modelo mental, o último resultado não deveria ser uma surpresa. Novamente, `x` não deve ser pensado como _coincidindo_ com o objeto ao qual foi atribuído (a lista `[1, 2]`); em vez disso, é apenas uma _referência_ a ele. Se modificarmos o próprio objeto através de `x` como na quinta linha, sua localização na memória não muda. Portanto, quando acessamos esse objeto novamente através da referência `y`, a modificação será mostrada, como esperado.

📝 Para criar uma cópia independente de uma string ou lista, podemos usar uma fatia completa do objeto.

__Exemplo:__

In [None]:
x = [0, 1, 2]
y = x[:]         # y aponta para uma cópia independente, armazenada em outro endereço de memória.

x.pop()
print(x)
print(y)        # Note que y não foi afetado pela modificação de x.

A imutabilidade de uma tupla significa que uma vez que uma tupla é criada, a própria tupla não pode ser alterada. Isso inclui adicionar/remover elementos e mudar a identidade de qualquer elemento dentro da tupla. Entretanto, se uma tupla contém objetos mutáveis (como listas), o _estado_ desses objetos mutáveis pode ser alterado, mesmo que a própria tupla não possa ser modificada diretamente. Considere o seguinte exemplo:

In [None]:
minha_tupla = (1, 2, [30, 40])
minha_tupla[2].append(50)  # Anexa 50 à lista [30, 40]
# Isso é permitido porque estamos modificando a lista mutável, não a própria tupla.
print(minha_tupla)

In [None]:
# Tentar mudar (a identidade de) um elemento diretamente
# através de atribuição, entretanto, resulta em um erro:
minha_tupla[2] = [30, 40, 50]