<a href="https://colab.research.google.com/github/DeepFluxion/Curso-python-ecogen/blob/main/notebooks/Aula_2_Colecoes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Python Básico
---
#### Baseado em [QuantEcon DataScience - Colections](https://datascience.quantecon.org/python_fundamentals/collections.html) por Chase Coleman, Spencer Lyon, and Jesse Perla

#### Traduzido e adaptado por Domingos Napolitano
---

# Coleções
### Pré-requisitos
Tipos de dados principais

# O que veremos nesta aula

## Coleções Ordenadas
- Saiba o que é uma lista e uma tupla
- Saiba como diferenciar uma lista de uma tupla
- Entenda as funções range, zip e enumerate
- Ser capaz de usar métodos de lista comuns, como anexar, classificar e inverter

## Coleções associativas
- Entenda o que é um dicionários
- Conheça a distinção entre `keys` e `values` de `dicts`
- Entenda quando os dicionários são úteis
- Estar familiarizado com os métodos `dict` comuns

## Sets (opcional)

- Saiba o que é um set
- Entenda como um conjunto difere de uma lista e uma tupla
- Saiba quando usar um conjunto versus uma lista ou uma tupla

# Coleções Ordenadas
Listas
Uma lista Python é uma coleção ordenada de itens.

Podemos criar listas usando a seguinte sintaxe
```python
[item1, item2,..., itemN]
```
onde o ... representa qualquer número de itens adicionais.

Cada item pode ser de qualquer tipo.

Vamos criar algumas listas.

In [None]:
# criado, mas não atribuído a uma variável
[2.0, 9.1, 12.5]

In [None]:
# armazenado como a variável `x`
x = [2.0, 9.1, 12.5]
print("x has type", type(x))
x

# O que podemos fazer com listas?
Podemos acessar itens em uma lista chamada `minha_lista` usando `minha_lista[N]` onde N é um número inteiro.

Nota: Sempre que usamos a sintaxe `x[i]` estamos fazendo o que é chamado de indexação – significa que estamos selecionando um determinado elemento de uma coleção `x`.

In [None]:
x[1]

Espere? Por que `x[1]` retornou `9.1` quando o primeiro elemento em x é realmente `2.0`?

Isso aconteceu porque o Python começa a contar em **zero**!

Vamos repetir mais uma vez para enfatizar que o Python começa a contar do zero!

Para acessar o primeiro elemento de `x` devemos usar `x[0]`:

In [None]:
x[0]

Também podemos determinar quantos itens estão em uma lista usando a função `len`.

In [None]:
len(x)

O que acontece se tentarmos indexar com um número maior que o número de itens em uma lista?

In [None]:
# descomente a linha abaixo e execute
# x[4]

Podemos verificar se uma lista contém um elemento usando a palavra-chave `in`.

In [None]:
x

In [None]:
2.0 in x

In [None]:
1.5 in x

Para nossa lista `x`, outras operações comuns que podemos querer fazer são…

In [None]:
print(x)
x.reverse()
print(x)
x.reverse()
print(x)

In [None]:
number_list = [10, 25, 42, 1.0]
print(number_list)
number_list.sort()
print(number_list)

Note que para `sort`, nós tínhamos que ter todos os elementos em nossa lista como números (`int` e `float`), mais sobre isso abaixo.

Na verdade, poderíamos fazer o mesmo com uma lista de strings. Nesse caso, sort colocará os itens em ordem alfabética.

In [None]:
str_list = ["NY", "AZ", "TX"]
print(str_list)
str_list.sort()
print(str_list)

O método `append` adiciona um elemento ao final da lista existente.

In [None]:
num_list = [10, 25, 42, 8]
print(num_list)
num_list.append(10)
print(num_list)

No entanto, se você chamar `append` com uma lista, ele adicionará uma lista ao final, em vez dos números dessa lista.

In [None]:
num_list = [10, 25, 42, 8]
print(num_list)
num_list.append([20, 4])
print(num_list)

Em vez disso, para combinar as listas…

In [None]:
num_list = [10, 25, 42, 8]
print(num_list)
num_list.extend([20, 4])
print(num_list)

## Exercício

Veja o exercício 1 na lista de [exercícios](#exercicio1).
<a id="exercicio1_call"></a>

# Listas de tipos diferentes
Embora a maioria dos exemplos acima tenha usado uma lista com um único tipo de variável, isso não é necessário.

Vamos fazer uma pequena alteração com cuidado no primeiro exemplo: substitua `2.0` por `2`

In [None]:
x = [2, 9.1, 12.5]

In [None]:
# armazenado como a varíavel `x`
x = [2, "hello", 3.0]
print("x tem o tipo", type(x))
x

Para ver os tipos de elementos individuais na lista:

In [None]:
print(f"type(x[0]) = {type(x[0])}, type(x[1]) = {type(x[1])}, type(x[2]) = {type(x[2])}")

Embora nenhuma limitação de programação impeça isso, você deve ter cuidado ao escrever código com diferentes tipos numéricos e não numéricos na mesma lista.

Por exemplo, se os tipos na lista não puderem ser comparados, como você classificaria os elementos da lista? (ou seja, como você determina se a string “hello” é menor que o inteiro 2, “hello” < 2?)

In [None]:
x = [2, "hello", 3.0]
# descomente a linha abaixo e vja o que acontece!
# x.sort()

Algumas exceções importantes a esta regra geral são:

Listas com números inteiros e pontos flutuantes são menos propensas a erros (já que o código matemático que usa a lista funcionaria com ambos os tipos).

Ao trabalhar com listas e dados, talvez você queira representar os valores ausentes com um tipo diferente dos valores existentes.

# A função `range`
Uma função que você verá frequentemente em Python é a função `range`.

Possui três versões:

* `range(N)`: vai de 0 a N-1
* `range(a, N)`: vai de a a N-1
* `range(a, N, d)`: vai de a a N-1, contando` por d`

Quando chamamos a função `range`, retornamos algo que tem o tipo `range`:

In [None]:
r = range(5)
print("type(r)", type(r))

Para transformar o `range` em uma lista:

In [None]:
list(r)

## Exercício

Veja o exercício 2 na lista de [exercícios](#exercicio2).
<a id="exercicio2_call"></a>

# O que são Tuplas?
As tuplas são muito semelhantes às listas e contêm coleções ordenadas de itens.    
No entanto, tuplas e listas têm três diferenças principais:
1. As tuplas são criadas usando parênteses — `(` e `)` — em vez de colchetes — `[` e `]`.
2. As tuplas são imutáveis, que é uma palavra chique da ciência da computação que significa que elas não podem ser alteradas ou alteradas depois de criadas.
3. Tuplas e múltiplos valores de retorno de funções estão fortemente conectados, como veremos em funções mais a frente.

In [None]:
t = (1, "hello", 3.0)
print("t is a", type(t))
t

Podemos converter uma lista em uma tupla chamando a função `tuple` em uma lista.

In [None]:
print("x é uma", type(x))
print("tuple(x) é uma", type(tuple(x)))
tuple(x)

Também podemos converter uma tupla em uma lista usando a função `list`.

In [None]:
list(t)

Assim como em uma lista, acessamos itens em uma tupla `t` usando `t[N]` onde `N` é um `int`.

In [None]:
t[0]  # ainda começa a contar em 0

In [None]:
t[2]

## Exercício

Veja o exercício 3 na lista de [exercícios](#exercicio3).
<a id="exercicio3_call"></a>

Tuplas (e listas) podem ser desempacotadas diretamente em variáveis.

In [None]:
x, y = (1, "test")
print(f"x = {x}, y = {y}")

Essa será uma maneira conveniente de trabalhar com funções que retornam vários valores, bem como com compreensões (comprehensions) e loops, que veremos na próxima aula.

# Lista vs Tupla: Qual Usar?
Você deve usar uma lista ou tupla?

Isso depende do que você está armazenando, se pode ser necessário reordenar os elementos ou se adicionar novos elementos sem uma reinterpretação completa dos dados subjacentes.

Por exemplo, pegue os dados que representam o PIB (em trilhões) e a população (em bilhões) da China em 2015.

In [None]:
china_data_2015 = ("China", 2015, 11.06, 1.371)

print(china_data_2015)

Neste caso, usamos uma tupla porque: (a) a ordenação não faria sentido; e (b) adicionar mais dados exigiria uma reinterpretação de toda a estrutura de dados.

Por outro lado, considere uma lista do PIB da China entre 2013 e 2015.

In [None]:
gdp_data = [9.607, 10.48, 11.06]
print(gdp_data)

Neste caso, usamos uma lista, pois adicionar um novo elemento ao final da lista para o PIB de 2016 faria todo o sentido.

Nesse sentido, coletar dados sobre a China em anos diferentes pode fazer sentido como uma lista de tuplas (por exemplo, ano, PIB e população – embora veremos maneiras melhores de armazenar esse tipo de dados na seção Pandas).

In [None]:
china_data = [(2015, 11.06, 1.371), (2014, 10.48, 1.364), (2013, 9.607, 1.357)]
print(china_data)

Em geral, uma regra prática é usar uma lista, a menos que você precise usar uma tupla.

Os principais critérios para uso de tupla são quando você deseja:
* certifique-se de que a ordem dos elementos não pode mudar
* certifique-se de que os valores reais dos elementos não possam mudar
* use a coleção como uma chave em um dict (aprenderemos o que isso significa em breve)

# `zip` e `enumerate`
Duas funções que podem ser extremamente úteis são `zip` e `enumerate`.

Ambas as funções são melhor compreendidas por exemplo, então vamos vê-las em ação e depois falar sobre o que elas fazem.

In [None]:
gdp_data = [9.607, 10.48, 11.06]
years = [2013, 2014, 2015]
z = zip(years, gdp_data)
print("type(z)", type(z))

Para ver o que está dentro de `z`, vamos convertê-lo em uma lista.

In [None]:
list(z)

* Observe que agora temos uma lista onde cada item é uma tupla.
* Dentro de cada tupla, temos um item de cada uma das coleções que passamos para a função `zip`.
* Em particular, o primeiro item em `z` contém o primeiro item de `[2013, 2014, 2015]` e o primeiro item de `[9.607, 10.48, 11.06]`.* O segundo item em `z` contém o segundo item de cada coleção e assim por diante.
* Podemos acessar um elemento neste e então desempacotar a tupla resultante diretamente em variáveis.

In [None]:
l = list(zip(years, gdp_data))
x, y = l[0]
print(f"ano = {x}, PIB = {y}")

In [None]:
l = list(zip(years, gdp_data))
x, y = l[1]
print(f"ano = {x}, PIB = {y}")

In [None]:
l = list(zip(years, gdp_data))
x, y = l[2]
print(f"ano = {x}, PIB = {y}")

Agora vamos experimentar com `enumerate`.

In [None]:
e = enumerate(["a", "b", "c"])
print("type(e)", type(e))
e

Novamente, chamamos `list(e)` para ver o que está dentro.

In [None]:
list(e)

Novamente temos uma lista de tuplas, mas desta vez, o primeiro elemento em cada tupla é o índice do segundo elemento da tupla na coleção inicial.

Observe que o terceiro item é `(2, 'c')` porque `["a", "b", "c"][2]` é `'c'`

## Exercício

Veja o exercício 4 na lista de [exercícios](#exercicio4).
<a id="exercicio4_call"></a>

Uma peculiaridade importante de alguns tipos iteráveis que não são listas (como o `zip` acima) é que você não pode converter o mesmo tipo em uma lista duas vezes.

Isso ocorre porque `zip`, `enumerate` e `range` produzem o que é chamado de **gerador**.

Um gerador produzirá apenas cada um de seus elementos uma única vez, portanto, se você chamar a `list` no mesmo gerador uma segunda vez, ele não terá mais nenhum elemento para iterar.

Para obter mais informações, consulte a [documentação do Python](https://docs.python.org/3/howto/functional.html#generators).

In [None]:
gdp_data = [9.607, 10.48, 11.06]
years = [2013, 2014, 2015]
z = zip(years, gdp_data)
l = list(z)
print(l)
m = list(z)
print(m)

O que aconteceu ?

# Coleções Associativas

## Dicionários
Um dicionário (ou `dict`) associa `keys` (keys) com `values` (valores).

Será semelhante a um dicionário de palavras, onde as chaves são palavras e os valores são as definições associadas.

A maneira mais comum de criar um dict é usar chaves — `{` e `}` — assim:
```python
{"key1": value1, "key2": value2, ..., "keyN": valueN}
```

onde o `...` indica que podemos ter qualquer número de termos adicionais.

A parte crucial da sintaxe é que cada par chave-valor é escrito `key: value` e que esses pares são separados por vírgulas — `,`.

Vejamos um exemplo usando nossos dados agregados sobre a China em 2015.

In [None]:
china_data = {"pais": "China", "ano": 2015, "PIB" : 11.06, "população": 1.371}
print(china_data)

Ao contrário do nosso exemplo acima usando uma `tuple`, um `dict` nos permite associar um nome a cada campo, ao invés de ter que lembrar a ordem dentro da tupla.

Freqüentemente, o código que faz um `dict` é mais fácil de ler se colocarmos cada par `key: value` em sua própria linha. (Lembre-se de nosso comentário anterior sobre o uso eficaz de espaços em branco para melhorar a legibilidade!)

O código abaixo é equivalente ao que vimos acima.

In [None]:
china_data = {
    "pais": "China",
    "ano": 2015,
    "PIB" : 11.06,
    "população": 1.371
}
print(china_data)

Na maioria das vezes, as chaves (por exemplo, `“pais”`, `“ano”`, `“PIB”` e `“população”`) serão strings, mas também podemos usar números (`int` ou `float`) ou mesmo tuplas (ou, raramente, uma combinação de tipos).

Os valores podem ser de qualquer tipo e diferentes entre si.

## Exercício

Veja o exercício 5 na lista de [exercícios](#exercicio5).
<a id="exercicio5_call"></a>

Este próximo exemplo pretende enfatizar como os valores podem ser qualquer coisa – incluindo outro dicionário.

In [None]:
companies = {"AAPL": {"bid": 175.96, "ask": 175.98},
             "GE": {"bid": 1047.03, "ask": 1048.40},
             "TVIX": {"bid": 8.38, "ask": 8.40}}
print(companies)

Observe isto:

In [None]:
print(companies[0])

O que aconteceu ? Veja isto?

In [None]:
print(companies["AAPL"])

In [None]:
print(companies["AAPL"]['bid'])
print(companies["AAPL"]['ask'])

É aqui que 'dict' é diferente de `list`acompanhe com muita atenção este próximo tópico

# Obtendo, configurando e atualizando itens de `dict`, (Getting, Setting, and Updating)
Agora podemos pedir ao Python que nos diga o valor de uma chave específica usando a sintaxe `d[k]`, onde d é nosso `dict` e `k` é a chave para a qual queremos encontrar o valor.

Por exemplo,

In [None]:
china_data

In [None]:
print(china_data["ano"])
print(f"pais = {china_data['pais']}, população = {china_data['população']}")

Nota: quando dentro de uma string de formatação, você pode usar `'` em vez de `"` como acima para garantir que a formatação ainda funcione com o código incorporado.

Se pedirmos o valor de uma chave que não está no `dict`, obteremos um erro.

In [None]:
# descomente a linha abaixo para ver o erro
china_data["inflação"]

Também podemos adicionar novos itens a um dict usando a sintaxe `d[new_key] = new_value`.

Vejamos alguns exemplos.

In [None]:
print(china_data)
china_data["desemprego"] = "4.05%"
print(china_data)

Para atualizar o valor, usamos a atribuição da mesma forma (que criará a chave e o valor conforme necessário).

In [None]:
print(china_data)
china_data["desemprego"] = "4.051%"
print(china_data)

Ou podemos mudar o tipo.

In [None]:
china_data["desemprego"] = 4.051
print(china_data)

## Exercício

Veja o exercício 6 na lista de [exercícios](#exercicio6).
<a id="exercicio6_call"></a>

# Funcionalidades comuns em `dict`
Podemos fazer algumas tarefas comuns com `dicts`.

Vamos demonstrá-los com exemplos abaixo.

In [None]:
# Vamos criar novamente o dict china_data
china_data = {
    "pais": "China",
    "ano": 2015,
    "PIB" : 11.06,
    "população": 1.371
}
print(china_data)
china_data["desemprego"] = 4.051
print(china_data)

In [None]:
# número de pares chave-valor em um dict
len(china_data)

In [None]:
# obter uma lista de todas as chaves
list(china_data.keys())

In [None]:
# obter uma lista de todas os valores
list(china_data.values())

In [None]:
more_china_data = {"terra_irrigada": 690_070, "principais_religioes": {"budista": 18.2, "cristao" : 5.1, "mulcumano": 1.8}}

# Adicione todos os pares chave-valor em more_china_data a china_data.
# se a chave já aparecer no china_data, substitua o
# value com o valor em more_china_data
china_data.update(more_china_data)
china_data

In [None]:
# Obtém o valor associado a uma chave ou retorna um valor padrão
# use isso para evitar o NameError que vimos acima se você tiver um
# valor padrão
china_data.get("terra_irrigada", "Data Not Available")

In [None]:
china_data.get("taxa_mortalidade", "Data Not Available")

## Exercício

Veja o exercício 7 na lista de [exercícios](#exercicio7).
<a id="exercicio7_call"></a>

## Exercício

Veja o exercício 8 na lista de [exercícios](#exercicio8).
<a id="exercicio8_call"></a>

# Sets - Conjuntos (opcional)
Python tem uma maneira adicional de representar coleções de itens: sets - conjuntos.
* Conjuntos surgem com pouca frequência, mas você deve estar ciente deles.
* Se você estiver familiarizado com o conceito matemático de [conjuntos](https://pt.wikipedia.org/wiki/Conjunto), já entenderá a maioria dos conjuntos Python.
* Se você não conhece a matemática por trás dos conjuntos, não se preocupe: abordaremos o básico dos conjuntos do Python aqui.

> Um conjunto é uma coleção não ordenada de elementos únicos.

A sintaxe para criar um conjunto usa chaves `{` e `}`.
```python
{item1, item2, ..., itemN}
```

Aqui está um exemplo.

In [None]:
s = {1, "hello", 3.0}
print("s has type", type(s))
s

## Exercício

Veja o exercício 9 na lista de [exercícios](#exercicio9).
<a id="exercicio9_call"></a>

Assim como nas listas e tuplas, podemos verificar se algo está no conjunto e verificar o comprimento do conjunto:

In [None]:
print("len(s) =", len(s))
"hello" in s

Ao contrário de listas e tuplas, não podemos extrair elementos de um conjunto `s` usando `s[N]` onde `N` é um número `int`.

In [None]:
# Descomente a linha abaixo para ver o que acontece
s[1]

Isso ocorre porque os conjuntos não são ordenados, então a noção de obter o segundo elemento (s[1]) não está bem definida.

Adicionamos elementos a um conjunto `s` usando `s.add`.

In [None]:
s.add(100)
s

In [None]:
s.add("hello") # nada acontece, por que?
s

Também podemos fazer operações definidas.
Considere o conjunto `s` acima e o conjunto `s2 = {"hello", "world"}`.

* `s.union(s2)`: retorna um conjunto com todos os elementos em `s` ou `s2`
* `s.intersection(s2)`: retorna um conjunto com todos os elementos em `s` e `s2`
*`s.difference(s2)`: retorna um conjunto com todos os elementos em s que não estão em `s2`
* `s.symmetric_difference(s2)`: retorna um conjunto com todos os elementos em apenas um dos `s` e `s2`

## Exercício

Veja o exercício 10 na lista de [exercícios](#exercicio10).
<a id="exercicio10_call"></a>

# Exercícios
---



<a id="exercicio1"></a>

# Exercício 1

Crie duas listas `y` e `z`

Na primeira célula, tente `y.append(z)`.

Na segunda célula, tente `y.extend(z)`.

Explique o comportamento.

In [None]:
y = ["a", "b", "c"]
z = [1, 2, 3]
# seu codigo aqui
y.append(z)
print(y)

In [None]:
y = ["a", "b", "c"]
z = [1, 2, 3]
# seu codigo aqui
y.extend(z)
print(y)

[retorne ao texto](#exercicio1_call)

<a id="exercicio2"></a>

# Exercício 2

Experimente as outras duas versões da função `range`.

In [None]:
# tente list(range(a, N)) -- você define `a` e `N`
list(range(10,20))

In [None]:
# tente list(range(a, N, d)) -- você define `a`, `N`, e `d`

[retorne ao texto](#exercicio2_call)

<a id="exercicio3"></a>

# Exercício 3

Verifique se as tuplas são realmente imutáveis ​​tentando o seguinte:

* Alterando o primeiro elemento de `t` para ser `100`
* Adicionando um novo elemento `"!!"` ao final de `t` (lembre-se que com uma lista `x` usaríamos `x.append("!!")` para fazer isso
* Ordenando `t` (`sort`)
* Invertendo `t`(`reverter`)

In [None]:
# altere o primeiro elemento de t

In [None]:
# anexando a t

In [None]:
# ordenando t

In [None]:
# revertendo t
t.reverse()
t

[retorne ao texto](#exercicio3_call)

<a id="exercicio4"></a>

# Exercício 4

**Desafiador** Para a tupla `foo` abaixo, use uma combinação de `zip`, `range` e `len` para imitar `enumerate(foo)`.

Verifique se a solução proposta está correta convertendo cada uma em uma lista e verificando a igualdade com `==`.

## Dica
Você pode ver como a resposta deve ficar começando com `list(enumerate(foo))`.

In [None]:
foo = ("good", "luck!")

In [None]:
# saida desejada
result = list(enumerate(foo))
result

In [None]:
# crie sua solução aqui
foo
numbers = list(range(len(foo)))
list(zip(numbers,foo))# == enumerate(foo)

In [None]:
# teste sua solução aqui
list(zip(numbers,foo)) == result

[retorne ao texto](#exercicio4_call)

<a id="exercicio5"></a>

# Exercício 5

Crie um novo `dict` que associe os tickers de ações com o preço de suas ações.

Aqui estão alguns 'tickers' e um 'price' (preço).

* AAPL: 175,96
* GOOGL: 1047.43
* TVIX: 8,38

In [None]:
# Crie e exiba o diconário aqui

[retorne ao texto](#exercicio5_call)

<a id="exercicio6"></a>

# Exercício 6

Consulte o World [Factbook for Australia](https://www.cia.gov/the-world-factbook/countries/australia) e crie um dicionário com dados contendo os seguintes tipos: `float`, `string`, ` int`, `list` e `dict`. Escolha os dados que desejar.

Para confirmar, você deve ter um dicionário que você identificou por meio de uma chave.

In [None]:
# seu código aqui

[retorne ao texto](#exercicio6_call)

<a id="exercicio7"></a>

# Exercício 7

Use as facilidades de ajuda do Jupyter para aprender como usar o método pop para remover a chave "desemprego" (e seu valor) do `dict china_data`.

In [None]:
china_data

In [None]:
# dica use uma destas opções, descomente a correta
dict.pop?
#list.pop?

In [None]:
# seu código aqui
china_data.pop('desemprego')
china_data

In [None]:
# depois execute esta linha
china_data['desemprego']= 4.051
china_data

[retorne ao texto](#exercicio7_call)

<a id="exercicio8"></a>

# Exercício 8

Explique o que acontece com o valor que você usou `pop`.

Experimente chamar `pop` duas vezes.

In [None]:
# seu código aqui

[retorne ao texto](#exercicio8_call)

<a id="exercicio9"></a>

# Exercício 9

Tente criar um `set` com elementos repetidos (por exemplo, `{1, 2, 1, 2, 1, 2}`).

O que acontece?

Por que?

In [None]:
# seu código aqui
w = {1, 2, 1, 2, 1, 2}
w

[retorne ao texto](#exercicio9_call)

<a id="exercicio10"></a>

# Exercício 10

Teste duas das operações descritas acima usando o conjunto original que criamos, `s`, e o `set` criado abaixo de `s2`.

In [None]:
s2 = {"hello", "world"}
s

In [None]:
# seu código aqui
#print(s.union(s2))
print(s)
print(s.symmetric_difference(s2))

[retorne ao texto](#exercicio10_call)