# Aula III - Iteráveis
## Algumas `estruturas de dados` inerentes ao Python
- Lists (recap)
- Tuples
- Dicts
- Sets

## Lists
- Listas são sequências **ordenadas** de elementos

- Listas são **mutáveis**

In [1]:
list_ex = [10, 20, 30]
print(list_ex)

[10, 20, 30]


In [2]:
print(list_ex[0])
print(list_ex[1])
print(list_ex[2])

10
20
30


Listas são mutáveis, ou seja, os seus elementos, acessandos através de um indice, podem ser alterados.

In [3]:
list_ex[0] = 'Zero'
print(list_ex)
print(list_ex[0])
print(list_ex[1])
print(list_ex[2])

['Zero', 20, 30]
Zero
20
30


### Métodos
Além de substituir elementos existentes através de indices, podemos utilizar os **métodos** `append` e `extend` para incluir **novos elementos** em uma lista:

- `append` adiciona elementos ao final de uma lista
- `extend` adiciona elementos ao final de uma lista a partir de outra lista (ou outro iterável)

In [4]:
list_ex.append(40)
print(list_ex)

['Zero', 20, 30, 40]


In [5]:
list_ex.extend([50, 60, 60])
print(list_ex)

['Zero', 20, 30, 40, 50, 60, 60]


O método `extend` não é *desempacota* listas.

In [6]:
minha_extensao = [70, [80, 90]]
list_ex.extend(minha_extensao)
print(list_ex)

['Zero', 20, 30, 40, 50, 60, 60, 70, [80, 90]]


Além dos métodos `extend` e `append` podemos excluir elementos de uma lista através dos métodos `pop` e `remove`

In [7]:
ultimo_elemento = list_ex.pop()
print(ultimo_elemento)
print(list_ex)

[80, 90]
['Zero', 20, 30, 40, 50, 60, 60, 70]


In [8]:
primeiro_elemento = list_ex.pop(0)
print(primeiro_elemento)
print(list_ex)

Zero
[20, 30, 40, 50, 60, 60, 70]


In [9]:
list_ex.remove(30)
print(list_ex)

[20, 40, 50, 60, 60, 70]


In [10]:
list_ex.remove(60)
print(list_ex)

[20, 40, 50, 60, 70]


### Slices

Além de usar `int`s como indices podemos acessar elementos de uma lista através de `slices` através da notação `[:]`.

A sintaxe de um *slice* é `[indice_comeco:indice_fim]`

* `a[start:stop]` -> todos os items de start até stop-1
* `a[start:]` -> todos os items de start até o fim de a
* `a[:stop]` -> todos os items do começo da lista até stop-1
* `a[:]` -> uma cópia da lista inteira

In [11]:
print(list_ex[:])

[20, 40, 50, 60, 70]


In [12]:
print(list_ex[2:4])

[50, 60]


In [13]:
print(list_ex[:4])

[20, 40, 50, 60]


In [14]:
print(list_ex[1:])

[40, 50, 60, 70]


Também podemos utilizar índices negativos: desta forma estaremos *contando* de trás pra frente na lista, de forma que `[-1]` é o último elemento da lista, `[-2]` o penúltimo, etc...

In [17]:
list_ex[-1]

70

In [18]:
list_ex[-3:-1]

[50, 60]

### Revisatando o desafio da última aula
Podemos utilizar os métodos `pop`, `extend` e `append` para resolver de uma forma mais *elegante* o problema de achatamento de listas.

In [19]:
# Um jeito mais bonito de achatar listas
list_ex = [1, [2, [3, [4]]]]
print(list_ex)

chata = []
while list_ex:
    elemento = list_ex.pop()
    if type(elemento) == list:
        list_ex.extend(elemento)
    else:
        chata.append(elemento)

print(chata)

[1, [2, [3, [4]]]]
[4, 3, 2, 1]


## Tuples
- Tuplas são sequências ordenandas de elementos (como listas)

- Tuplas são **imútaveis**

### Criando uma tupla

In [20]:
tupla = (10,)
type(tupla)

tuple

In [21]:
tuple_ex = (10, 20, 30)
print(tuple_ex)

(10, 20, 30)


Podemos utilizar a atribuição múltipla para desempacotar tuplas (e listas):

In [22]:
a, b, c = tuple_ex
print(a)
print(b)
print(c)

10
20
30


Também podemos converter uma lista em uma tupla e vice-versa:

In [23]:
minha_lista = [10, 20, 30]
minha_upla = tuple(minha_lista)
print(minha_lista)
print(minha_upla)
print(type(minha_upla))

[10, 20, 30]
(10, 20, 30)
<class 'tuple'>


In [24]:
tuple_ex = tuple([10, 20, 30])
print(type(tuple_ex))

<class 'tuple'>


Assim como as listas, podemos percorrer uma tupla através de um loop:

In [25]:
minha_tupla = (0, 1, 2, 3, 4, 5)
for i in minha_tupla:
    print(i)

0
1
2
3
4
5


## Métodos de Tuplas

- `count`: conta o # de vezes que um valor ocorre na tupla
- `index`: retorna o indice da primeira ocorrência de um valor

In [26]:
y = (1, 3, 7, 4, 6, 3, 8, 8, 'Pedro')
y.count(8)

2

In [27]:
y.index(8)

6

Esses métodos também existem em listas:

In [28]:
y_list = list(y)

In [29]:
y_list

[1, 3, 7, 4, 6, 3, 8, 8, 'Pedro']

In [30]:
y.index(8)

6

## Funções nativas - `sorted()`, `range()` e `len()`

- `sorted()`: Ordenar uma tupla (ou qualquer **iterável**)
- `range()`: cria um iterável a partir de dois inteiros

In [31]:
y = (1, 3, 7, 4, 6, 3, 8, 8)

In [32]:
print(sorted(y, reverse=True))

[8, 8, 7, 6, 4, 3, 3, 1]


A função sorted não modifica a lista (ou tupla) original - se quisermos guardar o resultado precisamos utilizar uma variável.

In [33]:
y

(1, 3, 7, 4, 6, 3, 8, 8)

In [34]:
meu_range = range(10)
print(meu_range)

range(0, 10)


A função `range()` cria um iterável *preguiçoso* (`lazy`): se quisermos ver todos os seus elementos precisamos percorre-lo por um loop ou converte-lo em uma lista.

In [35]:
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [36]:
list(meu_range)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

A função `len()` retorna o comprimento de um iterável (o seu número de elementos):

In [38]:
len([1, 2, 3])

3

In [39]:
len(meu_range)

10

# DICT's
## O que é um dicionário?

Na vida real, um livro que tem palavras e o sentido dessa palavra. No Python dicionários são pares de **chaves** e **valores**.

### O que são chaves e valores?

chaves, ou `keys`: são as palavras

valores, ou `values`: são os sentidos.

## Criando um Dicionário

- Sintáxe `{key: value}`

In [40]:
my_dict={}

In [41]:
my_dict=dict()

In [42]:
type(my_dict)

dict

In [43]:
my_dict = {
            'Grão de Bico': 10,
            'Feijão': 8,
            'Lentilha': 1
          }
print(my_dict)

{'Grão de Bico': 10, 'Feijão': 8, 'Lentilha': 1}


Podemos adicionar novas chaves ao dicionário utilizando a notação de indice:

In [44]:
my_dict['Soja'] = 9
print(my_dict)

{'Grão de Bico': 10, 'Feijão': 8, 'Lentilha': 1, 'Soja': 9}


Cada `key` deve ser única em um dicionário - se tentarmos inserir diferentes `values` para uma mesma `key`.

In [45]:
my_dict = {
            'Grão de Bico': 10,
            'Grão de Bico': 8,
            'Grão de Bico': 1
          }
my_dict['Grão de Bico'] = 9
print(my_dict)

{'Grão de Bico': 9}


Podemos utilizar esse mecânismo para atualizar os valores em um dicionário:

In [46]:
my_dict = {
            'Grão de Bico': 10,
            'Feijão': 8,
            'Lentilha': 1
          }

In [47]:
my_dict['Grão de Bico'] = 15
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 1}


Também podemos guardar e utilizar os valores de um dicionário em variáveis:

In [48]:
preco_10kg_gb = my_dict['Grão de Bico']*10
print(preco_10kg_gb)

150


## Métodos de Dicionários

Embora um dicionário não seja diretamente iterável, podemos acessar os iteráveis que compõe um dicionário através de três métodos:

- `.values` nos permite acessar os valores em um dicionário.

- `.keys` nos permite acessar as chaves de um dicionário.

- `.items` nos permite acessar os pares `key:value` como duplas `(key, value)`

In [49]:
my_dict.values()

dict_values([15, 8, 1])

In [50]:
my_dict.keys()

dict_keys(['Grão de Bico', 'Feijão', 'Lentilha'])

In [51]:
my_dict.items()

dict_items([('Grão de Bico', 15), ('Feijão', 8), ('Lentilha', 1)])

In [52]:
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 1}


In [53]:
my_dict['Lentilha'] = 15
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 15}


## Adicionando items ao dicionário

Podemos criar novos itens utilizando a indexação, cuidando para que a `key` especificada não seja parte do dicionário.

In [54]:
my_dict['Ervilha Partida'] = 9

In [55]:
my_dict.keys()

dict_keys(['Grão de Bico', 'Feijão', 'Lentilha', 'Ervilha Partida'])

In [56]:
my_dict

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 15, 'Ervilha Partida': 9}

Também podemos adicionar/atualizar chaves e valores em um dicionário a partir de outros dicionários:

In [57]:
# using `.update()` function containing a new dict inside
new_dict = dict()
new_dict['Lentilha'] = 5
new_dict['Arroz Integral'] = 8.5
print(new_dict)

{'Lentilha': 5, 'Arroz Integral': 8.5}


Para tanto utilizaremos o método `.update`

In [60]:
my_dict.update(new_dict)
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 5, 'Ervilha Partida': 9, 'Arroz Integral': 8.5}


In [61]:
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 5, 'Ervilha Partida': 9, 'Arroz Integral': 8.5}


Além disso podemos utilizar outros iteráveis para criar dicionários:

In [62]:
graos = ['Feijão Branco', 'Lentilha Síria', 'Feijão Branco']
valores = [9.50, 13, 8.50]

In [63]:
for i in range(len(graos)):
    print(graos[i], valores[i])
    my_dict[graos[i]] = valores[i]

Feijão Branco 9.5
Lentilha Síria 13
Feijão Branco 8.5


In [64]:
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 5, 'Ervilha Partida': 9, 'Arroz Integral': 8.5, 'Feijão Branco': 8.5, 'Lentilha Síria': 13}


Também podemos utilizar uma lista de duplas para criar ou atualizar um dicionário:

In [65]:
novos_precos = [('Lentilha Verde', 9), ('Abobrinha', 3), ('Beringela', 8)]

Ao invés de indexar as tuplas dentro da lista, utilizaremos o desempacotamento dentro do loop:

In [66]:
for produto, preco in novos_precos:
    my_dict[produto] = preco
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 5, 'Ervilha Partida': 9, 'Arroz Integral': 8.5, 'Feijão Branco': 8.5, 'Lentilha Síria': 13, 'Lentilha Verde': 9, 'Abobrinha': 3, 'Beringela': 8}


## Um valor pode ser qualquer coisa (até outros dicionários!)

Vamos construir um exemplo mais complexo de um dicionário com múltiplos tipos de valores.

In [67]:
casa = dict()
casa['id'] = 1
casa['tamanho'] = 80
casa['dim_terreno'] = (20, 30)
casa['endereco'] = dict()
casa['endereco']['rua'] = 'Al. das Maritacas'
casa['endereco']['numero'] = 1637
casa['endereco']['bairro'] = 'Cidade Jardim'
casa['endereco']['cep'] = 39272440
print(casa)

{'id': 1, 'tamanho': 80, 'dim_terreno': (20, 30), 'endereco': {'rua': 'Al. das Maritacas', 'numero': 1637, 'bairro': 'Cidade Jardim', 'cep': 39272440}}


In [68]:
print(type(casa))
print(type(casa['dim_terreno']))
print(type(casa['endereco']))

<class 'dict'>
<class 'tuple'>
<class 'dict'>


In [69]:
print(casa['endereco']['rua'])

Al. das Maritacas


## Um exemplo real
Vamos analisar um exemplo comumente encontrado em análise de dados: extração de dados de uma API. Para este exemplo usaremos a API do Ambee (https://www.getambee.com/) para extrair dados de qualidade do ar em três cidades (São Paulo, Belo Horizonte e a pujante métropole de Pirassununga). Veremos formas de entender o que uma API retorna utilizando os métodos de dicionários

In [5]:
import requests
TOKEN = 'c0c9147ec699d5205de0cbb2f5ad611c9aae0b41edeaf6092728677d06356836'
url = "https://api.ambeedata.com/latest/by-city"
headers = {
    'x-api-key': TOKEN,
    'Content-type': "application/json"
    }

In [6]:
querystring = {"city":"Sao Paulo"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_sp = response.json()

In [185]:
querystring = {"city":"Belo Horizonte"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_bh = response.json()

In [186]:
querystring = {"city":"Pirassununga"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_pira = response.json()

In [187]:
print(ql_ar_sp)

{'message': 'success', 'stations': [{'_id': '60363be18f2bb86af9398a6c', 'placeId': '13991eba7f6caaaf0830f7574f0fa70052de3b51d28ba8264782466ffd78851f', 'CO': 1, 'NO2': 0.022, 'OZONE': 18.5, 'PM10': 39.808, 'PM25': 23.88, 'SO2': 10.966, 'city': None, 'countryCode': 'BR', 'division': None, 'lat': -23.627, 'lng': -46.635, 'placeName': 'São Paulo', 'postalCode': '01000-000', 'state': 'Sao Paulo', 'updatedAt': '2021-11-07 23:00:00', 'AQI': 76, 'aqiInfo': {'pollutant': 'PM2.5', 'concentration': 23.88, 'category': 'Moderate'}}]}


## Iterando por um dicionário

Ao contrário de listas e tuplas, dicionários não podem ser iterados diretamente. Para tanto precisamos usar os métodos `.keys()`, `.items()` ou `.items()`

In [None]:
for chave in casa:
    print(chave)

In [None]:
for chave in casa.keys():
    print(f'{chave}: {casa[chave]}')

In [None]:
for atributo in casa.items():
    print(atributo)

In [None]:
for valor in casa.values():
    print(valor)

## Percorrendo os itens de um dicionário

Podemos utilizar o desempacotamento de valores para converter o resultado do método `.items()` e variáveis distintas dentro de um loop:

In [213]:
my_dict = {
            'Grão de Bico': 10,
            'Feijão': 8,
            'Lentilha': 1
          }

In [215]:
print(my_dict.items())

dict_items([('Grão de Bico', 10), ('Feijão', 8), ('Lentilha', 1)])


In [217]:
for grao, preco in my_dict.items():
    if grao == 'Feijão' or grao == 'Lentilha':
        print(preco)

Grão de Bico
10
Feijão
8
8
Lentilha
1
1


## O Operador `in`

In [220]:
1 in [1, 2, 3]

{'Grão de Bico': 10, 'Feijão': 8, 'Lentilha': 1}


In [222]:
8 in my_dict.values()

True

este operador funciona em qualquer iterável:

In [223]:
'abcd' in 'abc'

False

In [224]:
'abc' in 'abcd'

True

In [225]:
1 in (1, 2, 3)

True

# Conjuntos (`sets`)

Os conjuntos são como dicionários - no entanto contém apenas chaves. Isso significa que um conjunto só pode ter elementos únicos.

In [28]:
my_list = ['Pedro', 'Adriano', 'Pedro', 'Adriano', 'Pedro', 'Adriano']

In [29]:
my_list

['Pedro', 'Adriano', 'Pedro', 'Adriano', 'Pedro', 'Adriano']

In [30]:
set(my_list)

{'Adriano', 'Pedro'}

Se precisamos encontrar o número de elementos únicos em uma lista, podemos converte-la em um conjunto:

In [33]:
list_x = [1,2,3,4,4,4,4,4,5,6,6,6,7,7,8]
set_x = set(list_x)
print(f'Tamanho da lista: {len(list_x)}, tamanho do set: {len(set_x)}')

Tamanho da lista: 15, tamanho do set: 8


## Métodos de `sets`

- `.intersection()` retorna os elementos em comum em 2 conjuntos;
- `.difference()` retorna os elementos do conjunto que não são comuns à outro conjunto;
- `.union()` retorna a combinação dos elementos de 2 conjuntos;


In [35]:
x = {1, 2, 3, 4, 5, 6, 7, 8}

In [36]:
y = {6, 7, 8, 9, 10, 11, 12}

In [234]:
x.intersection(y)

{6, 7, 8}

In [235]:
y.intersection(x)

{6, 7, 8}

In [236]:
x.difference(y)

{1, 2, 3, 4, 5}

In [237]:
y.difference(x)

{10, 12}

In [238]:
x-y # x.difference(y)

{1, 2, 3, 4, 5}

In [239]:
y-x # y.difference(y)

{10, 12}

In [240]:
x.union(y)

{1, 2, 3, 4, 5, 6, 7, 8, 10, 12}

In [242]:
(x-y).union(y-x)

{1, 2, 3, 4, 5, 10, 12}

In [243]:
x.symmetric_difference(y)

{1, 2, 3, 4, 5, 10, 12}

In [271]:
x = set([1,2,3])

In [268]:
set([1,2,3, 25]).issubset(x)

bool

In [277]:
# Practical example
col_names = set(['qtd_cartoes', 'vlr_cartao','qtd_cheques','vlr_cheques'])

incoming_col_names = set(['qtd_cartoes', 'vlr_cartao','qtd_cheques','vlr_cheques'])

# print(f'Missing columns: {set(col_names) - set(incoming_col_names)}')
missing_columns = col_names.difference(incoming_col_names)
print(f'Missing columns: {missing_columns}')

Missing columns: set()


In [289]:
my_dict.values()

dict_values([10, 8, 1])