# Aula III - Iteráveis
## Algumas `estruturas de dados` inerentes ao Python
- Lists (recap)
- Tuples
- Dicts
- Sets

## Lists
- Listas são sequências **ordenadas** de elementos

- Listas são **mutáveis**

In [None]:
list_ex = [10, 20, 30]
print(list_ex)

In [None]:
print(list_ex[0])
print(list_ex[1])
print(list_ex[2])

Listas são mutáveis, ou seja, os seus elementos, acessandos através de um indice, podem ser alterados.

In [None]:
list_ex[0] = 'Zero'
print(list_ex)
print(list_ex[0])
print(list_ex[1])
print(list_ex[2])

### Métodos
Além de substituir elementos existentes através de indices, podemos utilizar os **métodos** `append` e `extend` para incluir **novos elementos** em uma lista:

- `append` adiciona elementos ao final de uma lista
- `extend` adiciona elementos ao final de uma lista a partir de outra lista (ou outro iterável)

In [None]:
list_ex.append(40)
print(list_ex)

In [None]:
list_ex.extend([50, 60, 60])
print(list_ex)

O método `extend` não é *desempacota* listas.

In [None]:
minha_extensao = [70, [80, 90]]
list_ex.extend(minha_extensao)
print(list_ex)

Além dos métodos `extend` e `append` podemos excluir elementos de uma lista através dos métodos `pop` e `remove`

In [None]:
ultimo_elemento = list_ex.pop()
print(ultimo_elemento)
print(list_ex)

In [None]:
primeiro_elemento = list_ex.pop(0)
print(primeiro_elemento)
print(list_ex)

In [None]:
list_ex.remove(30)
print(list_ex)

In [None]:
list_ex.remove(60)
print(list_ex)

### Slices

Além de usar `int`s como indices podemos acessar elementos de uma lista através de `slices` através da notação `[:]`.

A sintaxe de um *slice* é `[indice_comeco:indice_fim]`

* `a[start:stop]` -> todos os items de start até stop-1
* `a[start:]` -> todos os items de start até o fim de a
* `a[:stop]` -> todos os items do começo da lista até stop-1
* `a[:]` -> uma cópia da lista inteira

In [None]:
print(list_ex[:])

In [None]:
print(list_ex[2:4])

In [None]:
print(list_ex[:4])

In [None]:
print(list_ex[1:])

Também podemos utilizar índices negativos: desta forma estaremos *contando* de trás pra frente na lista, de forma que `[-1]` é o último elemento da lista, `[-2]` o penúltimo, etc...

In [None]:
list_ex[-1]

In [None]:
list_ex[-3:-1]

### Revisatando o desafio da última aula
Podemos utilizar os métodos `pop`, `extend` e `append` para resolver de uma forma mais *elegante* o problema de achatamento de listas.

In [None]:
# Um jeito mais bonito de achatar listas
list_ex = [1, [2, [3, [4]]]]
print(list_ex)

chata = []
while list_ex:
    elemento = list_ex.pop()
    if type(elemento) == list:
        list_ex.extend(elemento)
    else:
        chata.append(elemento)

print(chata)

## Tuples
- Tuplas são sequências ordenandas de elementos (como listas)

- Tuplas são **imútaveis**

### Criando uma tupla

In [None]:
tupla = (10,)
type(tupla)

In [None]:
tuple_ex = (10, 20, 30)
print(tuple_ex)

Podemos utilizar a atribuição múltipla para desempacotar tuplas (e listas):

In [None]:
a, b, c = tuple_ex
print(a)
print(b)
print(c)

Também podemos converter uma lista em uma tupla e vice-versa:

In [None]:
minha_lista = [10, 20, 30]
minha_upla = tuple(minha_lista)
print(minha_lista)
print(minha_upla)
print(type(minha_upla))

In [None]:
tuple_ex = tuple([10, 20, 30])
print(type(tuple_ex))

Assim como as listas, podemos percorrer uma tupla através de um loop:

In [None]:
minha_tupla = (0, 1, 2, 3, 4, 5)
for i in minha_tupla:
    print(i)

## Métodos de Tuplas

- `count`: conta o # de vezes que um valor ocorre na tupla
- `index`: retorna o indice da primeira ocorrência de um valor

In [None]:
y = (1, 3, 7, 4, 6, 3, 8, 8, 'Pedro')
y.count(8)

In [None]:
y.index(8)

Esses métodos também existem em listas:

In [None]:
y_list = list(y)

In [None]:
y_list

In [None]:
y.index(8)

## Funções nativas - `sorted()`, `range()` e `len()`

- `sorted()`: Ordenar uma tupla (ou qualquer **iterável**)
- `range()`: cria um iterável a partir de dois inteiros

In [None]:
y = (1, 3, 7, 4, 6, 3, 8, 8)

In [None]:
print(sorted(y, reverse=True))

A função sorted não modifica a lista (ou tupla) original - se quisermos guardar o resultado precisamos utilizar uma variável.

In [None]:
y

In [None]:
meu_range = range(10)
print(meu_range)

A função `range()` cria um iterável *preguiçoso* (`lazy`): se quisermos ver todos os seus elementos precisamos percorre-lo por um loop ou converte-lo em uma lista.

In [None]:
for i in range(10):
    print(i)

In [None]:
list(meu_range)

A função `len()` retorna o comprimento de um iterável (o seu número de elementos):

In [None]:
len([1, 2, 3])

In [None]:
len(meu_range)

# DICT's
## O que é um dicionário?

Na vida real, um livro que tem palavras e o sentido dessa palavra. No Python dicionários são pares de **chaves** e **valores**.

### O que são chaves e valores?

chaves, ou `keys`: são as palavras

valores, ou `values`: são os sentidos.

## Criando um Dicionário

- Sintáxe `{key: value}`

In [None]:
my_dict={}

In [None]:
my_dict=dict()

In [None]:
type(my_dict)

In [None]:
my_dict = {
            'Grão de Bico': 10,
            'Feijão': 8,
            'Lentilha': 1
          }
print(my_dict)

Podemos adicionar novas chaves ao dicionário utilizando a notação de indice:

In [None]:
my_dict['Soja'] = 9
print(my_dict)

Cada `key` deve ser única em um dicionário - se tentarmos inserir diferentes `values` para uma mesma `key`.

In [None]:
my_dict = {
            'Grão de Bico': 10,
            'Grão de Bico': 8,
            'Grão de Bico': 1
          }
my_dict['Grão de Bico'] = 9
print(my_dict)

Podemos utilizar esse mecânismo para atualizar os valores em um dicionário:

In [None]:
my_dict = {
            'Grão de Bico': 10,
            'Feijão': 8,
            'Lentilha': 1
          }

In [None]:
my_dict['Grão de Bico'] = 15
print(my_dict)

Também podemos guardar e utilizar os valores de um dicionário em variáveis:

In [None]:
preco_10kg_gb = my_dict['Grão de Bico']*10
print(preco_10kg_gb)

## Métodos de Dicionários

Embora um dicionário não seja diretamente iterável, podemos acessar os iteráveis que compõe um dicionário através de três métodos:

- `.values` nos permite acessar os valores em um dicionário.

- `.keys` nos permite acessar as chaves de um dicionário.

- `.items` nos permite acessar os pares `key:value` como duplas `(key, value)`

In [None]:
my_dict.values()

In [None]:
my_dict.keys()

In [None]:
my_dict.items()

In [None]:
print(my_dict)

In [None]:
my_dict['Lentilha'] = 15
print(my_dict)

## Adicionando items ao dicionário

Podemos criar novos itens utilizando a indexação, cuidando para que a `key` especificada não seja parte do dicionário.

In [None]:
my_dict['Ervilha Partida'] = 9

In [None]:
my_dict.keys()

In [None]:
my_dict

Também podemos adicionar/atualizar chaves e valores em um dicionário a partir de outros dicionários:

In [None]:
# using `.update()` function containing a new dict inside
new_dict = dict()
new_dict['Lentilha'] = 5
new_dict['Arroz Integral'] = 8.5
print(new_dict)

Para tanto utilizaremos o método `.update`

In [None]:
my_dict.update(new_dict)
print(my_dict)

In [None]:
print(my_dict)

Além disso podemos utilizar outros iteráveis para criar dicionários:

In [None]:
graos = ['Feijão Branco', 'Lentilha Síria', 'Feijão Branco']
valores = [9.50, 13, 8.50]

In [None]:
for i in range(len(graos)):
    print(graos[i], valores[i])
    my_dict[graos[i]] = valores[i]

In [None]:
print(my_dict)

Também podemos utilizar uma lista de duplas para criar ou atualizar um dicionário:

In [None]:
novos_precos = [('Lentilha Verde', 9), ('Abobrinha', 3), ('Beringela', 8)]

Ao invés de indexar as tuplas dentro da lista, utilizaremos o desempacotamento dentro do loop:

In [None]:
for produto, preco in novos_precos:
    my_dict[produto] = preco
print(my_dict)

## Um valor pode ser qualquer coisa (até outros dicionários!)

Vamos construir um exemplo mais complexo de um dicionário com múltiplos tipos de valores.

In [None]:
casa = dict()
casa['id'] = 1
casa['tamanho'] = 80
casa['dim_terreno'] = (20, 30)
casa['endereco'] = dict()
casa['endereco']['rua'] = 'Al. das Maritacas'
casa['endereco']['numero'] = 1637
casa['endereco']['bairro'] = 'Cidade Jardim'
casa['endereco']['cep'] = 39272440
print(casa)

In [None]:
print(type(casa))
print(type(casa['dim_terreno']))
print(type(casa['endereco']))

In [None]:
print(casa['endereco']['rua'])

## Um exemplo real
Vamos analisar um exemplo comumente encontrado em análise de dados: extração de dados de uma API. Para este exemplo usaremos a API do Ambee (https://www.getambee.com/) para extrair dados de qualidade do ar em três cidades (São Paulo, Belo Horizonte e a pujante métropole de Pirassununga). Veremos formas de entender o que uma API retorna utilizando os métodos de dicionários

In [3]:
import requests
TOKEN = '4a22655cd1da7765d31813e29eee29709ad9be4aa572e9a673d54226dd94ab6f'
url = "https://api.ambeedata.com/latest/by-city"
headers = {
    'x-api-key': TOKEN,
    'Content-type': "application/json"
    }

In [4]:
querystring = {"city":"Sao Paulo"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_sp = response.json()

In [5]:
querystring = {"city":"Belo Horizonte"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_bh = response.json()

In [6]:
querystring = {"city":"Pirassununga"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_pira = response.json()

In [7]:
print(ql_ar_sp)

{'message': 'success', 'stations': [{'CO': 0.709, 'NO2': 7.994, 'OZONE': 26.411, 'PM10': 61.681, 'PM25': 43.146, 'SO2': 3.978, 'city': None, 'countryCode': 'BR', 'division': None, 'lat': -23.627, 'lng': -46.635, 'placeName': 'São Paulo', 'postalCode': '01000-000', 'state': 'Sao Paulo', 'updatedAt': '2023-01-14T10:00:00.000Z', 'aqiInfo': {'pollutant': 'PM2.5', 'concentration': 43.146, 'category': 'Unhealthy for Sensitive Groups'}, 'AQI': 120}]}


## Iterando por um dicionário

Ao contrário de listas e tuplas, dicionários não podem ser iterados diretamente. Para tanto precisamos usar os métodos `.keys()`, `.items()` ou `.items()`

In [None]:
for chave in casa:
    print(chave)

In [None]:
for chave in casa.keys():
    print(f'{chave}: {casa[chave]}')

In [None]:
for atributo in casa.items():
    print(atributo)

In [None]:
for valor in casa.values():
    print(valor)

## Percorrendo os itens de um dicionário

Podemos utilizar o desempacotamento de valores para converter o resultado do método `.items()` e variáveis distintas dentro de um loop:

In [None]:
my_dict = {
            'Grão de Bico': 10,
            'Feijão': 8,
            'Lentilha': 1
          }

In [None]:
print(my_dict.items())

In [None]:
for grao, preco in my_dict.items():
    if grao == 'Feijão' or grao == 'Lentilha':
        print(preco)

## O Operador `in`

In [None]:
1 in [1, 2, 3]

In [None]:
8 in my_dict.values()

este operador funciona em qualquer iterável:

In [None]:
'abcd' in 'abc'

In [None]:
'abc' in 'abcd'

In [None]:
1 in (1, 2, 3)

# Conjuntos (`sets`)

Os conjuntos são como dicionários - no entanto contém apenas chaves. Isso significa que um conjunto só pode ter elementos únicos.

In [None]:
my_list = ['Pedro', 'Adriano', 'Pedro', 'Adriano', 'Pedro', 'Adriano']

In [None]:
my_list

In [None]:
set(my_list)

Se precisamos encontrar o número de elementos únicos em uma lista, podemos converte-la em um conjunto:

In [None]:
list_x = [1,2,3,4,4,4,4,4,5,6,6,6,7,7,8]
set_x = set(list_x)
print(f'Tamanho da lista: {len(list_x)}, tamanho do set: {len(set_x)}')

## Métodos de `sets`

- `.intersection()` retorna os elementos em comum em 2 conjuntos;
- `.difference()` retorna os elementos do conjunto que não são comuns à outro conjunto;
- `.union()` retorna a combinação dos elementos de 2 conjuntos;


In [None]:
x = {1, 2, 3, 4, 5, 6, 7, 8}

In [None]:
y = {6, 7, 8, 9, 10, 11, 12}

In [None]:
x.intersection(y)

In [None]:
y.intersection(x)

In [None]:
x.difference(y)

In [None]:
y.difference(x)

In [None]:
x-y # x.difference(y)

In [None]:
y-x # y.difference(y)

In [None]:
x.union(y)

In [None]:
(x-y).union(y-x)

In [None]:
x.symmetric_difference(y)

In [None]:
x = set([1,2,3])

In [None]:
set([1,2,3, 25]).issubset(x)

In [None]:
# Exemplo prático
col_names = set(['qtd_cartoes', 'vlr_cartao','qtd_cheques','vlr_cheques'])

incoming_col_names = set(['qtd_cartoes', 'vlr_cartao','qtd_cheques','vlr_cheques'])

missing_columns = col_names.difference(incoming_col_names)
print(f'Missing columns: {missing_columns}')

In [None]:
print(f'Missing columns: {set(col_names) - set(incoming_col_names)}')

In [None]:
my_dict.values()