# Aula III - Iteráveis
## Algumas `estruturas de dados` inerentes ao Python
- Lists (recap)
- Tuples
- Dicts
- Sets

## Lists
- Listas são sequências **ordenadas** de elementos

- Listas são **mutáveis**

In [1]:
list_ex = [10, 20, 30]
print(list_ex)

[10, 20, 30]


In [2]:
print(list_ex[0])
print(list_ex[1])
print(list_ex[2])

10
20
30


Listas são mutáveis, ou seja, os seus elementos, acessandos através de um indice, podem ser alterados.

In [3]:
list_ex[0]

10

In [4]:
list_ex[0] = 'Zero'
print(list_ex)
print(list_ex[0])
print(list_ex[1])
print(list_ex[2])

['Zero', 20, 30]
Zero
20
30


### Métodos
Além de substituir elementos existentes através de indices, podemos utilizar os **métodos** `append` e `extend` para incluir **novos elementos** em uma lista:

- `append` adiciona elementos ao final de uma lista
- `extend` adiciona elementos ao final de uma lista a partir de outra lista (ou outro iterável)

In [5]:
print('ola')

ola


In [6]:
list_ex.append(40)
print(list_ex)

['Zero', 20, 30, 40]


In [7]:
print(list_ex)

['Zero', 20, 30, 40]


In [8]:
[1, 2, 3] + [4, 5]

[1, 2, 3, 4, 5]

In [9]:
list_ex.extend([50, 60, 60])
print(list_ex)

['Zero', 20, 30, 40, 50, 60, 60]


O método `extend` não é *desempacota* listas.

In [10]:
minha_extensao = [70, [80, 90]]
list_ex.extend(minha_extensao)
print(list_ex)

['Zero', 20, 30, 40, 50, 60, 60, 70, [80, 90]]


Além dos métodos `extend` e `append` podemos excluir elementos de uma lista através dos métodos `pop` e `remove`

In [11]:
ultimo_elemento = list_ex.pop()
print(ultimo_elemento)
print(list_ex)

[80, 90]
['Zero', 20, 30, 40, 50, 60, 60, 70]


In [12]:
list_ex.pop()

70

In [13]:
list_ex

['Zero', 20, 30, 40, 50, 60, 60]

In [14]:
primeiro_elemento = list_ex.pop(0)
print(primeiro_elemento)
print(list_ex)

Zero
[20, 30, 40, 50, 60, 60]


In [15]:
list_ex.remove(30)
print(list_ex)

[20, 40, 50, 60, 60]


In [18]:
list_ex.remove(60)
print(list_ex)

ValueError: list.remove(x): x not in list

In [19]:
print(list_ex)

[20, 40, 50]


In [20]:
n = 40
list_ex.remove(n)

In [23]:
list_ex.extend([60, 70, 80, 90, 20, 10, 10])

### Slices

Além de usar `int`s como indices podemos acessar elementos de uma lista através de `slices` através da notação `[:]`.

A sintaxe de um *slice* é `[indice_comeco:indice_fim]`

* `a[start:stop]` -> todos os items de start até stop-1
* `a[start:]` -> todos os items de start até o fim de a
* `a[:stop]` -> todos os items do começo da lista até stop-1
* `a[:]` -> uma cópia da lista inteira

In [24]:
print(list_ex[:])

[20, 50, 60, 70, 80, 90, 20, 10, 10]


In [25]:
print(list_ex[2:4])

[60, 70]


In [26]:
print(list_ex[:4])

[20, 50, 60, 70]


In [27]:
print(list_ex[1:])

[50, 60, 70, 80, 90, 20, 10, 10]


Também podemos utilizar índices negativos: desta forma estaremos *contando* de trás pra frente na lista, de forma que `[-1]` é o último elemento da lista, `[-2]` o penúltimo, etc...

In [33]:
list_ex[-3]

20

In [35]:
list_ex[-3:]

[20, 10, 10]

### Revisatando o desafio da última aula
Podemos utilizar os métodos `pop`, `extend` e `append` para resolver de uma forma mais *elegante* o problema de achatamento de listas.

In [36]:
list_ex = [1, [2, [3, [4]]]]
print(list_ex)

[1, [2, [3, [4]]]]


In [37]:
[1,2,3,4]

[1, 2, 3, 4]

In [38]:
# Um jeito mais bonito de achatar listas
chata = []
while list_ex:
    elemento = list_ex.pop()
    if type(elemento) == list:
        list_ex.extend(elemento)
    else:
        chata.append(elemento)

print(chata)

[4, 3, 2, 1]


In [39]:
list_ex = [1, [2, [3, [4]]]]
print(list_ex)

[1, [2, [3, [4]]]]


In [40]:
# 1o perna

elemento = list_ex.pop()
print(elemento)

[2, [3, [4]]]


In [41]:
if type(elemento) == list:
    list_ex.extend(elemento)
else:
    chata.append(elemento)

In [42]:
list_ex

[1, 2, [3, [4]]]

## Tuples
- Tuplas são sequências ordenandas de elementos (como listas)

- Tuplas são **imútaveis**

### Criando uma tupla

In [43]:
tupla = (10,)
type(tupla)

tuple

In [63]:
tupla = (10,)

In [66]:
tupla[1]

IndexError: tuple index out of range

In [44]:
tuple_ex = (10, 20, 30)
print(tuple_ex)

(10, 20, 30)


Podemos utilizar a atribuição múltipla para desempacotar tuplas (e listas):

In [48]:
a, b, c = tuple_ex
print(a)
print(b)
print(c)

10
20
30


Também podemos converter uma lista em uma tupla e vice-versa:

In [50]:
minha_lista = [10, 20, 30]
minha_upla = tuple(minha_lista)
print(minha_lista)
print(minha_upla)
print(type(minha_upla))

[10, 20, 30]
(10, 20, 30)
<class 'tuple'>


In [51]:
tuple_ex = tuple([10, 20, 30])
print(type(tuple_ex))

<class 'tuple'>


Assim como as listas, podemos percorrer uma tupla através de um loop:

In [52]:
minha_tupla = (0, 1, 2, 3, 4, 5)
for elemento in minha_tupla:
    print(elemento)

0
1
2
3
4
5


In [53]:
a = (20, 30)
a[0] = 10

TypeError: 'tuple' object does not support item assignment

## Métodos de Tuplas

- `count`: conta o # de vezes que um valor ocorre na tupla
- `index`: retorna o indice da primeira ocorrência de um valor

In [56]:
y = (1, 3, 7, 4, 6, 3, 8, 8, 'Pedro')
y.count('Pedro')

1

In [69]:
x = 3
y[y.index(x)] == x

True

Esses métodos também existem em listas:

In [70]:
y_list = list(y)

In [71]:
y_list

[1, 3, 7, 4, 6, 3, 8, 8, 'Pedro']

In [72]:
y.index(8)

6

## Funções nativas - `sorted()`, `range()` e `len()`

- `sorted()`: Ordenar uma tupla (ou qualquer **iterável**)
- `range()`: cria um iterável a partir de dois inteiros

In [79]:
'abc' < 4

TypeError: '<' not supported between instances of 'str' and 'int'

In [85]:
y = (1, 3, 7, 4, 6, 3, 8, 8)

In [86]:
type(y)

tuple

In [92]:
y_sorted = sorted(y)

In [90]:
print(sorted(y, reverse=True))

[8, 8, 7, 6, 4, 3, 3, 1]


A função sorted não modifica a lista (ou tupla) original - se quisermos guardar o resultado precisamos utilizar uma variável.

In [93]:
y_sorted

[1, 3, 3, 4, 6, 7, 8, 8]

In [94]:
meu_range = range(20)
print(meu_range)

range(0, 10)


A função `range()` cria um iterável *preguiçoso* (`lazy`): se quisermos ver todos os seus elementos precisamos percorre-lo por um loop ou converte-lo em uma lista.

In [95]:
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [96]:
list(meu_range)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

A função `len()` retorna o comprimento de um iterável (o seu número de elementos):

In [98]:
len([])

0

In [99]:
len(meu_range)

10

In [101]:
list_ex = [1, 2, 4, 5, 'Pedro']

In [104]:
len(list_ex)

5

In [103]:
# list_ex[len(list_ex)] cuidado!

IndexError: list index out of range

# DICT's
## O que é um dicionário?

Na vida real, um livro que tem palavras e o sentido dessa palavra. No Python dicionários são pares de **chaves** e **valores**.

### O que são chaves e valores?

chaves, ou `keys`: são as palavras

valores, ou `values`: são os sentidos.

## Criando um Dicionário

- Sintáxe `{key: value}`

In [105]:
my_dict={}

In [106]:
my_dict=dict()

In [107]:
type(my_dict)

dict

In [108]:
my_dict = {
    'Grão de Bico': 10, 
    'Feijão': 8, 
    'Lentilha': 1
}
print(my_dict)

{'Grão de Bico': 10, 'Feijão': 8, 'Lentilha': 1}


Podemos adicionar novas chaves ao dicionário utilizando a notação de indice:

In [109]:
my_dict['Soja'] = 9
print(my_dict)

{'Grão de Bico': 10, 'Feijão': 8, 'Lentilha': 1, 'Soja': 9}


In [111]:
my_dict['Feijão']

8

Cada `key` deve ser única em um dicionário - se tentarmos inserir diferentes `values` para uma mesma `key`.

In [112]:
my_dict = {
            'Grão de Bico': 10,
            'Grão de Bico': 8,
            'Grão de Bico': 1
          }
print(my_dict)

{'Grão de Bico': 1}


In [113]:
my_dict

{'Grão de Bico': 1}

In [114]:
my_dict['Grão de Bico'] = 9
print(my_dict)

{'Grão de Bico': 9}


Podemos utilizar esse mecânismo para atualizar os valores em um dicionário:

In [115]:
my_dict = {
            'Grão de Bico': 10,
            'Feijão': 8,
            'Lentilha': 1
          }

In [116]:
my_dict['Grão de Bico'] = 15
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 1}


Também podemos guardar e utilizar os valores de um dicionário em variáveis:

In [117]:
preco_10kg_gb = my_dict['Grão de Bico']*10
print(preco_10kg_gb)

150


In [120]:
x = 100
float(str(x)[0])

1.0

## Métodos de Dicionários

Embora um dicionário não seja diretamente iterável, podemos acessar os iteráveis que compõe um dicionário através de três métodos:

- `.values` nos permite acessar os valores em um dicionário.

- `.keys` nos permite acessar as chaves de um dicionário.

- `.items` nos permite acessar os pares `key:value` como duplas `(key, value)`

In [122]:
for entrada in my_dict:
    print(entrada)

Grão de Bico
Feijão
Lentilha


In [121]:
my_dict

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 1}

In [125]:
my_dict.values()

dict_values([15, 8, 1])

In [124]:
for valor in my_dict.values():
    print(valor)

15
8
1


In [126]:
my_dict.keys()

dict_keys(['Grão de Bico', 'Feijão', 'Lentilha'])

In [128]:
my_dict

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 1}

In [127]:
my_dict.items()

dict_items([('Grão de Bico', 15), ('Feijão', 8), ('Lentilha', 1)])

## Adicionando items ao dicionário

Podemos criar novos itens utilizando a indexação, cuidando para que a `key` especificada não seja parte do dicionário.

In [131]:
my_dict['Ervilha Partida'] = 9

In [132]:
my_dict.keys()

dict_keys(['Grão de Bico', 'Feijão', 'Lentilha', 'Ervilha Partida'])

In [133]:
my_dict

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 15, 'Ervilha Partida': 9}

Também podemos adicionar/atualizar chaves e valores em um dicionário a partir de outros dicionários:

In [134]:
# using `.update()` function containing a new dict inside
new_dict = dict()
new_dict['Lentilha'] = 5
new_dict['Arroz Integral'] = 8.5
print(new_dict)

{'Lentilha': 5, 'Arroz Integral': 8.5}


Para tanto utilizaremos o método `.update`

In [135]:
my_dict.update(new_dict)
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 5, 'Ervilha Partida': 9, 'Arroz Integral': 8.5}


In [136]:
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 5, 'Ervilha Partida': 9, 'Arroz Integral': 8.5}


Além disso podemos utilizar outros iteráveis para criar dicionários:

In [138]:
graos = ['Feijão Branco', 'Lentilha Síria', 'Feijão Branco']
valores = [9.50, 13, 8.50]

In [139]:
for i in range():
    # print(graos[i], valores[i])
    
    my_dict[graos[i]] = valores[i]

Feijão Branco 9.5
Lentilha Síria 13
Feijão Branco 8.5


In [145]:
list(range(len(graos)))

[0, 1, 2]

In [None]:
i = 0
my_dict['Feijão Branco'] = 9.5

In [142]:
range(len(graos))

[0, 1, 2]

In [143]:
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 5, 'Ervilha Partida': 9, 'Arroz Integral': 8.5, 'Feijão Branco': 8.5, 'Lentilha Síria': 13}


Também podemos utilizar uma lista de duplas para criar ou atualizar um dicionário:

In [148]:
novos_precos = [('Lentilha Verde', 9), ('Abobrinha', 3), ('Beringela', 8)]

In [146]:
min_tupla = (10, 2)
a, b = min_tupla
print(a)
print(b)

10
2


Ao invés de indexar as tuplas dentro da lista, utilizaremos o desempacotamento dentro do loop:

In [154]:
for abcd, fg in novos_precos:
    print(f'{abcd} = {fg}')

Lentilha Verde = 9
Abobrinha = 3
Beringela = 8


In [155]:
abcd

'Beringela'

In [153]:
for produto, preco in novos_precos:
    my_dict[produto] = preco
    
print(my_dict)

{'Grão de Bico': 15, 'Feijão': 8, 'Lentilha': 5, 'Ervilha Partida': 9, 'Arroz Integral': 8.5, 'Feijão Branco': 8.5, 'Lentilha Síria': 13, 'Lentilha Verde': 9, 'Abobrinha': 3, 'Beringela': 8}


## Um valor pode ser qualquer coisa (até outros dicionários!)

Vamos construir um exemplo mais complexo de um dicionário com múltiplos tipos de valores.

In [157]:
casa = dict()
print(casa)

{}


In [158]:
casa['id'] = 1
casa['tamanho'] = 80.5
casa['dim_terreno'] = (20, 30)
print(casa)

{'id': 1, 'tamanho': 80.5, 'dim_terreno': (20, 30)}


In [159]:
casa['endereco'] = dict()
print(casa)

{'id': 1, 'tamanho': 80.5, 'dim_terreno': (20, 30), 'endereco': {}}


In [160]:
casa['endereco']['cep'] = 39272440
casa['endereco']['rua'] = 'Al. das Maritacas'
casa['endereco']['numero'] = 1637
casa['endereco']['bairro'] = 'Cidade Jardim'


In [161]:
casa

{'id': 1,
 'tamanho': 80.5,
 'dim_terreno': (20, 30),
 'endereco': {'rua': 'Al. das Maritacas',
  'numero': 1637,
  'bairro': 'Cidade Jardim',
  'cep': 39272440}}

In [162]:
print(type(casa))
print(type(casa['dim_terreno']))
print(type(casa['endereco']))

<class 'dict'>
<class 'tuple'>
<class 'dict'>


In [163]:
print(casa['endereco']['rua'])

Al. das Maritacas


## Um exemplo real
Vamos analisar um exemplo comumente encontrado em análise de dados: extração de dados de uma API. Para este exemplo usaremos a API do Ambee (https://www.getambee.com/) para extrair dados de qualidade do ar em três cidades (São Paulo, Belo Horizonte e a pujante métropole de Pirassununga). Veremos formas de entender o que uma API retorna utilizando os métodos de dicionários

In [164]:
import requests
TOKEN = 'c0c9147ec699d5205de0cbb2f5ad611c9aae0b41edeaf6092728677d06356836'
url = "https://api.ambeedata.com/latest/by-city"
headers = {
    'x-api-key': TOKEN,
    'Content-type': "application/json"
    }

In [165]:
querystring = {"city":"Sao Paulo"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_sp = response.json()

In [166]:
querystring = {"city":"Belo Horizonte"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_bh = response.json()

In [167]:
querystring = {"city":"Pirassununga"}
response = requests.request("GET", url, headers=headers, params=querystring)
ql_ar_pira = response.json()

In [168]:
print(ql_ar_sp)

{'message': 'success', 'stations': [{'_id': '60363be18f2bb86af9398a6c', 'placeId': '13991eba7f6caaaf0830f7574f0fa70052de3b51d28ba8264782466ffd78851f', 'CO': 2, 'NO2': 6.698, 'OZONE': 13.333, 'PM10': 22.222, 'PM25': 22.333, 'SO2': 12.444, 'city': None, 'countryCode': 'BR', 'division': None, 'lat': -23.627, 'lng': -46.635, 'placeName': 'São Paulo', 'postalCode': '01000-000', 'state': 'Sao Paulo', 'updatedAt': '2022-06-18 14:00:00', 'AQI': 73, 'aqiInfo': {'pollutant': 'PM2.5', 'concentration': 22.333, 'category': 'Moderate'}}]}


In [169]:
ql_ar_sp.keys()

dict_keys(['message', 'stations'])

In [177]:
ql_ar_sp['stations']

[{'_id': '60363be18f2bb86af9398a6c',
  'placeId': '13991eba7f6caaaf0830f7574f0fa70052de3b51d28ba8264782466ffd78851f',
  'CO': 2,
  'NO2': 6.698,
  'OZONE': 13.333,
  'PM10': 22.222,
  'PM25': 22.333,
  'SO2': 12.444,
  'city': None,
  'countryCode': 'BR',
  'division': None,
  'lat': -23.627,
  'lng': -46.635,
  'placeName': 'São Paulo',
  'postalCode': '01000-000',
  'state': 'Sao Paulo',
  'updatedAt': '2022-06-18 14:00:00',
  'AQI': 73,
  'aqiInfo': {'pollutant': 'PM2.5',
   'concentration': 22.333,
   'category': 'Moderate'}}]

## Iterando por um dicionário

Ao contrário de listas e tuplas, dicionários não podem ser iterados diretamente. Para tanto precisamos usar os métodos `.keys()`, `.items()` ou `.items()`

In [178]:
for chave in casa:
    print(chave)

id
tamanho
dim_terreno
endereco


In [179]:
for chave in casa.keys():
    print(f'{chave}: {casa[chave]}')

id: 1
tamanho: 80.5
dim_terreno: (20, 30)
endereco: {'rua': 'Al. das Maritacas', 'numero': 1637, 'bairro': 'Cidade Jardim', 'cep': 39272440}


In [181]:
for atributo in casa.items():
    print(atributo)

('id', 1)
('tamanho', 80.5)
('dim_terreno', (20, 30))
('endereco', {'rua': 'Al. das Maritacas', 'numero': 1637, 'bairro': 'Cidade Jardim', 'cep': 39272440})


In [182]:
for valor in casa.values():
    print(valor)

1
80.5
(20, 30)
{'rua': 'Al. das Maritacas', 'numero': 1637, 'bairro': 'Cidade Jardim', 'cep': 39272440}


## Percorrendo os itens de um dicionário

Podemos utilizar o desempacotamento de valores para converter o resultado do método `.items()` e variáveis distintas dentro de um loop:

In [183]:
my_dict = {
            'Grão de Bico': 10,
            'Feijão': 8,
            'Lentilha': 1
          }

In [184]:
print(my_dict.items())

dict_items([('Grão de Bico', 10), ('Feijão', 8), ('Lentilha', 1)])


In [185]:
for grao, preco in my_dict.items():
    if grao == 'Feijão' or grao == 'Lentilha':
        print(preco)

8
1


## O Operador `in`

In [187]:
4 in [1, 2, 3]

False

In [188]:
8 in my_dict.values()

True

este operador funciona em qualquer iterável:

In [189]:
'abcd' in 'abc'

False

In [190]:
'abc' in 'abcd'

True

In [191]:
1 in (1, 2, 3)

True

# Conjuntos (`sets`)

Os conjuntos são como dicionários - no entanto contém apenas chaves. Isso significa que um conjunto só pode ter elementos únicos.

In [192]:
my_list = ['Pedro', 'Adriano', 'Pedro', 'Adriano', 'Pedro', 'Adriano']

In [193]:
my_list

['Pedro', 'Adriano', 'Pedro', 'Adriano', 'Pedro', 'Adriano']

In [194]:
set(my_list)

{'Adriano', 'Pedro'}

Se precisamos encontrar o número de elementos únicos em uma lista, podemos converte-la em um conjunto:

In [195]:
list_x = [1,2,3,4,4,4,4,4,5,6,6,6,7,7,8]
set_x = set(list_x)
print(f'Tamanho da lista: {len(list_x)}, tamanho do set: {len(set_x)}')

Tamanho da lista: 15, tamanho do set: 8


## Métodos de `sets`

- `.intersection()` retorna os elementos em comum em 2 conjuntos;
- `.difference()` retorna os elementos do conjunto que não são comuns à outro conjunto;
- `.union()` retorna a combinação dos elementos de 2 conjuntos;


In [196]:
x = {1, 2, 3, 4, 5, 6, 7, 8}

In [197]:
y = {6, 7, 8, 9, 10, 11, 12}

In [198]:
x.intersection(y)

{6, 7, 8}

In [199]:
y.intersection(x)

{6, 7, 8}

In [200]:
x.difference(y)

{1, 2, 3, 4, 5}

In [201]:
y.difference(x)

{9, 10, 11, 12}

In [202]:
x-y # x.difference(y)

{1, 2, 3, 4, 5}

In [203]:
y-x # y.difference(y)

{9, 10, 11, 12}

In [204]:
x.union(y)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

In [205]:
(x-y).union(y-x)

{1, 2, 3, 4, 5, 9, 10, 11, 12}

In [206]:
x.symmetric_difference(y)

{1, 2, 3, 4, 5, 9, 10, 11, 12}

In [207]:
x = set([1,2,3])

In [210]:
set([1,2, 3]).issubset(x)

True

In [212]:
# Practical example
col_names = set(['qtd_cartoes', 'vlr_cartao','qtd_cheques','vlr_cheques', 'vlr_total'])

incoming_col_names = set(['qtd_cartoes', 'vlr_cartao','qtd_cheques','vlr_cheques'])

# print(f'Missing columns: {set(col_names) - set(incoming_col_names)}')
missing_columns = col_names.difference(incoming_col_names)
print(f'Missing columns: {missing_columns}')

Missing columns: {'vlr_total'}


# VOLTAMOS AS 14h!!! BOM ALMOÇO

In [214]:
(1,1).append(1)

AttributeError: 'tuple' object has no attribute 'append'