# Estruturas de dados

<img src="images/python-logo.jpg" alt="Python" style="width: 300px;"/>

Para facilitar o armazenamento e manipulação de informação, o Python fornece algumas estruturas de dados muito úteis.

Este Notebook contém os tipos de estruturas mais importantes, as suas propriedades, e alguns exemplos de como as utilizar.

## Listas

Uma lista é simplesmente uma colecção ordenada de valores, possivelmente duplicados, que podem ser acedidos individualmente. É delimitada por parêntesis rectos \[\], e os valores são separados por vírgulas.

In [2]:
lista_a = [15, 22, 300]
lista_b = [10, 'Olá!', 20.5, 'Adeus!']

print(lista_a)
print(lista_b)

[15, 22, 300]
[10, 'Olá!', 20.5, 'Adeus!']


Para aceder a um elemento dentro de uma lista:

In [3]:
 # o primeiro elemento da lista é indexado pelo valor 0
primeiro_elemento_a = lista_a[0]
print(primeiro_elemento_a)

ultimo_elemento_a = lista_a[2]
print(ultimo_elemento_a)

# podemos também aceder a uma lista no "sentido contrário" (-1, -2, -3, ...)
ultimo_elemento_b = lista_b[-1]
print(ultimo_elemento_b)

primeiro_elemento_b = lista_b[-4]
print(primeiro_elemento_b)

15
300
Adeus!
10


Podemos substituir um elemento por outro

In [4]:
minha_lista = [10, 20, 30]
minha_lista[0] = 'Hello!'
print(minha_lista)

['Hello!', 20, 30]


Podemos também selecionar uma sublista (dentro da lista), usando a notação *começo*:*fim* (intervalo fechado no começo, e aberto no fim)

In [2]:
lista_a = [15, 22, 300]
lista_b = [10, 'Olá!', 20.5, 'Adeus!']

# Fica com os elementos 0, 1 (2 é excluído)
primeiro_e_segundo_elemento = lista_a[0:2]

print(primeiro_e_segundo_elemento)

[15, 22]


In [19]:
# Podem haver listas de um elemento
lista_com_um_elemento = ['Olá!']

print(lista_com_um_elemento)

['Olá!']


In [20]:
# Como terceiro_elemento é uma lista com um único elemento,
# podemos aceder-lhe da mesma forma: com o índice 0
print(lista_com_um_elemento[0])

Olá!


Podemos seleccionar todos os elementos até um determinado índice omitindo o início do intervalos (valor à esquerda dos dois pontos):

In [4]:
l = ['a', 'b', 'c', 'd']

l[:2]

['a', 'b']

E podemos seleccionar todos os elementos até ao fim da lista, começando num determinado índice:

In [6]:
l[2:]

['c', 'd']

Podemos também ter listas dentro de listas: 

In [27]:
small_list = [10, 20, 30]
big_list = [small_list, 'a', 'b', 'c']

print(big_list)
print(big_list[0])
print(big_list[0][0], big_list[0][1], big_list[0][2])

[[10, 20, 30], 'a', 'b', 'c']
[10, 20, 30]
10 20 30


### Operações com listas

Aqui estão alguma operações que se podem fazer com listas. Estas operações afectam a lista sobre a qual são aplicadas.

Algumas das operações são aplicadas da seguinte forma: 

    - a_minha_lista.operação_desejada(...)
    
Este tipo de operações chamam-se "métodos" e estão associados a uma instância de uma variável ou estrutura de dados. No casos dos métodos apresentados de seguida, qualquer instância de uma Lista tem acesso a eles.

Outras das operações, como por exemplo len(...), não são exclusivas a Listas, mas sim operações "base" fornecidas pelo Python. Como iremos ver mais à frente, podemos usá-las com várias estruturas de dados distintas.

#### Número de elementos numa lista

A função len(...) indica-nos o número de elementos numa lista. Pode ser usadas também com outras estruturas de dados.

In [28]:
esta_lista = [1, 2, 3, 4, 5]

len(esta_lista)

5

#### Append

Adiciona um elemento a uma lista

In [31]:
lista_x = [1, 2, 3]
lista_x.append(4)

print(lista_x)

[1, 2, 3, 4]


#### Delete

Elimina um elemento de uma lista.

In [32]:
# Temos duas maneiras de fazer isto:

# Com del:
lista_y = ['a', 'b', 'c', 'd', 'a']

del lista_y[1]  # elimina o elemento na posição 1 (relembrem-se, começa a contar no 0!)

print(lista_y)

# Com o método remove: elimina apenas a primeira ocorrência do elemento desejado!
lista_y = ['a', 'b', 'c', 'd', 'a']

lista_y.remove('a')  # elimina o elemento na posição 1

print(lista_y)


['a', 'c', 'd', 'a']
['b', 'c', 'd', 'a']


#### Verificar a existência de um elemento

Podemos usar a keyword **in** para verificar se um elemento existe numa lista. Esta operação irá ter um valor boleano de True caso exista, e False caso não exista.

In [33]:
minha_lista = [1, 2, 3, 4, 5]

print(5 in minha_lista)

print('oops' in minha_lista)

True
False


#### Contar ocorrências de um elemento

O método count() permite-nos contar o número de ocorrências de um elemento numa lista.

In [36]:
numeros = [1, 1, 1, 2, 3, 4, 1, 1, 1]

contagem = numeros.count(1)

print(contagem)

6


#### Index

O método index permite-nos obter o índice da primeira ocorrência de um elemento numa lista

In [38]:
super_lista = ['super', 'data', 'scientist', '!']

idx = super_lista.index('data')

print(idx)

print(super_lista[idx])  # estou a aceder ao elemento na posição idx

1
data


#### Ordenar

O método sort() permite-nos ordenar uma lista em ordem crescente. 

Atenção: os elementos tem de ser ordenáveis entre si! Se uma lista tiver, por exemplo, elementos inteiros e strings, vamos ter um erro.

In [39]:
desordenada = [1, 3, 4, 2, 5]

print('Desordenada ', desordenada)

desordenada.sort()

print('Ordenada: ', desordenada)

Desordenada  [1, 3, 4, 2, 5]
Ordenada:  [1, 2, 3, 4, 5]


In [40]:
nao_ordenavel = [1, 2, 'a', 4]

nao_ordenavel.sort()

TypeError: '<' not supported between instances of 'str' and 'int'

#### Extender uma lista

Podemos querer adicionar todos os elementos de uma lista individualmente a outra lista. Para isso podemos usar o método .extend ou somar (+) duas listas! A diferença é que:
* a operação de soma não modifica a lista original, a não ser que guardemos a lista resultante numa nova variável (nova_lista = lista_1 + lista_2)
* o método .extend() modifica a lista original (é uma operação "inplace")

Este processo não é recursivo para elementos dentro da lista original - ou seja, se um dos elementos da lista original for também uma lista, estes sub-elementos não vão ser individualmente retirados (ver o exemplo).

In [41]:
lista_grande = [1, 2, 3, 4, 5]

lista_pequena = [6, 7, 8, ['outra', 'lista']]

lista_grande.extend(lista_pequena)  # como podemos ver, a lista_grande foi modificada
print("A lista grande foi modificada: ", lista_grande)

A lista grande foi modificada:  [1, 2, 3, 4, 5, 6, 7, 8, ['outra', 'lista']]


In [43]:
lista_grande = [1, 2, 3, 4, 5]
lista_pequena = [6, 7, 8, ['outra', 'lista']]

nova_lista = lista_grande + lista_pequena

print("A nova lista: ", nova_lista)
print("A lista_grande não foi modificada: ", lista_grande)  # como podemos ver, a lista grande não foi afectada.

# Dica: Tenham sempre muita atenção quando alterarem variáveis, e aos valores que elas contêm
# ao longo da execução do programa. Muitas vezes temos erros porque escrevemos um valor novo por cima
# de uma variável antiga por engano.

A nova lista:  [1, 2, 3, 4, 5, 6, 7, 8, ['outra', 'lista']]
A lista_grande não foi modificada:  [1, 2, 3, 4, 5]


#### Somar os elementos de uma lista

Podemos usar o sum() para somar elementos de uma lista (os elementos têm de ser compativeis entre si, não é possível somar listas com números e strings, por exemplo).

In [51]:
lista_de_numeros = [1.0, 2, 3.5]

sum(lista_de_numeros)

6.5

#### Atenção! Como copiar listas (e outras estruturas de dados)

Vamos experimentar fazer uma cópia de uma lista, e ver o que acontece:

In [52]:
lista_1 = [1, 2, 3]
lista_2 = lista_1

Agora vamos fazer uma mudança na lista_2, e ver se algo acontece à lista 1:

In [53]:
lista_2.append(4)

print(lista_1)
print(lista_2)

[1, 2, 3, 4]
[1, 2, 3, 4]


Como podem ver, uma alteração na lista_2 (a lista copiada) manifestou-se na lista_1. Isto é porque o operador `=`, quando usado para "copiar" uma estrutura de dados para outra variável, não faz uma cópia real. Ambas as variáveis ficam simplesmente a apontar para a mesma estrutura de dados.

Para fazer um verdadeira cópia, devemos utilizar o método .copy():

In [54]:
lista_1 = [1, 2, 3]
lista_2 = lista_1.copy()  # a única diferença aqui foi que usamos .copy() em vez de =

lista_2.append(4)

print(lista_1)
print(lista_2)

[1, 2, 3]
[1, 2, 3, 4]


#### Criar uma lista a partir de um string

Podemos usar o método .split() para dividir um string em várias palavras, criando uma lista:

In [1]:
frase = 'Hoje vamos aprender Python'

lista = frase.split()

print(lista)

['Hoje', 'vamos', 'aprender', 'Python']


Podemos escolher qual o caractér usado para separar a frase. Dividindo agora nas vírgulas:

In [3]:
frase = 'Olá, eu sou o vosso instrutor, e amanhã vamos aprender mais Python'

lista = frase.split(',')

print(lista)

['Olá', ' eu sou o vosso instrutor', ' e amanhã vamos aprender mais Python']


## Tuples

Um tuple é um conjunto de valores ordenados, muito semelhante a uma lista. A diferemça é que após um tuple ser criado, este não permite modificar os seus valores individualmente.

Pode ser criado usando parêntesis, com cada elemento separado por uma vírgula.

Há uma pequena excepção: para criar um tuple com apenas um elemento, devemos incluir na mesma uma vírgula - caso contrário, não será reconhecido como um tuple, mas sim como o elemento individual que colocarmos lá dentro. A razão disto é que o Python tem um ordem para interpretação de parêntesis: este podem ser utilizados para isolar segmentos de código, ou para criar tuples (mas neste caso requerem uma vírgula a sinalizar)

In [17]:
tuple_1 = (1, 2, 'x')
print(tuple_1)

tuple_de_um_elemento = (10,)
print(tuple_de_um_elemento)


tuple_com_uma_lista = ('hello', [1, 2, 3, 4])
print(tuple_com_uma_lista)

(1, 2, 'x')
(10,)
('hello', [1, 2, 3, 4])


Podemos seleccionar elementos de um tuple da mesma forma que uma lista. No entanto, se tentarmos modificá-lo, teremos um erro.

In [18]:
tuple_1[0]

1

Também podemos retirar uma fatia ("slice") de um tuple.

In [19]:
tuple_1[0:2]

(1, 2)

In [20]:
tuple_1[0] = 'outra coisa!'

TypeError: 'tuple' object does not support item assignment

### Converter listas em tuples (e vice-versa)

Podemos converter listas para tuples, e vice-versa, usando as funções list() e tuple()

In [24]:
eu_sou_uma_lista = [1, 2, 3, 4, 5]
eu_sou_um_tuple = (1, 2, 3, 4, 5)

lista_para_tuple = tuple(eu_sou_uma_lista) 
tuple_para_lista = list(eu_sou_um_tuple)

print("Tuple convertido em lista: ", lista_para_tuple)
print("Lista convertida em tuple: ", tuple_para_lista)

Tuple convertido em lista:  (1, 2, 3, 4, 5)
Lista convertida em tuple:  [1, 2, 3, 4, 5]


In [22]:
eu_sou_um_tuplo = tuple(eu_sou_uma_lista)
print(eu_sou_um_tuplo)
print(type(eu_sou_um_tuplo))

(1, 2, 3, 4, 5)
<class 'tuple'>


In [23]:
outra_lista = list(eu_sou_um_tuplo)
print(outra_lista)
print(type(outra_lista))

[1, 2, 3, 4, 5]
<class 'list'>


## Dicionário

Um dicionário ("dict") é um conjuntos de pares chave/valor ("key/value pairs").
Podemos aceder a qualquer valor dentro de um dicionário através da chave correspondente (e não o contrário!). Por esta razão, as chaves num dicionário têm de ser unicas, mas podem haver valores repetidos.

Um dicionário pode ser criado da seguinte forma: `{chave1: valor1, chave2: valor2, ...}`

In [56]:
# Para ser mais legível, podemos colocar cada par chave-valor numa linha separada.
imovel_1 = {
    'descricao': 'Um T2 com jardim em Sintra',
    'area': 127.5,
    'divisoes': [
        'quarto1',
        'quarto2',
        'sala de estar',
        'cozinha',
        'casa de banho'
    ]
}

imovel_1

{'descricao': 'Um T2 com jardim em Sintra',
 'area': 127.5,
 'divisoes': ['quarto1',
  'quarto2',
  'sala de estar',
  'cozinha',
  'casa de banho']}

Para aceder a um valor através da sua chave:

In [57]:
descricao = imovel_1['descricao']

print(descricao)

Um T2 com jardim em Sintra


#### Adicionar valores

Podemos adicionar novos pares chave/valor usando parêntesis retos, ou usando o método .update() ("inplace").

In [58]:
imovel_1['habitantes'] = ['Fred', 'Mariana', 'Pantufa']
imovel_1['preco'] = 200000
imovel_1['vendido'] = True

imovel_1

{'descricao': 'Um T2 com jardim em Sintra',
 'area': 127.5,
 'divisoes': ['quarto1',
  'quarto2',
  'sala de estar',
  'cozinha',
  'casa de banho'],
 'habitantes': ['Fred', 'Mariana', 'Pantufa'],
 'preco': 200000,
 'vendido': True}

In [59]:
imovel_1.update({ 'localizacao': 'Sintra' })

imovel_1

{'descricao': 'Um T2 com jardim em Sintra',
 'area': 127.5,
 'divisoes': ['quarto1',
  'quarto2',
  'sala de estar',
  'cozinha',
  'casa de banho'],
 'habitantes': ['Fred', 'Mariana', 'Pantufa'],
 'preco': 200000,
 'vendido': True,
 'localizacao': 'Sintra'}

#### Dicionários internos

Podemos também ter dicionários dentro de dicionários. Para aceder aos valores dos dicionários internos, encadeamos sequências de parêntesis retos:

In [61]:
imovel_1['datas'] = {
    'construcao': '10/10/2018',
    'venda': '01/02/2019'
}

imovel_1

{'descricao': 'Um T2 com jardim em Sintra',
 'area': 127.5,
 'divisoes': ['quarto1',
  'quarto2',
  'sala de estar',
  'cozinha',
  'casa de banho'],
 'habitantes': ['Fred', 'Mariana', 'Pantufa'],
 'preco': 200000,
 'vendido': True,
 'localizacao': 'Sintra',
 'datas': {'construcao': '10/10/2018', 'venda': '01/02/2019'}}

In [62]:
data_de_venda = imovel_1['datas']['venda']

print('Vendido em: ', data_de_venda)

Vendido em:  01/02/2019


#### .keys(), .values() e .items()

Podemos ver todas as chaves de um dicionário com o método .keys(), e todos os valores com o método .values(). 

O método .items() devolve-nos uma lista de tuples, cada um correspondendo a um par chave/valor.

In [57]:
imovel_1.keys()

dict_keys(['descricao', 'area', 'divisoes', 'habitantes', 'preco', 'vendido', 'localizacao', 'datas'])

In [58]:
imovel_1.values()

dict_values(['Um T2 com jardim em Sintra', 127, ['quarto1', 'quarto2', 'sala de estar', 'cozinha', 'casa de banho'], ['Fred', 'Mariana', 'Pantufa'], 200000, True, 'Sintra', {'construcao': '10/10/2018', 'venda': '01/02/2019'}])

In [59]:
imovel_1.items()

dict_items([('descricao', 'Um T2 com jardim em Sintra'), ('area', 127), ('divisoes', ['quarto1', 'quarto2', 'sala de estar', 'cozinha', 'casa de banho']), ('habitantes', ['Fred', 'Mariana', 'Pantufa']), ('preco', 200000), ('vendido', True), ('localizacao', 'Sintra'), ('datas', {'construcao': '10/10/2018', 'venda': '01/02/2019'})])

#### Keys repetidas

Se tentarmos criar um dicionário com uma key repetida, ele ficará com o último valor que encontrar para essa key. Atenção: não hã qualquer aviso por parte do programa quando isto acontece!

In [63]:
pessoa = {
    'nome': 'João',
    'idade': 20,
    'nome': 'Manuel'
}

pessoa

{'nome': 'Manuel', 'idade': 20}

#### Keys inexistentes e método .get()

Se tentarmos aceder a um valor com uma chave que não existe, iremos ter um erro (**KeyError**). Para evitar este erro, podemos usar o método .get(), que devolve o valor None se a chave não existir.

In [61]:
print( imovel_1['cor'] )

KeyError: 'cor'

In [34]:
print( imovel_1.get('cor') )

None


#### Verificar a existềncia de uma key

Podemos verificar se uma chave está presente num dicionário com a keyword **in**. Esta operação retorn um Boolean (True ou False):

In [64]:
'descricao' in imovel_1

True

In [65]:
'numero_de_andares' in imovel_1

False

#### Apagar um par chave/valor

Podemos apagar um par chave valor com a keyword **del** ou com o método .pop()

In [68]:
quantidades = {
    'sal': 20,
    'farinha': 200
}
print(quantidades)

del quantidades['farinha']

print(quantidades)

quantidades.pop('sal')

print(quantidades)

{'sal': 20, 'farinha': 200}
{'sal': 20}
{}


# Resumo

Neste notebook aprendemos algumas das estruturas de dados mais usadas em Python, como as listas, os tuples e os dicionários, e algumas maneiras de manipular a informação que elas contém.

Uma outra estrutura bastante útil de que não falamos aqui é o set - uma colecção de valores sem ordem e sem duplicados. Podem ver alguns exemplos aqui: https://www.w3schools.com/python/python_sets.asp

Este notebook não contém uma lista exaustiva de todas as maneiras de usar estas estruturas de dados, apenas as mais importantes; mas percebendo as suas propriedades, podem fazer uma apredizagem gradual conforme necessitem. 