<img src="imgs/mesttra.png" alt="mesttra_logo" style="width: 200px;"/>


# Estrutura de Dados
___

Estruturas de dados são uma forma de organizar e armazenar dados para que possam ser acessados e trabalhados de forma eficiente. Elas definem a relação entre os dados e as operações que podem ser executadas neles. Existem vários tipos de estruturas de dados definidas que tornam mais fácil para os cientistas de dados se concentrarem na solução de problemas maiores, em vez de se perderem nos detalhes da descrição e acesso aos dados.

Em python existem as seguintes estruturas de dados: listas, tuplas, dicionários, coleções (sets). As mais utilizadas no dia-a-dia de um cientista de dados são as listas, tuplas, dicionários e são nelas que esta matéria irá focar.

## Listas
___

A lista é, provavelmente, a estrutura de dados mais utilizada e mais básica em python. Ela é uma coleção ordenada, mutável e iterável também podendo ser heterogênea, ou seja, receber diversos tipos de dados. Ela tem vários métodos (funcionalidades do objeto lista) que podem auxiliar na organização e manipulação de dados. Alguns exemplos de lista:

In [3]:
lista_de_inteiros = [1,2,3,4,5] ## lista de integers
lista_heterogenea = ['nasser',1.71,100, True]
lista_de_lista = [[1,2,3,4],[5,6,7,8]]

Podemos encontrar o tamanho de uma lista utilizando a função ```len()```

In [7]:
print(len(lista_de_inteiros))
print(len(lista_heterogenea))
print(len(lista_de_lista))

5
4
2


Também é possivel criar listas vazias!

In [8]:
cidades_que_visitei = []
cidades_que_visitei

[]

In [9]:
cidades_que_visitei = ['Brasília','Cairo','Tel-Aviv','Paris','Jerusalem','Eilat']
cidades_que_visitei

['Brasília', 'Cairo', 'Tel-Aviv', 'Paris', 'Jerusalem', 'Eilat']

Podemos acessar dados de uma lista utilizando a localização do dado a ser recuperado, iniciando a conta por ```zero```!

![lista](imgs/lista.png)

Ou seja, o primeiro valor tem o índice ```0 (zero)``` e os próximos seguem normalmente a contagem.

In [10]:
## acessando o primeiro valor

cidades_que_visitei[0]

'Brasília'

In [11]:
## acessando o segundo valor

cidades_que_visitei[1]

'Cairo'

In [12]:
## acessando o quarto valor

cidades_que_visitei[3]

'Paris'

É possível reatribuir o valor em qualquer posição de uma lista, para isso basta selecionar o índica da lista que deseja alterar e atribuir um novo valor a ela.

In [14]:
cidades_que_visitei[4]

'Jerusalem'

In [15]:
cidades_que_visitei[4] = 'Jerusalém'

In [16]:
cidades_que_visitei[4]

'Jerusalém'

Uma forma simples e bastante poderosa de selecionar valores dentro de uma lista é utilizando a técnica de fatiamento. Ela permite que a seleção de valores dentro de uma janela com início e fim, para isso basta utilizar ```:``` .

In [24]:
## a função range(n) serve para criar uma quantidade n de valores encadeados.

lista_100 = list(range(100))

In [26]:
## usando fatiamento

primeiros_3 = lista_100[:3]
primeiros_3

[0, 1, 2]

In [27]:
cidades_que_visitei[0:2]

['Brasília', 'Cairo']

In [28]:
cidades_que_visitei[:2]

['Brasília', 'Cairo']

Veja que utilizar o índice zero ou deixar o lado esquerdo do sinal de dois-pontos traz o mesmo resultado.

In [29]:
cidades_que_visitei[:]

['Brasília', 'Cairo', 'Tel-Aviv', 'Paris', 'Jerusalém', 'Eilat']

In [30]:
cidades_que_visitei[2:]

['Tel-Aviv', 'Paris', 'Jerusalém', 'Eilat']

In [31]:
cidades_que_visitei[3:5]

['Paris', 'Jerusalém']

Perceba que o indice no lado esquerdo o sinal de dois-pontos é inclusivo e do lado direito é exclusivo (ou seja, não retorna o valor). Também é possível selecionar os valores começando a contagem do final da lista porém, nessa situação, a contagem começa com 1 e é negativa.

In [32]:
cidades_que_visitei[-1]

'Eilat'

In [35]:
cidades_que_visitei[-5:-2]

['Cairo', 'Tel-Aviv', 'Paris']

Listas podem ser heterogeneas, ou seja, podemos colocar outras listas dentro dela, outras estruturas de dados e até objetos mais complexos.

In [37]:
paises_que_visitei = ['Brasil',{'Jerusalem':5,'Tel-Aviv':2,'Eilat':1},('França','Paris')]

In [38]:
len(paises_que_visitei)

3

In [39]:
type(paises_que_visitei[0])

str

In [40]:
type(paises_que_visitei[1])

dict

In [41]:
type(paises_que_visitei[2])

tuple

### Métodos de Listas

Métodos são pequenos funcionalidades de um objeto que podemos utilizar para manipular os dados desse objeto. Todo objeto igual, independente do seu conteúdo, possui os mesmos métodos. Os métodos de um objeto podem ser acessados colocar um ```.``` ao final do variável e escrevendo seu nome.

Os métodos de listas mais utilizados são os seguintes:

![](imgs/lista3.png)

In [42]:
cidades_que_visitei

['Brasília', 'Cairo', 'Tel-Aviv', 'Paris', 'Jerusalém', 'Eilat']

In [43]:
## adicionando a cidade Araxá ao final da lista

cidades_que_visitei.append('Araxá')

In [44]:
## contando quantas vezes a palavra 'Eilat' aparece na lista

cidades_que_visitei.count('Eilat')

1

In [45]:
## encontrando o índice da palavra 'Paris'

cidades_que_visitei.index('Paris')

3

In [46]:
## alterando a ordem da lista (invertendo)

cidades_que_visitei.reverse()
cidades_que_visitei

['Araxá', 'Eilat', 'Jerusalém', 'Paris', 'Tel-Aviv', 'Cairo', 'Brasília']

In [48]:
## organizando a lista

cidades_que_visitei.sort()
cidades_que_visitei

['Araxá', 'Brasília', 'Cairo', 'Eilat', 'Jerusalém', 'Paris', 'Tel-Aviv']

In [49]:
## extraindo um valor da lista

cidades_que_visitei.pop(2)
cidades_que_visitei

['Araxá', 'Brasília', 'Eilat', 'Jerusalém', 'Paris', 'Tel-Aviv']

In [50]:
## removendo um valor da lista

cidades_que_visitei.remove('Brasília')
cidades_que_visitei

['Araxá', 'Eilat', 'Jerusalém', 'Paris', 'Tel-Aviv']

Imagine que você possui a lista abaixo. Ela possui valores inteiros, porém, existe um impostor no meio dela, a string '88', encontre o índice dessa string e a substitua pelo valor inteiro 88.

In [51]:
lista_exercicio = [125,175,785,4,89,25,41,58,56,2,45,4,5,13,65,469,8,8974,654,65,564,2547,87,987,6454,516,54,654,98,7,77,'88',54,7,8,54,5,1,4,7,8,25,4,5,7,8,8,8,5,6,6,6,3,2,5,4,5]

## Tuplas
___

As tuplas são como listas porém imutáveis, ou seja, não podemos alterar nenhum valor depois que ela for designada. Normalmente é utilizada para guardar informações que em momento algum podem mudar (endereço, cpf, id de usuário). Podemos usar parênteses para definir uma tupla ou a função ```tuple()```.

In [52]:
fundo_imob = ('ALZR11','BBF011','BLMG11','BLCP11','BRCO11')
fundo_imob

('ALZR11', 'BBF011', 'BLMG11', 'BLCP11', 'BRCO11')

In [53]:
## as tuplas são indexadas da mesma forma que as listas

print(fundo_imob[0])
print(fundo_imob[1])
print(fundo_imob[2])

ALZR11
BBF011
BLMG11


In [54]:
## tuplas não suportam alteração de valores

fundo_imob[0] = 'BACON11'

TypeError: 'tuple' object does not support item assignment

In [55]:
## tuplas também podem ser heterogeneas

fundo_imob = tuple(['ALZR11',11,{'BLMG11':97.30},15.2,['BRCO11',16]])
fundo_imob

('ALZR11', 11, {'BLMG11': 97.3}, 15.2, ['BRCO11', 16])

In [56]:
## alteração de um valor de um objeto mutável dentro da tupla

fundo_imob[4][1] = 15

In [57]:
fundo_imob

('ALZR11', 11, {'BLMG11': 97.3}, 15.2, ['BRCO11', 15])

### Métodos de Tuplas

Devido a sua característica imutável, tuplas possuem poucos métodos.

In [58]:
## contando quantos valores aparecem

fundo_imob.count(['BRCO11',15])

1

In [60]:
fundo_imob.count(11)

1

In [59]:
## encontrando o índice do valor 15.2

fundo_imob.index(15.2)

3

## Dicionários
___

Os dicionários são outra estrutura de dados em python que também são conhecidas como “memória associativas” ou “vetores associativos”, diferentemente das listas e tuplas, os dicionários são indexados utilizando chaves (keys) e não números. Construímos um dicionário utilizando chaves ```{}``` ou a função ```dict()```. Os dicionários são mutáveis e iteráveis.

In [61]:
meu_dict = {}
type(meu_dict)

dict

In [62]:
meu_dict['clientes'] = ['Maria','João','Gilberto','Gabriela','Marcelo']
meu_dict

{'clientes': ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo']}

Perceba que para adicionar um par ```chave:valor``` basta utilizar uma sintaxe de indexação com atribuição.

In [65]:
meu_dict['endereços'] = {
    'maria':'águas claras',
    'joão':'asa norte',
    'gilberto':'asa sul',
    'gabriela':'samambaia',
    'marcelo':'planaltina'
}

meu_dict

{'clientes': ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo'],
 'endereços': {'maria': 'águas claras',
  'joão': 'asa norte',
  'gilberto': 'asa sul',
  'gabriela': 'samambaia',
  'marcelo': 'planaltina'}}

Podemos também colocar dicionários dentro de dicionários. Perceba que todo objeto designado como valor ainda mantém seus métodos originais. Então para modifica-lo basta referenciar a chave e utilizar o método deseja do objeto em valor.

In [1]:
meu_dict['valor_total_faturado'] = 50000
meu_dict

NameError: name 'meu_dict' is not defined

In [67]:
meu_dict['valor_total_faturado'] = 122658
meu_dict

{'clientes': ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo'],
 'endereços': {'maria': 'águas claras',
  'joão': 'asa norte',
  'gilberto': 'asa sul',
  'gabriela': 'samambaia',
  'marcelo': 'planaltina'},
 'valor_total_faturado': 122658}

In [68]:
meu_dict['clientes']

['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo']

In [69]:
meu_dict['clientes'][0]

'Maria'

In [70]:
meu_dict['clientes'].append('Nasser')
meu_dict

{'clientes': ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo', 'Nasser'],
 'endereços': {'maria': 'águas claras',
  'joão': 'asa norte',
  'gilberto': 'asa sul',
  'gabriela': 'samambaia',
  'marcelo': 'planaltina'},
 'valor_total_faturado': 122658}

In [74]:
meu_dict['endereços']['nassser'] = 0

In [75]:
meu_dict

{'clientes': ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo', 'Nasser'],
 'endereços': {'maria': 'águas claras',
  'joão': 'asa norte',
  'gilberto': 'asa sul',
  'gabriela': 'samambaia',
  'marcelo': 'planaltina',
  'nassser': 0},
 'valor_total_faturado': 122658}

In [76]:
del meu_dict['endereços']['nassser']

In [77]:
meu_dict

{'clientes': ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo', 'Nasser'],
 'endereços': {'maria': 'águas claras',
  'joão': 'asa norte',
  'gilberto': 'asa sul',
  'gabriela': 'samambaia',
  'marcelo': 'planaltina'},
 'valor_total_faturado': 122658}

In [78]:
meu_dict['endereços']['nasser'] = 'águas claras'
meu_dict

{'clientes': ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo', 'Nasser'],
 'endereços': {'maria': 'águas claras',
  'joão': 'asa norte',
  'gilberto': 'asa sul',
  'gabriela': 'samambaia',
  'marcelo': 'planaltina',
  'nasser': 'águas claras'},
 'valor_total_faturado': 122658}

In [79]:
meu_dict.keys()

dict_keys(['clientes', 'endereços', 'valor_total_faturado'])

In [80]:
meu_dict.values()

dict_values([['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo', 'Nasser'], {'maria': 'águas claras', 'joão': 'asa norte', 'gilberto': 'asa sul', 'gabriela': 'samambaia', 'marcelo': 'planaltina', 'nasser': 'águas claras'}, 122658])

In [81]:
valor_total_faturado = meu_dict.pop('valor_total_faturado')

In [82]:
meu_dict

{'clientes': ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo', 'Nasser'],
 'endereços': {'maria': 'águas claras',
  'joão': 'asa norte',
  'gilberto': 'asa sul',
  'gabriela': 'samambaia',
  'marcelo': 'planaltina',
  'nasser': 'águas claras'}}

In [83]:
valor_total_faturado

122658

In [84]:
meu_dict.items()

dict_items([('clientes', ['Maria', 'João', 'Gilberto', 'Gabriela', 'Marcelo', 'Nasser']), ('endereços', {'maria': 'águas claras', 'joão': 'asa norte', 'gilberto': 'asa sul', 'gabriela': 'samambaia', 'marcelo': 'planaltina', 'nasser': 'águas claras'})])

In [None]:
meu_dict.get('valor_total_de_venda')

In [None]:
meu_dict['valor_total_de_venda']

O método ```.get()``` retorna o valor associado a uma chave, porém se essa chave não existir ele não levanta nenhuma mensagem de erro como a indexação tradicional faria. Entender esse comportamento é muito importante para montar algoritmos que possam atuar sem intervenção humana.