# Estruturas de dados

Como vimos na primeira aula, o Python possui 4 tipos de dados básicos ou **primitivos**:
   - `str`
   - `int`
   - `float`
   - `bool`

Mas há outros tipos de dados derivados desses primitivos, e novos são criados com frequência.

Dentre esses outros tipos, nós temos alguns bem importantes que já vem incorporados ao Python:
   - list (classe `list`)
   - dicionário (classe `dict`)
   - conjunto (classe `set`)
   - tupla (classe `tuple`)
   
Esses tipos são usados para guardar uma coleção de valores em vez de um único valor. Como esses tipos são estruturas que mantêm alguns dados juntos, eles são comumente chamados de ***data structures***.

Nesse curso, nos focaremos apenas nas **listas**. Elas são mais simples de usar e compreender, e geralmente são o bastante para resolver a maior parte dos problemas que envolvam guardar e fazer opeações sobre um conjunto de valores.

## Listas

### Criando listas

Listas podem ser criadas usando:
   - Colchetes, que delimitam a lista
   - Vírgulas, que separam cada um dos elementos da listas

Vamos ver isso na prática:

In [22]:
# Criando lista com colchetes e vírgulas e atribuindo à variável 'minha_lista'
primeira_lista = [1, 2, 3]

In [20]:
# Imprimindo lista...
print(primeira_lista)
# ..e a sua classe
print(type(primeira_lista))

[1, 2, 3]
<class 'list'>


Uma lista pode reunir elementos de diferentes tipos: str, int, bool, outras listas, etc.

Por exemplo:

In [31]:
lista_diversa = [0, False, 145.0, "palavra", ["elemento1", 2, 3.0], primeira_lista]
lista_diversa

[0, False, 145.0, 'palavra', ['elemento1', 2, 3.0], [1, 2, 3]]

A variável `lista_diversa` possui elementos de diferentes tipos:
 - Integer - 0
 - Booleano - False
 - Float - 145.0
 - String - "palavra"
 - Lista - ["elemento1", 2, 3.0]
 - Lista contida em variável - primeira lista

Para saber o número de elementos de uma lista, podemos usar a função `len()` (do inglês *length*):

In [25]:
len(lista_diversa)

6

A `lista_diversa` possui então 6 elementos. Um elemento para cada um dos primitivos e duas listas. Mas essas duas listas possuem 3 elementos cada. Não deveriam então ser $4 + 3 + 3 = 10$ elementos?


Não, porque **uma lista dentro de outra lista conta como um único elemento**, independentemente do número de elementos que essa lista interna possua.

### **Indexação e *slicing***
**ou: Como eu Aprendi a Parar de me Preocupar e Começar a Contar do 0**

<br>

E se nós **precisarmos de apenas um ou alguns elementos de uma lista**? Como podemos acessar só esse(s) elemento(s)?

Cada elemento de uma lista é **indexado**, ou seja, possui um valor númerico associado a ele, que o identifica. Esse valor vai de 0 até n-1, sendo n o número de elementos.

A imagem abaixo ilustra isso:

<br>

![Indexação de listas(Fonte: https://realpython.com/python-lists-tuples/)](imagens/list_indexing.webp)

Nós podemos acessar elementos indivíduais ou grupos de elementos da lista usando a sintaxe de *slicing* (fatiamento). A sintaxe completa do fatiamento é a seguinte:

       lista[ <inicio> : <fim> : <intervalo> ]
       
Mas dependendo do caso, podemos omitir `início`, `fim` ou `intervalo`.

A melhor maneira de entender o slicing é aplicando-o, então vamos para alguns exemplos:

#### Obtendo um único elemento de uma lista

In [59]:
# Primeiramente, vamos criar uma nova lista

lista_posicoes = ["primeiro elemento", "segundo", "terceiro", "quarto", "quinto", "sexto"]

In [61]:
# Obtendo um elemento específico de uma lista:

# Primeiro elemento (indice 0)
print(lista_posicoes[0])

# Quarto elemento (índice 3)
print(lista_posicoes[3])

# Sexto (e último) elemento (índice 5)
print(lista_posicoes[5])

primeiro elemento
quarto
sexto


#### Indexação negativa

Suponha que nós queremos pegar o último elemento de uma lista cujo número de elementos desconhecemos. 
Poderíamos checar o tamanho dela com a função `len()` e obter o elemento usando a notação `lista[ultimo_index]`, mas há uma maneira mais prática de se obter esse valor.

**Indexação negativa**: Além da indexação típica (de 0 a n-1), os elementos de uma lista também são indexados na ordem reversa, com índexes negativos (de -1 a -n).

A imagem abaixo mostra como se dá essa indexação reversa:

<br>

![Indexação reversa de listas (Fonte: https://realpython.com/python-lists-tuples/)](imagens/negative_list_indexing.webp)

<br>

Vamos ver alguns exemplos de indexação negativa:

In [62]:
# Obtendo um elemento com indexação negativa

# Último elemento
print(lista_posicoes[-1])

# Penúltimo elemento
print(lista_posicoes[-2])

#Antepenúltimo elemento
print(lista_posicoes[-3])

sexto
quinto
quarto


#### Obtendo mais de um elemento da lista com `:`

Se nós usarmos um `:`, podemos **selecionar mais de um elemento da lista**:

In [63]:
# Obtendo mais de um elemento

# Elementos 4 (índex 3) e 5 (índex 4)
print(lista_posicoes[3:4])

['quarto']


Opa! Algo deu errado.

Repare que, apesar de pedirmos a fatia dos elementos da lista que contenha os elementos 3 e 4, o Python nos deu apenas o elemento inicial (3). Por que isso aconteceu?

O slicing [m:n] diz pro Python retornar a porção da lista do índice inicial (m) até o índice final (n) . Entretanto, **o índice final não é incluído na fatia cortada**.

Ou seja, o slicing [m:n] diz para o Python:
  - **Retorne uma fatia que vá do índice m até o índice n, mas sem incluí-lo.**
  
Portanto, [3:4] pega a fatia que vai do índice 3 ao 4, mas sem incluir o elemento de índice 4. Então você obtém somente o índice 3. É o mesmo que escrever [3].

Então, para obter uma fatia que vá do índice m ao índice n, incluindo o índice n na fatia, devemos usar o slicing [m:n+1]. 

Reparem que **os valores m e n se referem aos índices, não às posições na lista**. A maior parte da confusão e erros dessa parte da programação acontece quando a gente **esquece que deve começar a contar do 0 em vez do 1**.

No caso, em vez de [3:4], precisamos fatiar a lista usando [3:5] para conseguir tanto o elemento 4 (índex 3) quanto o elemento 5 (índice 4):

In [64]:
# Obtendo mais de um elemento

# Elementos 4 (índex 3) e 5 (índex 4) - inclusivo
print(lista_posicoes[3:5])

# Elementos do 2 (índex 1) ao 5 (índex 4) - não inclusivo
print(lista_posicoes[1:4])

# Elementos do 2 (índex 1) ao 5 (índex 4) - inclusivo
print(lista_posicoes[1:5])

# Elementos do índex 0 ao índex 5 - inclusivo
print(lista_posicoes[0:6])

['quarto', 'quinto']
['segundo', 'terceiro', 'quarto']
['segundo', 'terceiro', 'quarto', 'quinto']
['primeiro elemento', 'segundo', 'terceiro', 'quarto', 'quinto', 'sexto']


In [67]:
# Também podemos usar a indexação negativa

# Elemento de índice 2 até o penúltimo (índice -2) - não inclusivo
print(lista_posicoes[2:-1])

# Elemento de índice 0 até o antepenúltimo (índice -3) - inclusivo
print(lista_posicoes[0:-2])


['terceiro', 'quarto', 'quinto']
['primeiro elemento', 'segundo', 'terceiro', 'quarto']


Também podemos **usar a notação com `:` sem estabelecer um início e/ou final da fatia** para obter todos os elementos até um ponto específico:

In [72]:
# Obtendo todos os valores até um certo ponto

# Do primeiro elemento (índice 0) ao elemento de índice 5 - inclusivo
print(lista_posicoes[:6])

# Do primeiro elemento ao índice 5 - não inclusivo
print(lista_posicoes[:5])

# Do elemento de índice 3 ao último elemento - inclusivo
print(lista_posicoes[3:])

# Do elemento de índice 3 ao último elemento - não inclusivo
print(lista_posições[3:-1]) # A omissão do final da fatia é sempre inclusiva

# Todos os elementos da lista
print(lista_posicoes[:])

['primeiro elemento', 'segundo', 'terceiro', 'quarto', 'quinto', 'sexto']
['primeiro elemento', 'segundo', 'terceiro', 'quarto', 'quinto']
['quarto', 'quinto', 'sexto']
['quarto', 'quinto']
['primeiro elemento', 'segundo', 'terceiro', 'quarto', 'quinto', 'sexto']


#### Obtendo elementos não adjacentes usando um `intervalo`

Também podemos definir um `intervalo` que estabele a frequência na qual elementos serão selecionados. Por exemplo:
  - Se o intervalo for 1 - Todos os elementos serão selecionados (padrão)
  - Se o intervalo for 2 - Um em cada dois elementos serão selecionados
  - Se o intervalo for 3 - Um em cada três elementos serão selecionados
  - Se o intervalo for -1 - Retorna a lista invertida
  
Vamos ver isso na prática:  

In [78]:
# Pegue todos os elementos, intervalo 1
print(lista_posicoes[::1]) # Igual a lista_posicoes[:]

# Pegue todos os elementos, intervalo 2 
print(lista_posicoes[::2])

# Pegue todos os elementos, intervalo 3
print(lista_posicoes[::3])

# Pegue todos os elementos, intervalo 1
print(lista_posicoes[::-1])

# Pegue todos os elementos, intervalo 1
print(lista_posicoes[::-2])


['primeiro elemento', 'segundo', 'terceiro', 'quarto', 'quinto', 'sexto']
['primeiro elemento', 'terceiro', 'quinto']
['primeiro elemento', 'quarto']
['sexto', 'quinto', 'quarto', 'terceiro', 'segundo', 'primeiro elemento']
['sexto', 'quarto', 'segundo']


Claro que podemos determinar `início`, `término` e `intervalo` ao mesmo tempo para refinar nossa seleção de elementos:

In [84]:
# Pegue todos os elementos das posições pares 
print(lista_posicoes[1::2])

# Pegue todos os elementos com índices pares
print(lista_posicoes[2::2]) # 0 não é par

# Pegue apenas o terceiro (índice 2) e o sexto elemento (índice 5)
print(lista_posicoes[2:6:3])

# Pegue apenas o primeiro e o último elementos
print(lista_posicoes[::len(lista_posicoes) - 1])

['segundo', 'quarto', 'sexto']
['terceiro', 'quinto']
['terceiro', 'sexto']
['primeiro elemento', 'sexto']


#### Obtendo elementos em listas aninhadas

In [103]:
# Imprimir lista com listas internas
print(lista_diversa)

[0, False, 145.0, 'palavra', ['elemento1', 2, 3.0], [1, 2, 3]]


In [104]:
# Imprimir listas internas:
print(lista_diversa[4])
print(lista_diversa[5])

['elemento1', 2, 3.0]
[1, 2, 3]


No caso de listas aninhadas (ou seja, listas dentro de outras listas), como fazemos para acessar os valores individuais das listas internas?

Basta fazer um "fatiamento duplo":

In [108]:
# Selecionando o segundo elemento da lista no índex 4 de `lista_diversa`
print(lista_diversa[4][2])

# Selecionando todos os elementos a partir do segundo elemento
# da lista no índex 5 de `lista_diversa`
print(lista_diversa[5][1:])

3.0
[2, 3]


O fatiamento de listas é uma *feature* do Python que a princípio dá bastante dor de cabeça para aprender. Entretanto, é uma ferramenta poderosíssima para se selecionar elementos de uma lista.

### *in* keyword

A palavra-chave `in` checa se uma lista (ou qualquer outra coleção) contém um elemento. Essa checagem retorna um **valor booleano**.

Sintaxe:
   
    valor in lista

In [11]:
# Criando lista
lista_nomes = ['gabriel', 'agata', 'francisco', 'ana',
               'joao', 'fabiana', 'flavia', 'leonardo']

In [14]:
# Exemplo de sintaxe - in keyword - nome da lista
"joao" in lista_nomes

True

In [15]:
# Nome que não está na lista
"pedro" in lista_nomes

False

In [16]:
# Testando se diferentes nomes estão na lista:

print("gabriel:","gabriel" in lista_nomes)
print("claudia:","claudia" in lista_nomes)
print("ana:","ana" in lista_nomes)
print("agata:","agata" in lista_nomes)
print("leon:","leon" in lista_nomes)

gabriel: True
claudia: False
ana: True
agata: True
leon: False


A palavra chave `not` inverte o valor de um booleano.
  - True se torna False
  - False se torna True

Logo, se quisermos checar se um nome **não está** presente na lista, temos que usar `not in`:

In [17]:
# Testando se diferentes nomes NÃO estão na lista:

print("gabriel:","gabriel" not in lista_nomes)
print("claudia:","claudia" not in lista_nomes)
print("ana:","ana" not in lista_nomes)
print("agata:","agata" not in lista_nomes)
print("leon:","leon" not in lista_nomes)

gabriel: False
claudia: True
ana: False
agata: False
leon: True


Na célula acima, **os nomes que NÃO estão na lista retornam True**. 

Isso pode parecer inútil no momento, mas é extremamente importante no uso de **condicionais**.

Como veremos em uma aula posterior, **condicionais só são executadas se forem verdadeiras**.

OBS: `in` também é muito usado em **loops** para se "visitar" cada um dos elementos em uma coleção.

In [19]:
# Imprimindo saudação para cada um dos nomes da lista:
for nome in lista_nomes:
    print("Vida longa e próspera, {}!".format(nome))

Vida longa e próspera, gabriel!
Vida longa e próspera, agata!
Vida longa e próspera, francisco!
Vida longa e próspera, ana!
Vida longa e próspera, joao!
Vida longa e próspera, fabiana!
Vida longa e próspera, flavia!
Vida longa e próspera, leonardo!


Teremos uma aula dedicada a loops posteriormente.

### Manipulação de listas

Listas são mutáveis, o que significa que nós podemos adicionar ou remover elementos da forma que quisermos.

Nós podemos, por exemplo, usar `+` para concatenar listas, exatamente da mesma forma que fazemos com strings:

In [88]:
lista1 = [1, 2, 3]
lista2 = [3, 4, 5]
print(lista1 + lista2 + [5, 6, 7]) #Obs: isso não muda as listas originais

[1, 2, 3, 3, 4, 5, 5, 6, 7]


In [91]:
print(lista1)
print(lista2) # A soma da célula anterior não muda as listas

[1, 2, 3]
[3, 4, 5]


Para mudar o valor de uma lista, podemos fazer uma **reatribuição**:

In [93]:
lista1 = lista1 + lista2 # Altera lista1 mas não a lista2
print(lista1)
print(lista2)

[1, 2, 3, 3, 4, 5, 3, 4, 5]
[3, 4, 5]


Também podemos usar `*` para duplicar os elementos da lista. Mais uma vez, similar às strings:

In [94]:
lista2 * 3

[3, 4, 5, 3, 4, 5, 3, 4, 5]

Essas similaridades entre listas e strings não são aleatórias.

Tanto strings quanto listas são um coleção de elementos indexados. No caso da string, esses elementos são os caracteres:

In [100]:
for letra in 'bom dia':
    print('bom dia'.index(letra), letra)

0 b
1 o
2 m
3  
4 d
5 i
6 a


Mas nos aprofundaremos nisso na aula de manipulação de strings. Por ora, vamos nos focar nas listas.

As listas são mutáveis, então não só podemos adicionar elementos, como também removê-los e/ou mudar seus valores.

In [122]:
# Criando nova lista vazia:
lista = []
lista

[]

In [123]:
# Adicionando valores:
lista = lista + [1, 2, 3, 4, 5]
lista

[1, 2, 3, 4, 5]

In [124]:
# Modificando valores - seleção por índice e reatribuição:
lista[0] = "primeiro"
lista[2:4] = ["terceiro", "quarto"]
lista

['primeiro', 2, 'terceiro', 'quarto', 5]

In [125]:
# Removendo itens usando `del`
del lista[:2] # Removendo os dois primeiros elementos
lista

['terceiro', 'quarto', 5]

In [130]:
# Nota: os índices mudam ao se deletar elementos da lista.
print(lista[0])
print(lista[1])
print(lista[2])

terceiro
quarto
5


In [131]:
# Removendo itens por reatribuição
lista = lista[:-1] # Removendo o último elemento
lista

['terceiro', 'quarto']

### Métodos de listas 

Vamos dar uma olhada em quais métodos uma lista possui:

In [149]:
# Criando nova lista:
lista = [3, 1, 5, 7, 9, 6, 4, 2, 10, 8]

print(dir(lista))

['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']


Como podemos ver, há vários métodos para a classe `list`. Não iremos demonstrar todos.

#### list.sort()

Organiza a lista:
 - Alfabeticamente (listas alfanuméricas)
 - Sentido crescente (números)

In [150]:
print("Antes de organizar: {}".format(lista))
lista.sort()
print("Depois de organizar: {}".format(lista))

Antes de organizar: [3, 1, 5, 7, 9, 6, 4, 2, 10, 8]
Depois de organizar: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


#### list.append()

Adiciona um item ao fim de uma lista:

In [151]:
# Removendo a string "onze" 
lista.append("onze")
lista

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 'onze']

#### list.remove()

Remove um objeto da lista.

In [152]:
# Removendo a string "onze" 
lista.remove("onze")
lista

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

#### list.pop()

Remove um elemento pelo index.

In [153]:
# Removendo o número 6 (índex 5)
print(lista.pop(5)) # Retorna o número retirado
lista

6


[1, 2, 3, 4, 5, 7, 8, 9, 10]

#### list.insert()

Insere um elemento à lista no índice especificado. Sintaxe:

    list.insert(i, elem)

In [154]:
# Adicionando o número 6 no índice 5
lista.insert(5, 6)
lista

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

#### list.reverse()

Inverte a ordem dos elementos.

Nota: Ao contrário do fatiamento list[::-1], que só imprime a lista invertida na tela, o método `list.reverse()` altera a lista.

In [155]:
lista.reverse()
lista

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]

### Slicing ou métodos?

Como vocês podem ter percebido, o slicing pode ser usado para fazer praticamente tudo que os métodos fazem.

Então, o que usar? Métodos ou slicing?

Apesar do slicing ser mais versátil, ele perde em um quesito para os métodos: **legibilidade**.

Afinal, é muito mais simples e intuitivo entender a função de `list.reverse()` do que de `list[::-1]`, concordam?

Então, sempre que possível, dê preferência aos métodos.

E isso é tudo que precisamos saber sobre listas.

Lembre-se que, apesar de extremamente versáteis, elas são apenas um dos vários tipos de estruturas de dados que existem.

Outras estruturas de dados, como **dicionários** e **tuplas** são extremamente úteis no desenvolvimento de programas mais complexos, então pode ser interessante estudá-las caso se interessem pela área.

Forte abraço e até a próxima aula ;)