## **Python Essencial para Data Science**
**Prof. Dr. Samuel Martins (@hisamuka @xavecoding)** <br/>
xavecoding: https://youtube.com/c/xavecoding <br/><br/>

<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png" /></a><br />This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License</a>.

## Lists
Uma lista em Python representa uma **sequência de elementos _ordenados_**.

In [9]:
numeros_da_mega_sena = [20, 11, 60, 5, 44, 28]
numeros_da_mega_sena

[20, 11, 60, 5, 44, 28]

In [10]:
type(numeros_da_mega_sena)

list

A **ordenação** dos elementos refere-se a seus _posicionamentos_ na lista, ou seja, o primeiro elemento da lista é o 20, o segundo é o 11, e assim por diante. <br/>
A **ordem** dos valores/conteúdos é outra coisa.

In [None]:
# os índices da lista começam em 0 e vão até n-1, onde n é o número de elementos da lista (tamanho da lista)
numeros_da_mega_sena[3]

#### Listas vazias

In [12]:
lista_vazia_1 = []
lista_vazia_1

[]

In [13]:
lista_vazia_2 = list()
lista_vazia_2

[]

#### Listas podem ter elementos de _qualquer tipo_

In [15]:
planetas = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']
planetas

['Mercúrio',
 'Vênus',
 'Terra',
 'Marte',
 'Júpiter',
 'Saturno',
 'Urano',
 'Netuno']

In [16]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


#### Listas podem elementos de  _tipos diferentes_:

In [17]:
planetas_e_numeros = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 1, 2, 3.0]
planetas_e_numeros

['Mercúrio',
 'Vênus',
 'Terra',
 'Marte',
 'Júpiter',
 'Saturno',
 'Urano',
 'Netuno',
 1,
 2,
 3.0]

#### Podemos ter listas de listas

In [18]:
matriz = [
    [1, 2, 3],    # [0] ==> primeira linha da matriz
    [4, 5, 6],    # [1] ==> segunda linha da matriz
    [7, 8, 9],    # [2] ==> terceira linha da matriz
    [10, 11, 12]  # [3] ==> quarta linha da matriz
]

In [19]:
matriz

[[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]

In [20]:
matriz[0]  # imprime a primeira linha da matriz

[1, 2, 3]

In [21]:
type(matriz)

list

In [22]:
type(matriz[0])

list

In [27]:
# trecho de código que imprime a matriz de um jeito mais "bonitinho"
for linha in matriz:
    print(linha)  # linha é uma lista de elementos

[1, 2, 3]
[4, 5, 6]
[7, 8, 9]
[10, 11, 12]


In [26]:
matriz[1][2]  # arcessa o elemento que está na linha 1, coluna 2 da matriz

6

### Indexação

Cada elemento de uma lista é indexado a uma posição. <br/>
Podemos acessar um elemento passando seu índice com []:

In [39]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [40]:
planetas[0]

'Mercúrio'

In [42]:
planetas[2]

'Terra'

In [44]:
# checa o tamanho da lista (o número de elementos da lista)
len(planetas)

8

In [45]:
planetas[7]

'Netuno'

In [46]:
planetas[8]

IndexError: list index out of range

Listas em Python suportam **índices negativos**, cuja ordem de indexação é o contrário, começando do final para o início:

In [47]:
planetas[-1]  # acessando o último elemento da lista

'Netuno'

In [48]:
planetas[-2]  # acessando o penúltimo elemento da lista

'Urano'

Podemos também acessar o _último elemento_ da lista desta maneira:

In [49]:
len(planetas)

8

In [50]:
planetas[len(planetas) - 1]

'Netuno'

Inline-style: 
![](./imagens/exemplo_lista_indices.png)

### Slicing (fatiamento)
Podemos retornar **uma cópia** dos elementos de um **intervalo contínuo** de uma lista. 

In [53]:
# Quais são os 3 primeiros elementos (planetas) da nossa lista?
planetas[0:3]  # 0:3 ==> gera o intervalo [0, 3) ===> [0, 1, 2]

['Mercúrio', 'Vênus', 'Terra']

`planetas[0:3]` é nosso jeito de consultar os elementos da lista `planetas` do índice 0 até o índice 3 (sem incluí-lo).

#### Entendendo os índices de um Intervalo
Um intervalo em python sempre **inclui** o número passado como **limite inferior** e *exclui* o número do *limite superior* do intervalo.

`[10:15]` são os números do intervalo [10, 15), ou seja, [10, 11, 12, 13, 14]

#### De volta ao slicing

Os índices iniciais e finais do intervalo do _slicing_ são **opcionais**.

Se não informarmos o _índice inicial_, o valor 0 é assumido:

In [54]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [55]:
# Quais são os 3 primeiros elementos (planetas) da nossa lista?
planetas[:3]  # retorna os elements do intervalo [0, 3) ==> [0, 1, 2]

['Mercúrio', 'Vênus', 'Terra']

Se ignorarmos o _índice final_, é assumido o _tamanho da lista_ `len(lista)`:

In [56]:
# retorna todos os elementos do intervalo [3, len(planetas)) ==> 3, 4, 5, 6, 7
# outra forma de pensar, considera todos os elementos da lista a partir do índice [3] em diante
planetas[3:]

['Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']

Podemos também fazer o slicing com **índices negativos**:

In [57]:
# 1:-1 ==> [1, -1) ==> [1, len(planetas)-1) ==> [1, 7)
planetas[1:-1]

['Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano']

`planetas[1:-1]` considera o intervalo que vai do índice [1], o **incluindo**, até o índice [-1] ou [len(planetas) - 1], no exemplo é o índice [7], o **excluindo**. <br/>
Portanto, o intervalo retornado contém os índices [1, 2, 3, 4, 5, 6].

<br/>

Outro exemplo:

In [58]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [59]:
planetas[-3:]

['Saturno', 'Urano', 'Netuno']

Vamos entender o intervalo `[-3:]`.

O índice `[-3]` corresponde ao índice `[len(planetas) - 3]`, ou seja, o índice `[5]`. <br/>
Portanto, `[-3:]` é sinônonimo de `[5:]`.

Ao omitir o último índice do intervalo, consideramos por padrão `len(planetas)`, que é 8. <br/>
Logo, `[-3:]` é o mesmo que `[5:8]`, que resulta nos índices `[5, 6, 7]`, que são os índices dos 3 últimos elementos dessa lista.

#### Os elementos retornados pelo Slicing de Listas a uma variável são CÓPIAS

In [60]:
ultimos_planetas = planetas[-3:]
print(ultimos_planetas)
print(planetas)

['Saturno', 'Urano', 'Netuno']
['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [62]:
ultimos_planetas[0] = 'Brasil'
print(ultimos_planetas)
print(planetas)

['Brasil', 'Urano', 'Netuno']
['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


#### Alteração de Múltiplos elementos de uma Lista via Slicing

In [65]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [67]:
# planetas[-3] = 'Brasil'
# planetas[-2] = 'Holanda'
# planetas[-1] = 'Italia'

## alternativamente
planetas[-3:] = ['Brasil', 'Holanda', 'Italia']
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Brasil', 'Holanda', 'Italia']


<br/>

Se o **número de elementos atribuídos for DIFERENTE do número de elementos do slicing**, os elementes excedentos ou faltantes da lista são ignorados ===> TOME CUIDADO

In [69]:
planetas[1:4] = ['Japão']
print(planetas)

['Mercúrio', 'Japão', 'Júpiter', 'Brasil', 'Holanda', 'Italia']


### For-each em Listas
Como mostrado no notebook anterior, podemos iterar elementos em uma lista:

In [70]:
planetas = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']
planetas

['Mercúrio',
 'Vênus',
 'Terra',
 'Marte',
 'Júpiter',
 'Saturno',
 'Urano',
 'Netuno']

In [71]:
for planeta in planetas:
    print(f'planeta = {planeta}')

planeta = Mercúrio
planeta = Vênus
planeta = Terra
planeta = Marte
planeta = Júpiter
planeta = Saturno
planeta = Urano
planeta = Netuno


In [72]:
# queremos iterar no intervalo [1, 4)
for planeta in planetas[1:4]:
    print(f'planeta = {planeta}')

planeta = Vênus
planeta = Terra
planeta = Marte


No `for`, podemos também recuperar o **índice** e o *elemento* de uma lista, basta usarmos o comando `enumerate`:

<code>
    for i, elemento in enumerate(lista):
        intrução 01
        ....
</code>

In [76]:
for i, plan in enumerate(planetas):
    print(f'planeta[{i}] = {plan}, {planetas[i]}')

planeta[0] = Mercúrio, Mercúrio
planeta[1] = Vênus, Vênus
planeta[2] = Terra, Terra
planeta[3] = Marte, Marte
planeta[4] = Júpiter, Júpiter
planeta[5] = Saturno, Saturno
planeta[6] = Urano, Urano
planeta[7] = Netuno, Netuno


In [80]:
# planetas[1:4] ==> gera uma nova lista com os elementos dos índice 1, 2, 3 da lista planetas
# os elementos desta nova lista estão indexados a partir do 0

for i, plan in enumerate(planetas[1:4]):
    print(f'planeta[{i}] = {plan}')

planeta[0] = Vênus
planeta[1] = Terra
planeta[2] = Marte


In [81]:
for i in range(1, 4):
    print(f'planeta[{i}] = {planetas[i]}')

planeta[1] = Vênus
planeta[2] = Terra
planeta[3] = Marte


### Funções de Listas

In [82]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


`len` retorna o tamanho de uma lista (número de elementos)

In [83]:
len(planetas)

8

`min` retorna o menor elemento de uma lista

In [84]:
lista_de_numeros = [10, 5, 20, 2]
min(lista_de_numeros)

2

In [86]:
# no caso de uma lista de strings, retorna o 'menor' elemento em ordem alfabética
min(planetas)

'Júpiter'

`max` retorna o maior elemento de uma lista

In [87]:
max(lista_de_numeros)

20

In [88]:
# no caso de uma lista de strings, retorna o 'maior' elemento em ordem alfabética
max(planetas)

'Vênus'

`sum` retorna a soma de elementos de uma lista

In [89]:
# soma = 0
# for num in lista_de_numeros:
#     soma += num

## alternativamente
sum(lista_de_numeros)

37

### Métodos de Listas

`list.append` modifica uma lista adicionando um item (de qualquer tipo) no final.

In [90]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [91]:
planetas.append('Plutão')
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


`list.pop` remove e retorna o último elemento da lista:

In [92]:
ultimo_planeta = planetas.pop()
print(ultimo_planeta)
print(planetas)

Plutão
['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [93]:
segundo_planeta = planetas.pop(1)
print(segundo_planeta)
print(planetas)

Vênus
['Mercúrio', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


`reverse` reverte a ordem dos elementos da lista.

In [98]:
planetas = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [99]:
planetas.reverse()  # reverte os elementos da lista planeta (in place, ou seja, reverte a própria lista)
print(planetas)

['Netuno', 'Urano', 'Saturno', 'Júpiter', 'Marte', 'Terra', 'Vênus', 'Mercúrio']


O possível problema é que a **própria lista** é revertida. <br>
Caso você deseje ter uma **cópia revertida** da lista:

In [100]:
planetas = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [101]:
planetas_revertidos = list(planetas)  # faz uma cópia da lista de planetas
planetas_revertidos.reverse()

print(planetas)
print(planetas_revertidos)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']
['Netuno', 'Urano', 'Saturno', 'Júpiter', 'Marte', 'Terra', 'Vênus', 'Mercúrio']


#### Ordenação de listas

`sorted` retorna uma versão **ordernada (em ordem crescente)** de uma lista (NÃO ALTERA A LISTA ATUAL)

In [102]:
lista_de_numeros

[10, 5, 20, 2]

In [105]:
lista_de_numeros_ordenada = sorted(lista_de_numeros)

print(lista_de_numeros)
print(lista_de_numeros_ordenada)

[10, 5, 20, 2]
[2, 5, 10, 20]


In [106]:
planetas_ordem_alfabetica = sorted(planetas)

print(planetas)
print(planetas_ordem_alfabetica)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']
['Júpiter', 'Marte', 'Mercúrio', 'Netuno', 'Saturno', 'Terra', 'Urano', 'Vênus']


##### Para ordernar em **ordem descrente**

In [107]:
lista_de_numeros_ordem_reversa = sorted(lista_de_numeros)  # ordena em ordem crescente
lista_de_numeros_ordem_reversa.reverse()

print(f'lista_de_numeros = {lista_de_numeros}')
print(f'lista_de_numeros_ordenada = {lista_de_numeros_ordenada}')
print(f'lista_de_numeros_ordem_reversa = {lista_de_numeros_ordem_reversa}')

lista_de_numeros = [10, 5, 20, 2]
lista_de_numeros_ordenada = [2, 5, 10, 20]
lista_de_numeros_ordem_reversa = [20, 10, 5, 2]


In [108]:
planetas_ordem_alfabetica_reversa = sorted(planetas)
planetas_ordem_alfabetica_reversa.reverse()

print(f'planetas = {planetas}')
print(f'planetas_ordem_alfabetica = {planetas_ordem_alfabetica}')
print(f'planetas_ordem_alfabetica_reversa = {planetas_ordem_alfabetica_reversa}')

planetas = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']
planetas_ordem_alfabetica = ['Júpiter', 'Marte', 'Mercúrio', 'Netuno', 'Saturno', 'Terra', 'Urano', 'Vênus']
planetas_ordem_alfabetica_reversa = ['Vênus', 'Urano', 'Terra', 'Saturno', 'Netuno', 'Mercúrio', 'Marte', 'Júpiter']


#### Buscando elementos em uma lista

`list.index` retorna o índice de um dado elemento da lista, ou lança uma exception caso ele não esteja presente na lista.

In [109]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']


In [110]:
# qual é o índice do elemento 'Marte'?
planetas.index('Marte')

3

In [111]:
# qual é o índice do elemento 'Brasil'? ==> lançar (raise) exception
planetas.index('Brasil')

ValueError: 'Brasil' is not in list

Outra alternativa melhor para saber se **uma lista contém ou não um dado elemento**, sem o lançamento de exception, é usar o `in`:

In [112]:
'Marte' in planetas

True

In [113]:
'Brasil' in planetas

False

Podemos ainda usar o `not in` para checar se a lista **não possui um dado elemento**:

In [114]:
'Brasil' not in planetas

True

#### Concatenando listas
Suponha que desejamos juntar/concatenar duas listas em uma só. <br/>
Podemos tentar usar o método `append`, pois ele adiciona um dado elemento ao final da lista.
Vejamos:

In [115]:
cidades_grande_sp = ['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano']
cidades_interior_sp = ['Pompéia', 'Campinas', 'Hortolândia']

print(cidades_grande_sp)
print(cidades_interior_sp)

['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano']
['Pompéia', 'Campinas', 'Hortolândia']


In [117]:
# ALTERNATIVA 1
cidades_estado_sp = cidades_grande_sp + cidades_interior_sp
print(cidades_estado_sp)

['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano', 'Pompéia', 'Campinas', 'Hortolândia']


In [119]:
# ALTERNATIVA 2 ==> NÃO FUNCIONA COMO ESPERADO
cidades_estado_sp = list(cidades_grande_sp)  # copia a cidades_grande_sp
cidades_estado_sp.append(cidades_interior_sp)

In [120]:
print(cidades_estado_sp)

['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano', ['Pompéia', 'Campinas', 'Hortolândia']]


Note que a a lista `cidades_estado_sp` tem agora alguns elementos que são _strings_, e o último elemento é uma _lista_. <br/>
O que queremos, na verdade, é ter uma lista **apenas com _strings_**.

Para isso, podemo usar o método `lista.extend(lista_2)` que vai copiar todos os elementos dentro da lista `lista_2` e colocá-los no final da lista `lista`.

In [122]:
# ALTERNATIVA 3
cidades_estado_sp = list(cidades_grande_sp)  # copia a cidades_grande_sp
cidades_estado_sp.extend(cidades_interior_sp)

In [123]:
print(cidades_estado_sp)

['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano', 'Pompéia', 'Campinas', 'Hortolândia']


### List Comprehensions
É uma forma curta de se criar listas.

**Ex 1)** Suponha que queremos criar uma lista cujo valor do índice [i] é i^2 (o índice ao quadrado). <br/>
Uma forma padrão seria:

In [125]:
# [0, 1, 4, 9, ...]

quadrados = []

for i in range(10):
    quadrados.append(i ** 2)

print(quadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


In [127]:
quadrados = list(range(10))
print(f'ANTES: {quadrados}')


for i, num in enumerate(quadrados):
    quadrados[i] = num ** 2

print(f'DEPOIS: {quadrados}')

ANTES: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
DEPOIS: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Usando o **list comprehensions**:

In [129]:
quadrados = [i**2 for i in range(10)]
print(quadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


**Ex 2)** Filtrando os elementos negativos de uma lista:

In [131]:
lista_de_numeros = [10, -2, 25, -5, 99, 1]

# ALTERNATIVA 1
lista_de_numeros_positivos = []
for num in lista_de_numeros:
    if num >= 0:
        lista_de_numeros_positivos.append(num)

print(lista_de_numeros_positivos)

[10, 25, 99, 1]


In [133]:
lista_de_numeros = [10, -2, 25, -5, 99, 1]

# ALTERNATIVA 2
lista_de_numeros_positivos = [num for num in lista_de_numeros if num >= 0]
print(lista_de_numeros_positivos)

[10, 25, 99, 1]


Outra maneira de aplicar funções a listas é usar **lambda functions**.

**Ex 3) Map e Lambda functions**:

In [135]:
lista_de_numeros = list(range(10))
print(lista_de_numeros)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [136]:
def power_of_2(x):
    return x ** 2

In [138]:
quadrados = list(map(power_of_2, lista_de_numeros))
print(quadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


**Lambda fuction**: Funções anônimas que podem receber qualquer número de parâmetros mas **pode apenas ter UMA única expressão**.

In [141]:
quadrados_2 = list(map(lambda x: x ** 2, lista_de_numeros))
print(quadrados_2)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
