## **Python Essencial para Data Science**
**Prof. Dr. Samuel Martins (@hisamuka @xavecoding)** <br/>
xavecoding: https://youtube.com/c/xavecoding <br/><br/>

<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png" /></a><br />This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License</a>.

## Lists
Uma lista em Python representa uma **sequência de elementos _ordenados_**.

In [11]:
megasena = [20, 11, 60, 5, 44, 28]
megasena

[20, 11, 60, 5, 44, 28]

In [12]:
type(megasena)

list

A **ordenação** dos elementos refere-se a seus _posicionamentos_ na lista, ou seja, o primeiro elemento da lista é o 20, o segundo é o 11, e assim por diante. <br/>
A **ordem** dos valores/conteúdos é outra coisa.

In [14]:
# Os índices de uma lista de tamanho n são de 0 a n-1
megasena[3]

5

#### Listas vazias

In [15]:
lista_vazia_1 = []
lista_vazia_1

[]

In [16]:
lista_vazia_2 = list()
lista_vazia_2

[]

#### Listas podem ter elementos de _qualquer tipo_

In [93]:
planetas = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']
planetas

['Mercúrio',
 'Vênus',
 'Terra',
 'Marte',
 'Júpiter',
 'Saturno',
 'Urano',
 'Netuno',
 'Plutão']

In [18]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


#### Listas podem ter elementos de _tipos diferentes_:

In [19]:
planetas_e_numeros = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão', 1, 2, 3.0]
planetas_e_numeros

['Mercúrio',
 'Vênus',
 'Terra',
 'Marte',
 'Júpiter',
 'Saturno',
 'Urano',
 'Netuno',
 'Plutão',
 1,
 2,
 3.0]

#### Podemos ter listas de listas

In [31]:
matriz = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9],
    [10, 11, 12]
]
matriz

[[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]

In [32]:
matriz[0]

[1, 2, 3]

In [33]:
type(matriz)

list

In [34]:
type(matriz[0])

list

In [35]:
for linha in matriz:
    print(linha)

[1, 2, 3]
[4, 5, 6]
[7, 8, 9]
[10, 11, 12]


In [36]:
matriz[1][2] # acessa o elemento da linha 1, coluna 2 da matriz

6

### Indexação

Cada elemento de uma lista é indexado a uma posição. <br/>
Podemos acessar um elemento passando seu índice com []:

In [38]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


In [39]:
planetas[0]

'Mercúrio'

In [40]:
planetas[2]

'Terra'

In [42]:
# tamanho da lista (número de elementos)
len(planetas)

9

In [43]:
planetas[8]

'Plutão'

In [44]:
planetas[9]

IndexError: list index out of range

Listas em Python suporta **índices negativos**, cuja ordem de indexação é o contrário, começando do final para o início:

In [47]:
planetas[-1] # último elemento da lista

'Plutão'

In [48]:
planetas[-2] # penúltimo elemento

'Netuno'

Podemos também acessar o _último elemento_ da lista desta maneira:

In [49]:
planetas[len(planetas) - 1]

'Plutão'

In [50]:
planetas[-len(planetas)]

'Mercúrio'

Inline-style: 
![](../imagens/exemplo_lista_indices.png)

### Slicing (fatiamento)
Podemos retornar **uma cópia** dos elementos de um **intervalo contínuo** de uma lista. 

In [56]:
# Quais 3 primeiros elementos da lista?
planetas[0:3] # Intervalo [0, 3) ==> [0, 1, 2]

['Mercúrio', 'Vênus', 'Terra']

`planetas[0:3]` é nosso jeito de consultar os elementos da lista `planetas` do índice 0 até o índice 3 (sem incluí-lo).

#### Entendendo os índices de um Intervalo
Um intervalo em python sempre **inclui** o número passado como **limite inferior** e *exclui* o número do *limite superior* do intervalo.

`[10:15]` são os números do intervalo [10, 15), ou seja, [10, 11, 12, 13, 14]

#### De volta ao slicing

Os índices iniciais e finais do intervalo do _slicing_ são **opcionais**.

Se não informarmos o _índice inicial_, o valor 0 é assumido:

In [60]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


In [62]:
planetas[:3] # Intervalo [0, 3)

['Mercúrio', 'Vênus', 'Terra']

Se ignorarmos o _índice final_, é assumido o _tamanho da lista_ `len(lista)`:

In [65]:
planetas[3:] # intervalo [3,len(planetas))

['Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']

Podemos também fazer o slicing com **índices negativos**:

In [68]:
# [1,-1) ==> [1, len(planetas) - 1) ==> [1, 8)
planetas[1:-1]

['Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno']

`planetas[1:-1]` considera o intervalo que vai do índice [1], o **incluindo**, até o índice [-1] ou [len(planetas) - 1], no exemplo é o índice [7], o **excluindo**. <br/>
Portanto, o intervalo retornado contém os índices [1, 2, 3, 4, 5, 6].

<br/>

Outro exemplo:

In [69]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


In [80]:
planetas[-3:]

['Urano', 'Netuno', 'Plutão']

Vamos entender o intervalo `[-3:]`.

O índice `[-3]` corresponde ao índice `[len(planetas) - 3]`, ou seja, o índice `[5]`. <br/>
Portanto, `[-3:]` é sinônonimo de `[5:]`.

Ao omitir o último índice do intervalo, consideramos por padrão `len(planetas)`, que é 8. <br/>
Logo, `[-3:]` é o mesmo que `[5:8]`, que resulta nos índices `[5, 6, 7]`, que são os índices dos 3 últimos elementos dessa lista.

#### Os elementos retornados pelo Slicing de Listas a uma variável são CÓPIAS

In [94]:
ultimos_planetas = planetas[-3:]
print(ultimos_planetas)
print(planetas)

['Urano', 'Netuno', 'Plutão']
['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


In [95]:
ultimos_planetas[0] = 'Outra coisa'
print(ultimos_planetas)
print(planetas)

['Outra coisa', 'Netuno', 'Plutão']
['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


#### Alteração de Múltiplos elementos de uma Lista via Slicing

In [96]:
planetas[-3:] = ['Coisa nova', 'Mais uma coisa', 'Ainda outra']
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Coisa nova', 'Mais uma coisa', 'Ainda outra']


<br/>

Se o **número de elementos atribuídos for DIFERENTE do número de elementos do slicing**, os elementos excedentes ou faltantes da lista são ignorados ===> TOME CUIDADO

In [115]:
planetas[1:4] = ['Uma coisa só']
print(planetas)

['Mercúrio', 'Uma coisa só']


### For-each em Listas
Como mostrado no notebook anterior, podemos iterar elementos em uma lista:

In [161]:
planetas = ['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']
planetas

['Mercúrio',
 'Vênus',
 'Terra',
 'Marte',
 'Júpiter',
 'Saturno',
 'Urano',
 'Netuno',
 'Plutão']

In [120]:
for planeta in planetas:
    print(f'planeta = {planeta}')

planeta = Mercúrio
planeta = Vênus
planeta = Terra
planeta = Marte
planeta = Júpiter
planeta = Saturno
planeta = Urano
planeta = Netuno
planeta = Plutão


In [121]:
#iterar no intervalo [1,4) da lista
for planeta in planetas[1:4]:
    print('planeta =', planeta)

planeta = Vênus
planeta = Terra
planeta = Marte


No `for`, podemos também recuperar o **índice** e o *elemento* de uma lista, basta usarmos o comando `enumerate`:

```python
    for i, elemento in enumerate(lista):
        intrução 01
        ....
```

In [133]:
list(enumerate(planetas))

[(0, 'Mercúrio'),
 (1, 'Vênus'),
 (2, 'Terra'),
 (3, 'Marte'),
 (4, 'Júpiter'),
 (5, 'Saturno'),
 (6, 'Urano'),
 (7, 'Netuno'),
 (8, 'Plutão')]

In [131]:
for i, p in enumerate(planetas):
    print(f'planeta[{i}] = {p} [OU] {planetas[i]}')

planeta[0] = Mercúrio [OU] Mercúrio
planeta[1] = Vênus [OU] Vênus
planeta[2] = Terra [OU] Terra
planeta[3] = Marte [OU] Marte
planeta[4] = Júpiter [OU] Júpiter
planeta[5] = Saturno [OU] Saturno
planeta[6] = Urano [OU] Urano
planeta[7] = Netuno [OU] Netuno
planeta[8] = Plutão [OU] Plutão


In [142]:
# planetas[2:5] ==> gera uma nova lista com os elementos de índice 2, 3, 4 da lista planetas
# os elementos dessa nova lista estão indexados a partir do 0
for i, p in enumerate(planetas[2:5]):
    print(f'planeta[{i}] = {p}')

planeta[0] = Terra
planeta[1] = Marte
planeta[2] = Júpiter


In [143]:
for i in range(2, 5):
    print(f'planeta[{i}] = {planetas[i]}')

planeta[2] = Terra
planeta[3] = Marte
planeta[4] = Júpiter


In [145]:
for i, p in enumerate(planetas[2:5], start=2):
    print(f'planeta[{i}] = {p}')

planeta[2] = Terra
planeta[3] = Marte
planeta[4] = Júpiter


### Funções de Listas

In [147]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


`len` retorna o tamanho de uma lista (número de elements)

In [148]:
len(planetas)

9

`min` retorna o menor elemento de uma lista

In [150]:
numeros = [23, 53, 6, 1356]
min(numeros)

6

In [152]:
# "menor elemento" em ordem alfabética
min(planetas)

'Júpiter'

`max` retorna o maior elemento de uma lista

In [153]:
max(numeros)

1356

In [154]:
max(planetas)

'Vênus'

`sum` retorna a soma de elementos de uma lista

In [155]:
sum(numeros)

1438

### Métodos de Listas

`list.append` modifica uma lista adicionando um item (de qualquer tipo) no final.

In [165]:
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


In [166]:
planetas.append('Pós plutão')
print(planetas)

['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão', 'Pós plutão']


`list.pop` remove e retorna o último elemento da lista:

In [167]:
removido = planetas.pop()
print(removido)
print(planetas)

Pós plutão
['Mercúrio', 'Vênus', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


In [168]:
segundo_planeta = planetas.pop(1)
print(segundo_planeta)
print(planetas)

Vênus
['Mercúrio', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


`reverse` reverte a ordem dos elementos da lista.

In [178]:
# Reverte a lista in place
planetas.reverse()
print(planetas)

['Plutão', 'Netuno', 'Urano', 'Saturno', 'Júpiter', 'Marte', 'Terra', 'Mercúrio']


O possível problema é que a **própria lista** é revertida. <br>
Caso você deseje ter uma **cópia revertida** da lista:

In [181]:
planetas_revertidos = list(planetas) # faz uma cópia da lista original
planetas_revertidos.reverse()

print(planetas)
print(planetas_revertidos)

['Plutão', 'Netuno', 'Urano', 'Saturno', 'Júpiter', 'Marte', 'Terra', 'Mercúrio']
['Mercúrio', 'Terra', 'Marte', 'Júpiter', 'Saturno', 'Urano', 'Netuno', 'Plutão']


#### Ordenação de listas

`sorted` retorna uma versão **ordernada (em ordem crescente)** de uma lista (NÃO ALTERA A LISTA ATUAL)

In [182]:
numeros

[23, 53, 6, 1356]

In [186]:
numeros_ordenados = sorted(numeros)
print(numeros)
print(numeros_ordenados)

[23, 53, 6, 1356]
[6, 23, 53, 1356]


In [187]:
planetas_ordenados = sorted(planetas)
print(planetas)
print(planetas_ordenados)

['Plutão', 'Netuno', 'Urano', 'Saturno', 'Júpiter', 'Marte', 'Terra', 'Mercúrio']
['Júpiter', 'Marte', 'Mercúrio', 'Netuno', 'Plutão', 'Saturno', 'Terra', 'Urano']


##### Para ordernar em **ordem descrente**

In [189]:
numeros_ordem_reversa = sorted(numeros)
numeros_ordem_reversa.reverse()

print(numeros)
print(numeros_ordenados)
print(numeros_ordem_reversa)

[23, 53, 6, 1356]
[6, 23, 53, 1356]
[1356, 53, 23, 6]


In [191]:
planetas_reverso = sorted(planetas, reverse=True)
print(planetas_reverso)

['Urano', 'Terra', 'Saturno', 'Plutão', 'Netuno', 'Mercúrio', 'Marte', 'Júpiter']


#### Buscando elementos em uma lista

`list.index` retorna o índice de um dado elemento da lista, ou lança uma exception caso ele não esteja presente na lista.

In [192]:
print(planetas)

['Plutão', 'Netuno', 'Urano', 'Saturno', 'Júpiter', 'Marte', 'Terra', 'Mercúrio']


In [193]:
# Indice do elemento 'Urano'
planetas.index('Urano')

2

In [194]:
planetas.index('Não existe')

ValueError: 'Não existe' is not in list

Outra alternativa melhor para saber se **uma lista contém ou não um dado elemento**, sem o lançamento de exception, é usar o `in`:

In [195]:
'Urano' in planetas

True

In [196]:
'Fandango' in planetas

False

Podemos ainda usar o `not in` para checar se a lista **não possui um dado elemento**:

In [197]:
'Qualquer coisa' not in planetas

True

#### Concatenando listas
Suponha que desejamos juntar/concatenar duas listas em uma só. <br/>
Podemos tentar usar o método `append`, pois ele adiciona um dado elemento ao final da lista.
Vejamos:

In [200]:
cidades_sp = ['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano']
cidades_interior = ['Campinas', 'Manduri', 'Santa Rita']

print(cidades_sp)
print(cidades_interior)

['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano']
['Campinas', 'Manduri', 'Santa Rita']


In [203]:
# Alternativa #1
cidades = cidades_sp + cidades_interior
print(cidades)

['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano', 'Campinas', 'Manduri', 'Santa Rita']


In [207]:
# Alternativa que não funciona como esperado (append)
cidades = list(cidades_sp) # copia a primeira lista
cidades.append(cidades_interior)
print(cidades)

['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano', ['Campinas', 'Manduri', 'Santa Rita']]


Note que a a lista `cidades_estado_sp` tem agora alguns elementos que são _strings_, e o último elemento é uma _lista_. <br/>
O que queremos, na verdade, é ter uma lista **apenas com _strings_**.

Para isso, podemo usar o método `lista.extend(lista_2)` que vai copiar todos os elementos dentro da lista `lista_2` e colocá-los no final da lista `lista`.

In [210]:
cidades = list(cidades_sp)
cidades.extend(cidades_interior)
print(cidades)

['São Paulo', 'Santo André', 'São Bernardo', 'São Caetano', 'Campinas', 'Manduri', 'Santa Rita']


### List Comprehensions
É uma forma curta de se criar listas.

**Ex 1)** Suponha que queremos criar uma lista cujo valor do índice [i] é i^2 (o índice ao quadrado). <br/>
Uma forma padrão seria:

In [212]:
# [0, 1, 4, 9, ...]
quadrados = []
for i in range(10):
    quadrados.append(i**2)

print(quadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


In [213]:
quadrados = list(range(10))
for i, num in enumerate(quadrados):
    quadrados[i] = num**2

print(quadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Usando o **list comprehensions**:

In [214]:
quadrados = [i**2 for i in range(10)]
print(quadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


**Ex 2)** Filtrando os elementos negativos de uma lista:

In [219]:
numeros = [10, 2, 25, -5, 99, -56, 27]

# Jeito "normal"
positivos = []
for num in numeros:
    if num >= 0:
        positivos.append(num)
        
print(positivos)

[10, 2, 25, 99, 27]


In [221]:
# Jeito "Pythonic"
positivos = [num for num in numeros if num >= 0]
print(positivos)

[10, 2, 25, 99, 27]


Outra maneira de aplicar funções a listas é usar **lambda functions**.

**Ex 3) Map e Lambda functions:**

In [224]:
numeros = list(range(10))
print(numeros)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [225]:
def potencia_2(x):
    return x**2

In [233]:
quadrados = list(map(potencia_2, numeros))
print(quadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


**Lambda function:** Funções anônimas que podem receber qualquer número de parâmetros mas **pode apenas ter UMA única expressão**


In [232]:
quadrados = list(map(lambda x: x ** 2, numeros))
print(quadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
