# Introdução à Programação para Ciência de Dados

### Aula 10: Listas II

**Professor:** Igor Malheiros

## Listas e Strings

Com os assuntos abordados nas últimas aulas, podemos concluir que strings e listas tem diversas similaridades. Como os dados são organizados, como os elementos são acessados, as operações possíveis e as funções disponíveis. Várias delas funcionam de forma muito parecida.

As duas estruturas não são iguais, mas podemos utilizar ambas para fazer operações mais complexas. Python fornece diversas funções nativas para podermos utilizar strings e listas, e assim, resolvermos problemas mais complexos.

### Função `split()`

Podemos utilizar a função `split()` para transformarmos um string do tipo `"Eu amo Python"` (com espaços) em uma lista de strings, onde cada elemento é uma palavra da frase `["Eu", "amo", "Python"]`.

Com essa lista, podemos acessar e utilizar qualquer uma das palavras (strings) em particular.

```Python
frase = "Eu amo Python"
palavras = frase.split()

print(palavras)

for palavra in palavras:
    print(palavra, "é uma palavra da frase")
```

- Essa função também separa se houver múltiplos espaços.

```Python
frase = "  Eu      amo    Python    "
palavras = frase.split()
print(palavras) # -> ["Eu", "amo", "Python"]
```

- Podemos definir o caractere (ou string) separador das strings passando como argumento da função `split()`.

```Python
frase_1 = "Eu amo Python"
palavras_1 = frase_1.split() # -> ["Eu", "amo", "Python"]
print(palavras_1)

frase_2 = "1+2+3+4+5"
palavras_2 = frase_2.split("+") # -> ["1", "2", "3", "4", "5"]
print(palavras_2)

frase_3 = "um, dois, três, quatro"
palavras_3 = frase_3.split(", ") # -> ["um", "dois", "três", "quatro"]
print(palavras_3)
```

In [19]:
# split() simples - "Eu amo Python"
frase_1 = "Eu amo Python"
palavras_1 = frase_1.split()
print(palavras_1)

for palavra in palavras_1:
    print(palavra, " é uma palavra")

['Eu', 'amo', 'Python']
Eu  é uma palavra
amo  é uma palavra
Python  é uma palavra


In [15]:
# split() com "+" - "1+2+3+4+5"
frase_2 = "1+2+3+4+5"
palavras_2 = frase_2.split("+")

print(palavras_2)


['1', '2', '3', '4', '5']


In [16]:
# split() com padrão ", " - "um, dois, três, quatro"
frase_3 = "um, dois, três, quatro"
palavras_3 = frase_3.split(", ")
print(palavras_3)

['um', 'dois', 'três', 'quatro']


### Função `join()`

Para fazer o processo inverso, transformar uma lista de strings em uma única string, utilizaremos a função `join()`. A função `join()` é uma função exclusiva de strings, por isso, para chamá-la utilizaremos o operador `.`.

A lógica aqui é diferente, por isso precisamos de **atenção!**. A string que chama a função `join()` significa o padrão que será inserido entre as strings da lista. Enquanto que a lista de strings é passada como argumento da função.

```Python
palavras_1 = ["1", "2", "3", "4", "5"]
frase_1 = "+".join(palavras_1) # -> "1+2+3+4+5"
print(frase_1)

palavras_2 = ["Eu", "amo", "Python"]
frase_2 =  " ".join(palavras_2) # -> "Eu amo Python"
print(frase_2)

palavras_3 = ["um", "dois", "três", "quatro"]
frase_3 =  ", ".join(palavras_3) # - > "um, dois, três, quatro"
print(frase_3)
```

In [20]:
# .join() para o "+" - ["1", "2", "3", "4", "5"]
palavras_1 = ["1", "2", "3", "4", "5"]
frase_1 = "+".join(palavras_1)
print(frase_1)

1+2+3+4+5


In [22]:
# .join() para o " " - ["Eu", "amo", "Python"]
palavras_2 = ["Eu", "amo", "Python"]
frase_2 = " ".join(palavras_2)
print(frase_2)

Eu amo Python


In [23]:
# .join() para o ", " - ["um", "dois", "três", "quatro"]
palavras_3 = ["um", "dois", "três", "quatro"]
frase_3 = ", ".join(palavras_3)
print(frase_3)

um, dois, três, quatro


## Compreensão de listas

Às vezes, construir uma simples lista pode tomar algumas linhas de código. Por exemplo, digamos que nós precisaremos criar uma lista com os números inteiros de $1$ até $1000$, qual seria a melhor forma?

</br></br></br></br></br></br></br></br></br>

```Python
lista = []
for i in range(1, 1001):
    lista.append(i)
```

</br></br>

E se para criar uma lista de números inteiros **pares** de $1$ até $1000$?

</br></br></br></br></br></br></br></br></br>

```Python
lista_pares = []
for i in range(1, 1001):
    if i % 2 == 0:
        lista_pares.append(i)
```

</br></br>

Python (e algumas outras linguagens de programação) suporta compreensão de lista (*list comprehensions*) que é uma forma concisa para se construir listas.

```Python
# list comprehension para números de 1 até 1000
lista = [i for i in range(1, 1001)]
```

- Com a simples sintaxe `[expressão for item in lista]`, podemos criar, dada uma primeira lista, uma nova lista fazendo algumas modificações em cada um dos elementos da lista antiga.

```Python
lista = [1, 2, 3, 4]

# list comprehension para [10, 20, 30, 40]
lista_vezes_dez = [i * 10 for i in lista]
```

- Podemos também filtrar os elementos que queremos colocar na nova lista com o comando `if`.

```Python
lista = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# list comprehension para [2, 4, 6, 8, 10]
lista_pares = [i for i in lista if i % 2 == 0]
```

In [28]:
# Criando listas com valores de 1 até 100
lista = [i for i in range(1, 101)]
    
print(lista)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100]


In [29]:
# Criando listas com valores multiplicados por 2
lista = [i*2 for i in range(1, 101)]
print(lista)

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200]


In [31]:
# Criando lista de números ímpares
lista = [i for i in range(1, 101) if i % 2 == 1]
print(lista)

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99]


## Representação em memória das listas

Normalmente, quando atribuímos o valor de uma variável em outra com os tipos mais simples de Python (inteiros, floats ou strings) ocorre uma cópia do valor armazenado de uma das variáveis para a outra.

```Python
x = 10
y = 10

"""
Representação da memória do computador:

 =====================         =====================
 |    |    |    |    |         |    |    |    |    |
 =====================    =>   =====================
 |    | 10 |    |    |         |    | 10 |    | 10 |
 =====================         =====================
        ^(x)                          ^(x)       ^(y)
"""



# Equivalente:
x = 10
y = x

"""
Representação da memória do computador:

 =====================         =====================
 |    |    |    |    |         |    |    |    |    |
 =====================    =>   =====================
 |    | 10 |    |    |         |    | 10 |    | 10 |
 =====================         =====================
        ^(x)                          ^(x)       ^(y)
"""
```

Porém, com as listas **não funciona da mesma forma!**. Não são feitas cópias dos valores, em vez disso é dado apenas outro **identificador** ao mesmo espaço em memória.

```Python
x = [1, 2, 3]
y = [1, 2, 3]

"""
Representação da memória do computador:

 ===============================      ===============================
 |         |         |         |      |         |         |         |
 ===============================  =>  ===============================
 | [1,2,3] |         |         |      | [1,2,3] |         | [1,2,3] |
 ===============================      ===============================
      ^(x)                                ^(x)                 ^(y)
"""

# Não é equivalente:
x = [1, 2, 3]
y = x

"""
Representação da memória do computador:

 ===============================      ===============================
 |         |         |         |      |         |         |         |
 ===============================  =>  ===============================
 | [1,2,3] |         |         |      | [1,2,3] |         |         |
 ===============================      ===============================
      ^(x)                                ^(x e y)
"""
```

### O que isso implica?

- Se temos dois identificadores e alteramos um elemento utilizando um identificador, isso é refletido no outro (ou outros) identificador.

```Python
x = [1, 2, 3, 4]
y = x
y[2] = 100

print(x) # -> [1, 2, 100, 4]
```

- Se utilizamos uma lista como argumento de uma função, o parâmetro é apenas um novo identificador para a posição de memória. Ou seja, **modificações da lista feitas dentro da função se persistem fora dela!**

```Python
def altera_elemento(lista, pos, valor):
    lista[pos] = valor
    

x = [1, 2, 3, 4]
altera_elemento(x, 2, 100)

print(x) # -> [1, 2, 100, 4]
```

Dessa forma, podemos utilizar funções sem retorno que modificam uma lista.

- Em listas muito grandes, copiar elemento por elemento pode ser muito custoso computacionalmente. Por isso, utilizar apenas um identificador é uma solução muito mais eficiente. Porém, ela é mais sujeita a erros e precisamos **estar atentos!**

In [32]:
# modificação sem persistir
x = [1, 2, 3, 4]
y = [1, 2, 3, 4]

y[2] = 100
print("x: ", x)
print("y: ", y)

x:  [1, 2, 3, 4]
y:  [1, 2, 100, 4]


In [33]:
# modificação persistindo
x = [1, 2, 3, 4]
y = x

y[2] = 100
print("x: ", x)
print("y: ", y)

x:  [1, 2, 100, 4]
y:  [1, 2, 100, 4]


In [35]:
# modificação em função sem retorno persistindo - altera_elemento(lista, pos, valor)
def altera_elemento(lista, pos, valor):
    lista[pos] = valor
    
x = [1, 2, 3, 4]
print(x)
altera_elemento(x, 2, 100)
print(x)

[1, 2, 3, 4]
[1, 2, 100, 4]


## Exercício 1

Faça um código que recebe uma string que será um sentimento. Em seguida você deve substituir a substring que indica o sentimento em `"Eu amo Python"` pela string digitada pelo usuário e imprimir a nova frase. O programa deve continuar substituindo a substring que indica o sentimento até que o usuário digite "parar".

In [38]:
frase = "Eu amo Python"

while True:
    sentimento = input()
    if sentimento == "parar":
        break
    
    palavras = frase.split() # ["Eu", "amo", "Python"]
    palavras[1] = sentimento # ["Eu", ????, "Python"]
    frase = " ".join(palavras) # "Eu ???? Python"
    print(frase)

odeio
Eu odeio Python
adoro
Eu adoro Python
parar


## Exercício 2

Gere uma lista com os $10$ primeiros quadrados perfeitos.

In [36]:
lista = [i*i for i in range(1, 11)]
print(lista)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
