# LIST COMPREHENSION

- Podemos criar uma lista a partir de outra lista com o que chamamos de <font color='red'>LIST COMPREHENSION</font>
- Vamos ver um exemplo com <font color='red'>FOR</font> para calcularmos o desvio padrão de uma listas de valores
- A fórmula do desvio padrão:
$$\sqrt{(\frac{\sum_{i = n}^{N}(x_i - \bar{x})^2}{n})}$$
- Onde:
    - $x_i$: é um valor da lista de dados
    - $\bar{x}$: é a média dos valores
    - $n$: quantidade de valores

In [1]:
# importando bibliotecas
import pandas as pd

# lendo dados
iris = pd.read_csv('data/iris.txt')

# transformando coluna qualquer em lista
coluna_escolhida = 'sepal_length'
lista_col_escolhida = list(iris.loc[:, coluna_escolhida])

In [2]:
# primeiro vamos calcular uma media e guardar em uma variavel
# vamos fazer tambem a contagem de quantos dados temos na lista
# ou seja o tamanho da lista
soma = 0
n_item = 0
for item in lista_col_escolhida:
    soma = soma + item 
    n_item = n_item + 1 
media_col_escolhida = soma / n_item

# precisamos calcular o quadrado das diferencas
# entre o valor e a media dos dados
# vamos fazer usando um loop for e o metodo append
lista_quad_dif = []
for item in lista_col_escolhida:
    quad_dif = (item - media_col_escolhida) ** 2
    lista_quad_dif.append(quad_dif)

# vamos obter o mesmo resultado acima
# mas usaremos uma list comprehension
# veja como e mais legivel
quad_dif_comp = [(x - media_col_escolhida) ** 2 for x in lista_col_escolhida]

# vamos verificar se as duas listas
# criadas realmente sao iguais
print(f'As duas listas criadas têm os mesmos valores? {lista_quad_dif == quad_dif_comp}')

As duas listas criadas têm os mesmos valores? True


## Exercícios
- List comprehensions são um jeito de fazermos um loop for mais "Pythonic", de um jeito mais legível
- Caso a gente precise criar uma lista a partir dos itens de outra, uma list comprehension já devolve uma lista, não precisamos usar o método append para isso
- Lembre-se, você pode decidir quando usar um ou outro, opte sempre pelo jeito que deixe seu código mais sucinto e claro

In [3]:
# importando bibliotecas
import pandas as pd

# lendo dados
iris = pd.read_csv('data/iris.txt')

# transformando coluna qualquer em lista
col_sepal_length = list(iris.loc[:, 'sepal_length'])
col_sepal_width = list(iris.loc[:, 'sepal_width'])

***
**Exercício 1**
- Elevando ao quadrado os itens de uma lista qualquer

In [4]:
# solucao com list comprehension
quadrados = [x ** 2 for x in col_sepal_length]

# solucao com loop for
quadrados_for = []
for item in col_sepal_length:
    quadrados_for.append(item ** 2)

# verificando se as duas listas tem os mesmos valores
print(f'As duas listas têm os mesmos valores? {quadrados == quadrados_for}')

As duas listas têm os mesmos valores? True


***
**Exercício 2**
- Multiplicando item por item de duas listas e guardando em outra

In [5]:
# solucao com list comprehension
mult_list = [x * y for x, y in zip(col_sepal_length, col_sepal_width)]

# solucao com loop for
mult_list_for = [] 
for x, y in zip(col_sepal_length, col_sepal_width):
    resultado = x * y
    mult_list_for.append(resultado)

# verificando se as duas listas tem os mesmos valores
print(f'As duas listas têm os mesmos valores? {mult_list == mult_list_for}')

As duas listas têm os mesmos valores? True


***
**Exercício 3**
- Da lista dada. Crie uma outra lista dos quadrados apenas dos números pares

In [6]:
lista_dada = list(range(1, 101))

# solucao com list comprehension
quad_pares = [x ** 2 for x in lista_dada if x % 2 == 0]

# solucao com loop for
quad_pares_for = []
for item in lista_dada:
    if (item % 2) == 0:
        quad_pares_for.append(item ** 2)

# verificando se as duas listas tem os mesmos valores
print(f'As duas listas têm os mesmos valores? {quad_pares == quad_pares_for}')

As duas listas têm os mesmos valores? True


***
**DESAFIO 1**
- Crie um dicionário que tenha três chaves:
    - 'setosa'
    - 'versicolor'
    - 'virginica'
- Os valores de cada chave devem ser listas com os dados/valores de sepal_length correspondente de cada espécie
- Há muitos jeitos de se fazer isso. Não existe um jeito certou ou errado, faça do seu jeito, mas tente não utilizar funções auxiliares. Treine sua lógica, ela será uma poderosa aliada.

In [7]:
# importando bibliotecas
import pandas as pd

# lendo dados
iris = pd.read_csv('data/iris.txt')

# vamos criar lsitas dataframe/tabela apenas com as colunas sepal_length e species
lista_sepal_length = list(iris.loc[:, 'sepal_length'])
lista_species = list(iris.loc[:, 'species'])

# ******************************************************
# ****A partir daqui nao usaremos funcoes auxiliares****
# ******************************************************


# Resolvendo tudo em apenas uma linha com COMPREHENSION
# Percebam que ficou confuso, mas deu certo
# Existem outras maneiras de fazer isso, tente criar outras solucoes
dict_species = {k: [x for x, y in zip(lista_sepal_length, lista_species) if y == k] for k in lista_species}

In [8]:
dict_species

{'setosa': [5.1,
  4.9,
  4.7,
  4.6,
  5.0,
  5.4,
  4.6,
  5.0,
  4.4,
  4.9,
  5.4,
  4.8,
  4.8,
  4.3,
  5.8,
  5.7,
  5.4,
  5.1,
  5.7,
  5.1,
  5.4,
  5.1,
  4.6,
  5.1,
  4.8,
  5.0,
  5.0,
  5.2,
  5.2,
  4.7,
  4.8,
  5.4,
  5.2,
  5.5,
  4.9,
  5.0,
  5.5,
  4.9,
  4.4,
  5.1,
  5.0,
  4.5,
  4.4,
  5.0,
  5.1,
  4.8,
  5.1,
  4.6,
  5.3,
  5.0],
 'versicolor': [7.0,
  6.4,
  6.9,
  5.5,
  6.5,
  5.7,
  6.3,
  4.9,
  6.6,
  5.2,
  5.0,
  5.9,
  6.0,
  6.1,
  5.6,
  6.7,
  5.6,
  5.8,
  6.2,
  5.6,
  5.9,
  6.1,
  6.3,
  6.1,
  6.4,
  6.6,
  6.8,
  6.7,
  6.0,
  5.7,
  5.5,
  5.5,
  5.8,
  6.0,
  5.4,
  6.0,
  6.7,
  6.3,
  5.6,
  5.5,
  5.5,
  6.1,
  5.8,
  5.0,
  5.6,
  5.7,
  5.7,
  6.2,
  5.1,
  5.7],
 'virginica': [6.3,
  5.8,
  7.1,
  6.3,
  6.5,
  7.6,
  4.9,
  7.3,
  6.7,
  7.2,
  6.5,
  6.4,
  6.8,
  5.7,
  5.8,
  6.4,
  6.5,
  7.7,
  7.7,
  6.0,
  6.9,
  5.6,
  7.7,
  6.3,
  6.7,
  7.2,
  6.2,
  6.1,
  6.4,
  7.2,
  7.4,
  7.9,
  6.4,
  6.3,
  6.1,
  7.7,
  6.3,
  