# Aula 9 *comprehension* e *modulos*

<img  src= "img/librarie.png" style="width:500px; height:500px">

Nesta aula vamos tratar a sintaxe para `comprehension` (uma tradução livre dessa expressão seria compreensão, porém isso não faz sentido) e vamos iniciar a discussão de módulos e bibliotecas (também conhecidos como pacotes).
1. Definição de `comprehension`;
1. Comprehension em Python
  - List comprehension;
  - Dict comprehension;
  - set comprehension;
  - generator comprehension
1. Módulos;
1. Pacotes ou Bibliotecas (Packages or Libraries);
1. Instalação de pacotes.
___

## Definição

Comprehension é uma estrutura sintática disponível em algumas linguagens de programação para criar uma lista (ou qualquer outra collection) a partir de uma expressão e um iterável. Em Python, essa estrutura substitui os `loop for`, é mais performática, e se recomenda a sua implementação para criar códigos mais Pythonicos.

A sintaxe para criar um comprehension é:

`expression for item in iterable`

Onde:
- **expression** é qualquer sintaxe que queiramos executar (funções, funções anônimas, ou outras comprehension);
- **item** é um elemento do iterável;
- **iterable** é qualquer objeto que possa ser iterado (`list`, `tuple`, `dict`, `range`, `str`, `collections`, etc).

Exemplo:
```
(item**2)/(sin(item) + cos(item)) for item in range(1, 361)
```
Neste caso:
- **(item ** 2)/(sin(item)+ cos(item))** é nossa expressão a ser avaliada;
- **item** é um elemento do iterável que será avalido na expressão;
- **range(1, 361)** é o iterável.
---

## Comprehension em Python

Python conta com 4 estruturas de comprehension, sendo:
- lista comprehension ou `list comprehension`;
- dicionário comprehension ou `dict comprenhesion`;
- conjunto comprehension ou `set comprehension`;
- geradores comprehension ou `generators comprehension`.

Note que nós não falamos de tuple comprehension, esse conceito em Python não existe.

---

### List comprehension

Para criar uma List comprehension utilizamos o fator definidor de listas (o qual é os colchetes`[]`), contendo a definição da comprehension.

Exemplo:
```
isto_eh_uma_list_comprehension = [x**2 for x in range(1, 11)]
```

In [None]:
# Exemplo básico de comprehension
list_comp_1 = [x for x in range(1, 100)]
print(list_comp_1)

In [None]:
# Exemplo aplicando uma expressão
list_comp_2 = [x**2 for x in range(1, 100)]
print(list_comp_2)

In [None]:
# Exemplo aplicando uma função com def
def fibonacci(n): 
    """
    A sequência de Fibonacci uma sequência de números inteiros, começando 
    normalmente por 0 e 1, na qual, cada termo subsequente corresponde à 
    soma dos dois anteriores.
    Fn = F_n-1 + F_n-2
    Exemplo fibonacci(5) = [0, 1, 1, 2, 3]
    """
    a = 0
    b = 1
    if n == 0: 
        return a 
    elif n == 1: 
        return b 
    else: 
        for _ in range(2, n + 1): 
            c = a + b 
            a = b 
            b = c 
        return b

list_comp_2 = [fibonacci(x) for x in range(0, 500)]
print(list_comp_2)

Exemplo:

Aplicar a definição do número de Euler para obter uma lista com os números de Euler para cada _n_.

Lembrando, o número de Euler é uma constante matemática definida pela seguinte equação:

$$
e = \lim_{n \to \infty} { \left( 1 + \frac{1}{n} \right)^n} = 2.718281828459045235360287...
$$

In [None]:
list_comp_3 = [(lambda n: (1 + 1/n)**n)(x) for x in range(1, 500)]
list_comp_3

In [None]:
# Usando tabulate
from tabulate import tabulate
list_comp_3 = [[(lambda n: (1 + 1/n)**n)(x)] for x in range(1, 200)]
print(tabulate(list_comp_3, floatfmt='.15f'))

In [None]:
# List comprehension com condicionais
#  Criar uma lista com os elementos pares elevado ao quadrado
list_comp_4 = [x**2 if not x%2 else x for x in range(1, 1000)]
print(list_comp_4)

In [None]:
#  Criar uma lista com os elementos ímpares elevado ao quadrado
list_comp_5 = [x**2 if x%2 else x for x in range(1, 10)]
print(list_comp_5)

In [None]:
# List comprehension para criar matrizes zero
n = 10
list_comp_matriz_0 = [[0 for _ in range(n)] for _ in range(n)]
list_comp_matriz_0

In [None]:
# List comprehension para criar matrizes com 1
from tabulate import tabulate
n = 30
list_comp_matriz_0 = [[0 for _ in range(n)] for _ in range(n)]
list_comp_matriz_0
print(tabulate(list_comp_matriz_0))

In [None]:
# List comprehension para criar matrizes unitarias
from tabulate import tabulate
n = 10
list_comp_matriz_0 = [[ 1 if i==j else "" for i in range(n)] for j in range(n)] # i fila, j colum
list_comp_matriz_0
print(tabulate(list_comp_matriz_0))

### Dict comprehension

O conceito de comprehension pode ser aplicado em dicionários. Nesse caso temos que lembrar que o dicionário precisa 3 fatores definidores:
- chave;
- valor associado à chave;
- símbolo de chaves `{}`.

Nesse caso a sintaxe seria:
```
isto_eh_um_dicionario_comprehension = 
    {chave : valor for chave, valor in zip(iteravel_com_chave, iteravel_com_valor)}
```
OBS. Não é obrigatório passar um `zip` com os dois iteráveis.

In [None]:
# Exemplo básico de Dict Comprehension
valor = (10, 20, 30)
chave = tuple("Key 10,Key 20,Key 30".split(","))
dict_comp = {ch: va for ch, va in zip(chave, valor) }
dict_comp

In [None]:
list(enumerate(chave))

In [None]:
# Exemplo básico de Dict Comprehension sem zip
valor = (10, 20, 30)
chave = tuple("Key 10,Key 20,Key 30".split(","))
dict_comp = {chave[c]: valor[c] for c in range(len(valor)) }
dict_comp

In [None]:
import random
"""
O carácter barra inclinada para esquerda “\” indica que o conteúdo da seguinte
linha faz parte da mesma expressão da linha anterior
"""
dict_comp_2 = {str(chave): valor\
               for chave, valor in enumerate([random.randint(0, 100)\
                                              for _ in range(10_000)])}
dict_comp_2

In [None]:
import random
[random.randint(0, 100) for _ in range(10_000)]

In [None]:
# Exemplo dict comprehensio com if
import random
dict_comp_2 = {str(chave): valor \
               for chave, valor in\
               enumerate([random.randint(0, 100) for _ in range(10_000)])\
               if not valor%2 and not valor%3 and not chave%3}
dict_comp_2

In [None]:
# armazenando caracteres ASCII num dict usando dict comprehension
dict_comp_3 = {char: chr(char) for char in range(32, 240)}
dict_comp_3

### Set comprehension

O conceito de comprehension pode ser aplicado a conjuntos, nesse caso o único fator definidor são as chaves `{}`, a sintaxe é muito proxima à sintaxe para List comprehension e fica muito parecido a list comprehension.

A sintaxe nesse caso seria:
<div align="center">
set_comprehension = {valor for valor in teravel}
</div>

In [None]:
# Exemplo set comprehension
set_comp_1 = {valor for valor in range(1, 100)}
print(set_comp_1)

In [None]:
# Exemplo set comprehension
set_comp_1 = {valor if (not valor%2 and not valor%3) else 0 for valor in range(1, 100)}
print(set_comp_1)

In [None]:
# Exemplo set comprehension
set_comp_1 = {valor for valor in range(1, 100) if not valor%2 and not valor%3}
print(set_comp_1)

### Generator comprehension

Os `generators comprehesion` são semelhantes às listas, porém, não geram um objeto lista, tupla, dicionário ou conjuntos. Eles ao ser criados geram uma sequência que é armazenada em memória e utilizada baixo demanda. Isso faz com os `generators` sejam mais performáticos que as `list comprehension`.

A sintaxe para definir um `generator comprehension` ou simplesmente`generator` é:
```
generator = (expression for item in iterable)
```

**OBS**: Note que estamos utilizando parêntesis, porém isso não seria uma `tuple comprehension` pois como falamos previamente esse conceito não existe em Python.

In [None]:
# Exemplo generator
generator = (x for x in range(100))
print(generator)

list_comp_4 = [x for x in range(100)]
print(list_comp_4)

Observe que o generator não gerou um objeto lista ou alguma coisa semelhante. Ele retornou o tipo que está representado pela variável `generator` e sua localização na memória `<generator object <genexpr> at 0x7f66b0078050>` (esse último pode ser diferente)

Já no caso da `list_comp_4` obtemos uma lista.

---

Mas por que os generators são mais performaticos que as listas?
1. O generator ocupa menos espaço na memória;
1. O generator é processado de forma mais rápida.

In [None]:
# Espaço na memória
from sys import getsizeof
generator  = (x**2 for x in range(0, 500_000) if not x%2 and not x%3)
list_comp_5 = [x**2 for x in range(0, 500_000) if not x%2 and not x%3]
print(f"""
Espaço ocupado na memória por generator = {getsizeof(generator)} bytes
Espaço ocupado na memória por list_comp_5 = {getsizeof(list_comp_5)}  bytes
Relação entre o comprehension e generator = {getsizeof(list_comp_5)/getsizeof(generator)} 
""")

In [None]:
list_comp_5

In [None]:
list(generator)

In [None]:
# Velocidade
import timeit
import numpy as np
from tabulate import tabulate
REPEAT = 500
NUMBER = 3
generator  = '''(x**2 for x in range(0, 1_000_000) if not x%2 and not x%3)'''
list_comp_5 = '''[x**2 for x in range(0, 1_000_000) if not x%2 and not x%3]'''

time_list_comp_5 = timeit.repeat(setup=list_comp_5,
                                 repeat=REPEAT,
                                 number=NUMBER)
time_generator = timeit.repeat(setup=generator,
                               repeat=REPEAT,
                               number=NUMBER)
resultados = np.ones((4, 4),dtype=object)
resultados[:, 0] = np.array("Máximo Mínimo Médio Desvio".split(" "))
resultados[:, 1] = np.array([np.amax(time_list_comp_5),
                             np.amin(time_list_comp_5),
                             np.mean(time_list_comp_5),
                             np.std(time_list_comp_5)])
resultados[:, 2] = np.array([np.amax(time_generator),
                             np.amin(time_generator),
                             np.mean(time_generator),
                             np.std(time_generator)])
resultados[:, 3] = resultados[:, 1]/resultados[:, 2]
print(tabulate(resultados,
               headers="Tempo (s),list_comp_5,generator,t_list/t_gen".split(","),
               floatfmt=('%s', '.5E', '.5E', '.2f'),
               tablefmt="psql"))

## Modulos

- Os módulos em Python são arquivos com a extensão .py contendo funções, classe, variáveis e instruções que posteriormente serão importadas para sua re-utilização;

- Ao se importar um módulo em Python, esse módulo passa a ser um objeto e podemos ter acesso a todos os atributos e métodos definidos nesse módulo utilizando a notação de ponto `.`;

- Não é necessário criar sintaxe especial para informar que o arquivo que está sendo criado é um modulo;

- Existe viar formas de importação de módulos:

  1. `import nome_do_modulo`: Nesse casso estamos importando o modulo `nome_do_modulo`, após sua importação o modulo passa a ser um objeto e vamos ter accesso a todos os métodos, classe e atributos deste modulo;
  1. `from nome_do_modulo import *`. Nesse caso estamos importando todas os métodos, classes e atributos diretamente ao escopo global do nosso código. Esta forma de importar pode ter problema com funções com o mesmo nome. 
  Por exemplo temos a função built-in `sum()` e o pacote Numpy possui outra função `sum()` se importamos todas as classes, métodos e atributos de Numpy vamos ter 2 funções no nosso escopo global com o nome `sum()`, e ao momento de chamar a função `sum()` podemos ter um comportamento não esperado. No caso da função `sum()` isso não seria muito crítico pois as duas funções trabalham da mesma forma até certo ponto. Porém existem bibliotecas estatísticas que tem métodos e atributos que compartem o mesmo nome e a funcionalidade dessas funções são diferentes. **Por tanto devemos tomar cuidado ao realizar importações desta forma**;
  1. `from nome_modulo import atributo_n` ou `from nome_modulo import metodo_n`. Nesse dois casos estamos realizando a importação de um atributo ou modulo específico para nosso espaço global de funções. Essa forma de importação tem a vantagem que não sobrecarregamos a memória importando todas as funcionalidades de um modulo pois somente importamos o método ou atributo que vamos utilizar. Porém, podemos ter métodos ou atributos com o mesmo nome. Para contornar isso podemos utilizar a palavra reservada `as` para assinar um apelido a nossas importações. No exemplo da função `sum()` ficaria:
  

```python
# Duas funções com o mesmo nome
from numpy import sum
# Dassa forma temos duas funções com o mesmo nome (função buil-in e função de Numpy) e cairíamos no mesmo erro do ponto anterior

# Corrigindo o erro de duas funções com o mesmo nome
from numpy import sum as np_sum
# Dessa forma não temos mais duas funções com o mesmo nome. Agora temos a função bult-in sum() e a função np_sum() de Python
``` 

---

Recomendo a leitura deste material:

  - https://docs.python.org/3/tutorial/modules.html


In [None]:
# Exemplo duas funções com o mesmo nome
help(sum) # ingressando no manual da função built-in sum()
from numpy import * # importando todas as funcionalidades da biblioteca numpy
print("-"*80)
help(sum)

In [None]:
# Exemplo 2. duas funções com o mesmo nome
help(sum) # ingressando no manual da função built-in sum()
from numpy import sum  # importando a função sum da biblioteca numpy
print("-"*80)
help(sum)

In [3]:
# Exemplo 3. importando com a palavra reservada as
help(sum) # ingressando no manual da função built-in sum()
from numpy import sum as np_sum  # importando a função sum da biblioteca numpy e nomeando ela como np_as
print("-"*80)
help(sum)
print("-"*80)
help(np_sum)

Help on built-in function sum in module builtins:

sum(iterable, start=0, /)
    Return the sum of a 'start' value (default: 0) plus an iterable of numbers
    
    When the iterable is empty, return the start value.
    This function is intended specifically for use with numeric values and may
    reject non-numeric types.

--------------------------------------------------------------------------------
Help on built-in function sum in module builtins:

sum(iterable, start=0, /)
    Return the sum of a 'start' value (default: 0) plus an iterable of numbers
    
    When the iterable is empty, return the start value.
    This function is intended specifically for use with numeric values and may
    reject non-numeric types.

--------------------------------------------------------------------------------
Help on function sum in module numpy:

sum(a, axis=None, dtype=None, out=None, keepdims=<no value>, initial=<no value>, where=<no value>)
    Sum of array elements over a given axis.
 

In [10]:
# Exemplo de formas adequadas de importar módulos
import numpy # Forma adequada mas pouco recomendada
import numpy as np # Forma adequada e mais usada
import matplotlib.pyplot as plt
from numpy import sin # Forma adequada mas pouco recomendada
from numpy import sin as np_sin, size  as np_size # Forma adequada mas pouco recomendada
from numpy import size as np_size # Forma adequada e mais recomendada

## Pacotes ou Bibliotecas (Packages or Libraries)

- Os pacotes (packages), também chamados de bibliotecas (libraries), são coleções hierarquias de módulos armazenados num diretório raiz;

- Podemos ter um diretório contendo vários módulos e incluso subdiretórios que representaria outros pacotes (ou bibliotecas);

- A forma de aceder a subpacotes é através da notação ponto `pacote_principal.subpacote`;

- A representação de um pacote seria:

     PACOTE_PRINCIPAL
        SUBPACOTE_1
            submodulo_1_1.py
            submodulo_1_2.py
            submodulo_1_3.py
        SUBPACOTE_2
            submodulo_2_1.py
            submodulo_2_2.py
            submodulo_2_3.py
        modulo_1.py
        modulo_2.py

- Para importar SUBPACOTE_2: 
```
import PACOTE_PRINCIPAL.SUBPACOTE_2 as subpacote_2
import PACOTE_PRINCIPAL.SUBPACOTE_1 as subpacote_1
import PACOTE_PRINCIPAL as pacote_principal
pacote_principal.SUBPACOTE_2.submodulo_2_1
```
    

In [None]:
# Exemplo importação de pacotes
import numpy as np
import numpy.linalg 
np.linalg.inv()
# https://numpy.org/doc/stable/reference/generated/numpy.linalg.inv.html
# A função inv() está armazenada num diretorio linalg que a sua vez está armazenado em
# um direotorio principal chamado Numpy

np.loadtxt()
# https://numpy.org/doc/stable/reference/generated/numpy.loadtxt.html
# A função loadtxt() está armazenada num diretorio chamado Numpy

## Instalação de pacotes

Python se caracteriza por possuir uma grande variedade de pacotes disponíveis, porém estes pacotes não vem instalados por padrão com Python. Para realizar o gerenciamento de pacotes podemos utilizar dois gerenciadores

1. Usando o Python Package Index melhor conhecido como pip;
1. Usando o conda.

Com esses gerenciadores de pacotes (seja o Pip ou Conda) podemos instalar, atualizar ou remover pacotes.
Com esses gerenciadores de pacotes (seja o Pip ou Conda) podemos instalar, atualizar ou remover pacotes.


- Para instalar podemos utilizar o seguinte comando
  - `pip install nome_do_pacote`
  - `conda install nome_do_pacote`

- Para desinstalar podemos utilizar o seguinte comando
  - `pip uninstall nome_do_pacote`
  - `conda uninstall nome_do_pacote` ou `conda remove nome_do_pacote`

- Para listar os pacotes instalados utilizar o seguinte comando
  - `pip list`
  - `conda list`

---

Recomendo a leitura deste material

Informação sobre pip:
  - https://en.wikipedia.org/wiki/Pip_(package_manager)
  - https://pypi.org/

Conda documentation:
  - https://docs.conda.io/projects/conda/en/latest/user-guide/index.html
  - https://docs.conda.io/projects/conda/en/latest/user-guide/install/index.html

Anaconda:
  - https://www.anaconda.com/

