# Importando bibliotecas

Uma das grandes vantagens de Python é a extensa comunidade presente, que cria e mantém pacotes e bibliotecas para as mais variadas funções. Neste capítulo, aprenderemos como importar bibliotecas e exploraremos algumas bibliotecas embutidas. Para mais detalhes sobre importação, [veja a documentação oficial](https://docs.python.org/3/reference/import.html). Por trás dos panos, a operação de importação é bastante complexa, mas a interface para fazer tarefas simples é simples também.

Primeiro, vamos esclarecer alguns termos:

* módulo: um módulo contém objetos de Python, que é acessada pelo processo de importação. Uma analogia é considerar um módulo como um arquivo.
* pacote: é um módulo que contém submódulos e subpacotes. Serve para organizar os módulos. Uma analogia é considerar um pacote como uma pasta, que pode conter outras pastas (subpacotes) e arquivos (submódulos).
* importar: processo em que um módulo ganha acesso a código em outro módulo
* biblioteca: um termo menos preciso, e significa em essência um conjunto de módulos, como a biblioteca padrão (*standard library* - que chamei de bibliotecas embutidas).

Para importar um pacote, utilize a sintaxe: 

```python
import pacote
```

Se você quiser importar apenas uma parte do código de um módulo, você deve utilizar

```python
from pacote import parte
```

E então essa parte estará acessível a seu código, mas o pacote em si não, a não ser que você importe ele diretamente também. É possível importar várias partes de uma vez, como `from pacote import parte1, parte2, parte3`.

Você também pode alterar o nome de algo ao importá-lo. Isso é muito comum com certas bibliotecas, que possuem uma nomeação praticamente padrão:

```python
import pacote as novo_nome
```

```python
import pandas as pd
import numpy as np
```

E por fim, você pode importar um submódulo com esta sintaxe:

```python
import pacote.submódulo
```

e o submódulo estará disponível por seu nome completo, `pacote.submódulo`. Como isso é muitas vezes inconveniente, você pode renomear essa importação, como o exemplo anterior mostrou. 

```python
import matplotlib.pyplot as plt
```

Quando você importa um módulo, todo o código dentro dele é executado. Logo, se existir em algum local um comando `print('abc')`, no escopo global do pacote, esse comando será executado sempre que o pacote for importado. Por exemplo, suponha que você criou este arquivo inicialmente com o propósito de rodá-lo diretamente com `python arquivo.py`.

```python
# arquivo.py
def ação():
    print('Hello world!')

ação()
```

Posteriormente, você gostaria de importar a função `ação` para utilizar em outro projeto. Se você importar esse arquivo com `import arquivo`, a mensagem `Hello world!'` irá aparecer. Em outros casos, um erro poderá ocorrer e a importação não terá sido bem sucedida. Para impedir esses problemas de ocorrerem, utiliza-se a seguinte construção:

```python
# arquivo.py
def ação():
    print('Hello world!')

if __name__ == '__main__':
    ação()
```

A variável `__name__` é igual ao nome do pacote quando o arquivo é importado e é `__main__` quando um arquivo é rodado diretamente. Assim, a chamada da função `ação` só ocorrerá se `arquivo.py` for executado diretamente, e não importado.

O resto deste capítulo será dedicado à exploração de alguns pacotes da biblioteca padrão de Python.

## Manipulação de arquivos e diretórios

### `os`

[Link da documentação](https://docs.python.org/3/library/os.html)

O pacote `os` contém funções para interagir com o sistema operacional de maneira independente da plataforma. Por exemplo, Windows e Linux utilizam comandos diferentes para gerar arquivos, mudar de pastas, mas podemos abstrair isso utilizando as funções em `os`. Primeiro, vamos explorar como gerar algumas pastas.

In [1]:
import os

#### O conceito de *current working directory*

Podemos utilizar comandos para manipulação de pastas ou arquivos com caminhos absolutos ou relativos.

Note aqui que estamos presumindo o local em que as pastas serão geradas, que é o *current working directory* ou *CWD*. Essa variável pode ser obtida pelo comando `os.getcwd()`. Geralmente, essa é a pasta onde você executou o comando `python ...` ou, no caso do Jupyter Lab, a pasta onde o arquivo `.ipynb` se localiza. Vamos supor a seguinte estrutura:

```
--- raiz
      |
      +--pasta1
           |
           +--arquivo.py
```


Suponha que você quer rodar o arquivo `arquivo.py`. Se você abrir o terminal na `raiz`, poderá trocar para `pasta1` com `cd pasta1` e depois rodar `python ./arquivo.py` ou executar diretamente `python ./pasta1/arquivo.py`. No primeiro caso, *cwd* será `raiz/pasta1/` e no segundo caso será `raiz/`.

### Manipulação de pastas

`os.mkdir(caminho)` é utilizado para criar uma pasta especificada pelo caminho no argumento. Suponha que você queira criar esta estrutura com uma pasta aninhada na outra, e seu *cwd* é `raiz/`

```
--- raiz
      |
      +--pasta1
           |
           +--pasta2
```

Para isso, precisaremos do comando `os.mkdir('pasta1')` seguido de `os.mkdir('pasta1/pasta2')`. Isso é inconveniente se quisermos fazer estruturas mais complexas, pois muitos caminhos serão repetidos. Podemos então trocar o *cwd* com `os.chdir('pasta1')` e depois criar a segunda pasta com `os.mkdir('pasta2')`. Você pode voltar à pasta original com `os.chdir('..')` ou armazenar o *cwd* original em uma variável e retornar à ela depois de tudo.

Se você tentar criar `pasta2` diretamente, como `pasta1` não existe, `FileNotFoundError` será lançado. Caso você tente rodar novamente o domando, é possível que a pasta já exista e um erro `FileExistsError` será lançado.

Alternativamente, o comando `os.mkdirs(caminho)` é utilizado para criar uma pasta e todas as pastas necessárias para atingir. O argumento opcional `exist_ok`, por padrão `False`, evita que um erro seja lançado se alguma pasta já existir. Logo, o comando anterior se torna `os.mkdir('./pasta1/pasta2', exist_ok=True)`, e não precisamos 

Em paralelo a `os.mkdirs` e `os.mkdir`, temos `os.rmdirs` e `os.rmdir`, que removem pastas. 

Para renomear uma pasta, existe o comando `os.rename(origem, destino)`, que irá falhar se a pasta de destino já existir. Caso queira substituir, pode utiliar `os.replace(origem, destino)`. Estas funções também funcionam com arquivos.

### Manipulações de caminhos

Outra tarefa recorrente é a manipulação de caminhos. Utilizar manipulação de strings pode parecer tentador, mas é uma receita para frustração, especialmente se você deseja que seu programa seja utilizado em mais de um sistema operacional. O submódulo [`os.path`](https://docs.python.org/3/library/os.path.html) possui ferramentas para auxiliar nisso. O mais recomendado hoje em dia é utilizar o pacote `pathlib`, que exploraremos [em breve](sec:pathlib).

Aqui vão algumas funções úteis:

* `os.path.abspath` retorna o caminho absoluto dado um caminho relativo.
* `os.path.relpath` retorna um caminho relativo, referente ao *cwd*, dado um caminho absoluto.
* `os.path.basename` retorna o nome na base do caminho. Se for uma pasta, retorna o nome da pasta, se for um arquivo, retorna o nome do arquivo. Por exemplo, `os.path.basename(os.path.abspath('./Importando bibliotecas.ipynb'))` resulta em `'Importando bibliotecas.ipynb'`.
* `os.path.dirname` retorna o nome de todos os diretórios no caminho até o caminho da pasta ou arquivo fornecido.
* `os.path.exists`, `os.path.isfile` e `os.path.isdir` retornam `True` se o caminho fornecido é uma pasta ou arquivo existente, com diferenças óbvias pelo nome.
* `os.path.join` junta duas ou mais caminhos de maneira "inteligente", obedecendo o separador de pastas do sistema, em ordem. Não checa se o caminho final é válido, e não checa se você tentar "colocar" um arquivo dentro do outro.
* `os.path.split` retorna duas strings, a segunda sendo a última parte do caminho e a primeira sendo o resto, à esquerda. Se o caminho fornecido termina com uma barra, a segunda parte é uma string vazia.

#### Percorrendo diretórios e pastas

Iterar sobre o conteúdo de pastas é algo relativamente comum. Por exemplo, você pode querer encontrar todos os arquivos `.csv` de uma pasta para tratá-los. Para isso, as funções `os.walk` e `os.scandir` podem ser utilizadas. `os.walk(caminho)` recebe um caminho e cria um gerador que fornece uma tupla com o caminho até a pasta, o nome das pastas dentro da pasta atual e o nome dos arquivos na pasta atual. `os.scandir` age de maneira um pouco diferente. Ele gera um iterador que retorna objetos `DirEntry`. Esses objetos contém informações sobre se algo é uma pasta ou um arquivo, e o *stats* do arquivo.

Isso ainda é um tanto laborioso. Para métodos melhores de se percorrer diretórios e encontrar arquivos, podemos utilizar o módulo [`glob`](sec:glob).

(sec:glob)=
### `glob`

[Link da documentação](https://docs.python.org/3/library/glob.html)

*glob*, que significa *global*, foi um programa criado há décadas para encontrar arquivos com base num padrão. A especificação desse padrão é bastante simples, e é capaz que você já tenha utilizado algo similar em sua vida. Os padrões são compostos por letras e números, e símbolos. As letras e números serão comparadas exatamente com os caminhos, e os símbolos são utilizados para generalizar um padrão. Os três símbolos são:

* `*`, significa "qualquer caracter, qualquer número de vezes. É de longe o símbolo mais frequentemente utilizado.
* `?`, significa "qualquer caracter, 1 vez.
* `[abc...]` significa qualquer caracter dentro dos colchetes, 1 vez.
* `[a-z]` significa qualquer caracter dentro da faixa de caracteres. `a-z` significa "todos os caracteres entre 'a' e 'z' minúsculos", `0-9` significa "todos os caracteres numéricos.

Além disso, você pode procurar por arquivos recursivamente utilizando o seguinte padrão: `**/`.

Exemplos:

* `*.csv` irá corresponder a todos os arquivos que terminam com '.csv'.
* `exercício*.csv` irá corresponder a todos os arquivos que começam com 'exercício', terminam com '.csv' e possuem qualquer texto no interior. Então 'exercício1.csv' e 'exercício-treinamento-teste.csv' ambos correspondem à esse padrão.
* `.csv` irá corresponder somente ao arquivo cujo nome é '.csv', nada mais e nada menos.

Note que um arquivo pode ter duas extensões, como 'abc.tar.gz'. Se você quiser todos os arquivos 'tar', terá que utilizar `*.tar*`, mas isso poderá corresponder a, por exemplo, 'abc.tart' também.

Dentro do módulo `glob`, temos três funções. `glob`, `iglob` e `escape`. `glob` retorna uma lista com os caminhos dos arquivos, `iglob` retorna um iterador, portanto não avalia tudo de uma vez, e `escape` é utilizado para escapar símbolos que o *glob* utiliza e que podem existir em nomes de arquivos. Podemos utilizar a função `glob` para encontrar todos os arquivos de exercícios do capítulo 5.

In [2]:
import glob
exercícios = glob.glob('../Capítulo05/dados/*.csv')
exercícios

['../Capítulo05/dados\\exercício1.csv', '../Capítulo05/dados\\exercício2.csv']

Porém, é um pouco inconveniente ficar digitando `glob.glob` o tempo todo. Existe uma maneira de importar seletivamente algumas objetos de um módulo, colocando-os no escopo global ao invés do módulo em si. Isso é feito com a seguinte sintaxe:

```python
from (pacote) import (objeto)
```

In [3]:
from glob import glob
exercícios = glob('../Capítulo05/dados/*.csv')
exercícios

['../Capítulo05/dados\\exercício1.csv', '../Capítulo05/dados\\exercício2.csv']

Como um último exemplo, vamos encontrar todos os arquivos `.py` criados neste livro. Para isso, vamos utilizar o padrão `**` e o argumento opcional `recursive=True`.

In [4]:
todos_py = glob('../**/*.py', recursive=True)
todos_py

['..\\Capítulo01\\Soluções dos exercícios\\complex_mod.py',
 '..\\Capítulo01\\Soluções dos exercícios\\pint.py',
 '..\\Capítulo02\\Soluções de exercícios\\prop_sympy.py',
 '..\\Capítulo02\\Soluções de exercícios\\prop_uncertainties.py',
 '..\\Capítulo03\\Soluções de exercícios\\Gerador\\problema_gas_ideal.py',
 '..\\Capítulo03\\Soluções de exercícios\\Gerador\\QuestionGenerator.py',
 '..\\Capítulo03\\Soluções de exercícios\\Gerador\\test_gas_ideal.py',
 '..\\Capítulo04\\Soluções de exercícios\\convert_dict.py',
 '..\\Capítulo04\\Soluções de exercícios\\convert_pint.py',
 '..\\Capítulo05\\dados\\gerar_csv.py',
 '..\\Capítulo05\\Soluções de exercícios\\contagem_palavras.py',
 '..\\Capítulo05\\Soluções de exercícios\\criar_exceções.py',
 '..\\Capítulo05\\Soluções de exercícios\\ler_csv1.py',
 '..\\Capítulo05\\Soluções de exercícios\\ler_csv2.py',
 '..\\Capítulo05\\Soluções de exercícios\\molar_mass_calculator.py',
 '..\\Capítulo05\\Soluções de exercícios\\molar_mass_calculator2.py',
 '..\

(sec:pathlib)=
### `pathlib`

[Link da documentação](https://docs.python.org/3/library/pathlib.html)

`pathlib` é uma biblioteca que utiliza objetos especiais para representar caminhos, ao invés de strings. Esses objetos `Path` podem ser manipulados com maior facilidade e podem ser utilizados, em muitos casos, no lugar de caminhos de strings. Senão, é possível convertê-los com `str(path)`. Por trás dos panos, `Path` utiliza `os.path`. Os paralelos entre a funcionalidade de cada um podem ser encontradas [aqui](https://docs.python.org/3/library/pathlib.html#correspondence-to-tools-in-the-os-module).

Existem basicamente dois tipos de objetos que são utilizados. Primeiro temos `PurePath`, que somente representa caminhos, e `Path`, que faz tudo que `PurePath` faz, e também consegue realizar algumas operações concretas. Por isso, irei focar em `Path` somente.

Primeiro, podemos criar um `Path` com o seguinte comando:

In [5]:
from pathlib import Path
p = Path('.')
p

WindowsPath('.')

Como estou em um ambiente Windows, um objeto `WindowsPath` é criado. Se estivesse em Linux, um `PosixPath` seria criado. Com esse objeto `p`, posso convertê-lo para um caminho absoluto com `p.absolute()`

In [6]:
p.absolute()

WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06')

E posso concatenar caminhos utilizando uma divisão, como se a barra fosse um separador de pastas

In [7]:
teste = p.absolute() / 'teste.txt'
teste

WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06/teste.txt')

Posso checar se este arquivo existe com `teste.exists()`

In [8]:
teste.exists()

False

E como não existe, posso escrever algum texto nele com `write_text`, não necessitando que `open` seja utilizado. Se quiséssemos somente criar o arquivo, poderíamos utilizar `.touch()`.

In [9]:
teste.write_text('este é um teste', encoding='utf8')

15

Depois disso podemos confirmar que o arquivo foi criado

In [10]:
teste.exists()

True

E que seu conteúdo é o mesmo que escrevemos

In [11]:
teste.read_text(encoding='utf8')

'este é um teste'

E por fim, para limpar a pasta, podemos deletá-lo

In [12]:
teste.unlink()

E verificar novamente que ele não existe mais

In [13]:
teste.exists()

False

Se quisermos encontrar partes do caminho de um arquivo, temos os seguintes comandos.

`.stem` é uma propriedade que contém o nome do arquivo, sem extensão.

In [14]:
teste.stem

'teste'

`.name` é uma propriedade que contém o nome do arquivo e sua extensão.

In [15]:
teste.name

'teste.txt'

`.suffix` é a última extensão do arquivo

In [16]:
teste.suffix

'.txt'

`.suffixes` é a lista de extensões do arquivo, então `.tar.gz` retornaria `['.tar', '.gz']`.

In [17]:
(p / 'arquivo.tar.gz').suffixes

['.tar', '.gz']

In [18]:
teste.suffixes

['.txt']

Podemos obter a pasta onde um arquivo está com `.parent`

In [19]:
teste.parent

WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06')

Ou podemos utilizar `.parents`, que retorna um gerador que gradativamente gera os diretórios pai de cada parte.

In [20]:
list(teste.parents)

[WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06'),
 WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos'),
 WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython'),
 WindowsPath('C:/Users/karl.clinckspoor/Downloads'),
 WindowsPath('C:/Users/karl.clinckspoor'),
 WindowsPath('C:/Users'),
 WindowsPath('C:/')]

E por fim, podemos obter todas as partes de um caminho com `.parts`

In [21]:
teste.parts

('C:\\',
 'Users',
 'karl.clinckspoor',
 'Downloads',
 'CursoPython',
 'Capítulos',
 'Capítulo06',
 'teste.txt')

Podemos também criar e manipular pastas. Para criar, utilize `mkdir`.

In [22]:
pasta = p / 'teste'
pasta.exists()

False

In [23]:
pasta.mkdir()
pasta.exists()

True

Podemos renomeá-la com `.rename()`. Essa função também funciona com arquivos. Como estamos mudando o caminho, podemos capturar a resposta de `.rename` para atualizar o caminho com o nome mais novo.

In [24]:
pasta = pasta.rename('teste_renomeado')

In [25]:
pasta

WindowsPath('teste_renomeado')

E podemos deletar a pasta com `rmdir`

In [26]:
pasta.rmdir()
pasta.exists()

False

Por fim, podemos manipular partes de um caminho com as funções que começam com `with`. Por exemplo:

In [27]:
teste.with_name('novo_nome.txt')

WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06/novo_nome.txt')

In [28]:
teste.with_stem('novo_nome')

WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06/novo_nome.txt')

In [29]:
teste.with_suffix('.csv')

WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06/teste.csv')

Por último, `Path` também possui a habilidade de fazer `glob`. A diferença é que um gerador é criado, não uma lista, então o comportamento é mais próximo a `glob.iglob`. Além disso, `glob.glob` por padrão não considera pastas escondidas, precedidas por um `.`, como `.ipynb_checkpoints`, mas `Path.glob` não só considera, mas não possui a opção para ignorá-las. Podemos verificar a equivalência dos dois comandos com esta linha de código.

In [30]:
(
    sorted(glob('../**/*.py', recursive=True, include_hidden=True)) == 
    sorted([str(i) for i in Path('..').glob('**/*.py')])
)

True

### `shutil`

Talvez um pouco confuso, `shutil` contém algumas funcionalidades extras, além daquelas presentes em `os.path` e em `pathlib`. Por exemplo, possui comandos para copiar arquivos ou árvores inteiras, zipar e dezipar arquivos, e outras funcionalidades.

Para copiar arquivos, você pode utilizar `shutil.copy` ou `shutil.copy2`, com a diferença que a segunda função tenta copiar os metadados do arquivo. Para copiar uma árvore de arquivos e pastas, `shutil.copytree` pode ser utilizado, e `shutil.rmtree` pode ser utilizado para remover uma árvore de arquivos. Aqui, entenda "árvore de arquivos" como arquivos e pastas aninhadas com qualquer complexidade. `shutil.move` tenta mover um arquivo ou pasta para outro lugar.

Além disso, `shutil.which` retorna o caminho de um comando se fosse executado no terminal. Por exemplo:

In [31]:
import shutil
shutil.which('python.exe')

'C:\\Users\\karl.clinckspoor\\AppData\\Local\\miniconda3\\envs\\cursoPython\\python.exe'

Neste caso, o caminho específico do ambiente virtual deste curso foi retornado. Se você rodar isso, outro caminho será retornado.