[Real Python Class](https://realpython.com/lessons/reading-and-writing-files/)

Alguns problemas ao tratar caminhos de arquivo como strings:
- Ler e escrever arquivos
- Listar arquivos de uma pasta
- Encontrar a pasta pai
- Criar nomes únicos para arquivos. Não tem como explorar a pasta e saber quais seus arquivos
- Endereço do arquivo pode ficar errado a depender do SO. Windows usa contrabarra por exemplo 

In [5]:
# basicamente, Path é a unica classe q vamos usar do modulo pathlib
from pathlib import Path

Um objeto path pode ser criado passando a string para a classe Path.

Lembre de sempre usar o 'r' na frente da string para que seja uma string literal. Dessa forma a contrabarra dos endereços do windows não serão interpretadas como escape.

In [6]:
Path(r'home/user/folder1/file.txt')

PosixPath('home/user/folder1/file.txt')

In [7]:
# retorna o endereço do diretório atual
Path.cwd()

PosixPath('/home/kaio-peixoto/GitHub/real_python/path_lib')

In [8]:
# o método home traz o endereço do diretório raíz
Path.home()

PosixPath('/home/kaio-peixoto')

In [9]:
# é possível criar um caminho usando a notação de barra abaixo
# este objeto gerado vem de acordo com o padrão do SO sendo utilizado
Path.home() / 'pasta1' / 'subpasta' / 'arquivo.xlsx'

PosixPath('/home/kaio-peixoto/pasta1/subpasta/arquivo.xlsx')

In [10]:
# outra opção para criar um caminho é utilizando o metodo joinpath
Path.home().joinpath('pasta1', 'subpasta', 'arquivo.xlsx')

PosixPath('/home/kaio-peixoto/pasta1/subpasta/arquivo.xlsx')

### Ler e escrever arquivos com pathlib

Podemos ler arquivos diretamente de um objeto Path.
A função é a mesma se utilizar o tradicional open(). Mas manipulando arquivos com o objeto Path é uma forma mais pythonica para deixar o código mais bonito e também facilitar leitura. No final, a escolha depende só do gosto de quem está criando o código. Veja os exemplos abaixo:

In [14]:
# criando um objeto Path
path = Path.cwd() / 'exemplo.txt'

In [15]:
# abrindo o arquivo com o built-in open()
with open(path, mode='r', encoding='utf-8') as fid:
    linhas = [linha.strip() for linha in fid if linha.startswith('#')]

print('\n'.join(linhas))

#linha4
#linha5
#linha7


In [16]:
# fazendo o mesmo, mas agora diretamente com o objeto Path
with path.open(mode='r', encoding='utf-8') as fid:
    linhas = [linha.strip() for linha in fid if linha.startswith('#')]

print('\n'.join(linhas))

#linha4
#linha5
#linha7


Para uma leitura rápida do arquivo q não vai precisar de muito processamento podemos utilizar o método abaixo. Ele apenas lê o arquivo e retorna seu conteúdo como string:

In [17]:
# o simples nome do arquivo pode ser jogado diretamente dentro do objeto Path 
# ele procura este arquivo dentro do diretório atual e faz a leitura
Path('exemplo.txt').read_text().split('\n')

['linha1', 'linha2', 'linha3', '#linha4', '#linha5', 'linha6', '#linha7']

In [18]:
# lendo como método do objeto path criado anteriormente
path.read_text()

'linha1\nlinha2\nlinha3\n#linha4\n#linha5\nlinha6\n#linha7'

Veja os métodos que fazer esta leitura/escrita rápida:
- read_text()
- read_bytes()
- write_text()
- write_bytes()

In [19]:
# o método resolve retorna o caminho absolut do objeto path
Path('exemplo.txt').resolve()

PosixPath('/home/kaio-peixoto/GitHub/real_python/path_lib/exemplo.txt')

Mover, renomear, deletar arquivos

Com o pathlib isso também é possível. Mas tem q ser usado com cuidado, já q ele não avisa nada antes. Se deletar, ele executa imediatamente.

In [20]:
# usando replace para renomear o arquivo
# replace também pode mover o arquivo para outra pasta
# porém mover o arquivo pode ser perigoso, pois ele sobrescreve se tiver nome igual
Path('exemplo.txt').replace('exemplo_versao2.txt')

PosixPath('exemplo_versao2.txt')

In [23]:
# metodo utilizado para deletar pasta
Path('pasta1').rmdir()
# metodo para deletar arquivos
Path('file.txt').unlink()

In [24]:
# os metodos with_name e with_suffix retorna o nome do arquivo modificado, mas nao muda inplace
# with_suffix altera somente o sufixo do path
path.with_suffix('.xlsx')

PosixPath('/home/kaio-peixoto/GitHub/real_python/path_lib/exemplo.xlsx')

In [25]:
# with_name altera todo o nome do arquivo, inclusive o sufixo
path.with_name('exemplo_teste2.xlsx')

PosixPath('/home/kaio-peixoto/GitHub/real_python/path_lib/exemplo_teste2.xlsx')

O objeto Path() e seus componentes

In [28]:
# podemos extrair partes específicas de um path
path.parts 

('/',
 'home',
 'kaio-peixoto',
 'GitHub',
 'real_python',
 'path_lib',
 'exemplo.txt')

In [32]:
# aqui pegamos o nome do arquivo
path.name

'exemplo.txt'

In [33]:
# nome do arquivo sem a extensão
path.stem

'exemplo'

In [35]:
# pasta pai
path.parent

PosixPath('/home/kaio-peixoto/GitHub/real_python/path_lib')

---

O método iterdir() faz uma iteração na pasta desejada.

In [95]:
# aqui vamos iterar na pasta pai do diretório atual
[i for i in Path.cwd().parent.iterdir()]

[PosixPath('/home/kaio-peixoto/GitHub/real_python/dash'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/lixo'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/data_management'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/realpython'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/python_env'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/dataclasses'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/venv'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/Readme.md'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/datetime'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/modules_packages_explain'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/exceptions'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/path_lib'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/.git')]

In [82]:
# ainda utilizando o iterdir() em união com Collections
# podemos listar quantos arquivos de cada tipo existe em determinada pasta
from collections import Counter

# itere na pasta do diretorio atual e conte qual a qtd de cada tipo de arquivo
Counter(p.suffix for p in Path.cwd().iterdir())

Counter({'.ipynb': 1, '.txt': 1, '': 1})

In [88]:
# pode combinar com glob e deixar o código mais flexível
# conte todos os arquivos em q a extensão comece com i
Counter(p.suffix for p in Path.cwd().glob('*.i*'))

Counter({'.ipynb': 1})

In [89]:
# aqui podemos criar uma árvore de um diretório
def tree(directory):
    print(f'+ {directory}')
    for path in sorted(directory.rglob('*')):
        depth = len(path.relative_to(directory).parts)
        spacer = '    ' * depth
        print(f'{spacer}+ {path.name}')

In [91]:
# testando a função
#tree(Path.cwd())

In [109]:
# podemos usar o método glob para pesquisar termos específicos em notação glob
# retorne todos os arquivos do diretorio atual em que a extensão comece com ip
[i for i in Path.cwd().glob('*.ip*')]

[PosixPath('/home/kaio-peixoto/GitHub/real_python/path_lib/main.ipynb')]

In [112]:
# retorne todos os arquivos do diretorio pai em que a extensão comece com ip
# veja que foi utilizado o rglob em vez de glob
# o rglob faz a pesquisa em todas as subpastas também
[i for i in Path.cwd().parent.rglob('*.ip*')]

[PosixPath('/home/kaio-peixoto/GitHub/real_python/data_management/data_management.ipynb'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/data_management/.ipynb_checkpoints'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/data_management/.ipynb_checkpoints/data_management-checkpoint.ipynb'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/python_env/.ipynb_checkpoints'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/python_env/python_env.ipynb'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/python_env/.ipynb_checkpoints/python_env-checkpoint.ipynb'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/dataclasses/dataclasses.ipynb'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/dataclasses/.ipynb_checkpoints'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/dataclasses/.ipynb_checkpoints/dataclasses-checkpoint.ipynb'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/datetime/.ipynb_checkpoints'),
 PosixPath('/home/kaio-peixoto/GitHub/real_python/datetime/datet

Em resumo, os métodos abaixo são geradores e podem ser utilizados em iteradores como list comprehensions:

- iterdir()
    - Itera dentro das pastas
- glob()
    - Itera nas pastas fazendo pesquisa com notação glob
- rglob
    - mesma função de glob, mas extende a busca para as subpastas