# Manipulação de Arquivos em Python

---

# Caminhos
- Normalmente trabalhamos com caminhos relativos (arquivos e diretórios dentro do diretório do projeto) e, sendo assim, **não precisamos passar o caminho completo**.
- Para manipular arquivos que estão em outro lugar, é preciso passar o caminho completo.

## Nota: Caminhos em diferentes Sistemas Operacionais
- No Linux e no Mac, os caminhos são passados com barra normal (`/`)
    - Ex.: `"Users/User/Desktop/curso-python/aula116.txt"`
- Já no Windows, os caminhos são passados com barra invertida (`\`)
    - Ex.: `"Users\User\Desktop\curso-python\aula116.txt"`

### Problema da barra invertida
- A barra invertida é utilizada em strings para escapar caracteres. Sendo assim, acaba gerando problemas.
- **Para evitar, o ideal é passar as barras duplicadas.**
- 
---

# Modos de abertura de arquivos
- Para abrir arquivos, usamos a função `open()`, que irá receber dois parâmetros:
    1. O nome do arquivo (e a extensão) como string.
    2. A operação que queremos realizar, sendo elas:
        - `r`: read/leitura 
        - `w`: write/escrita
        - `x`: eXclusive creation / cria um arquivo novo.
            - **Só funciona se o arquivo não existir. Se tentar usar em um arquivo que já existe, será levantado um erro.**
        - `b`: binary / binário
            - **É usado em conjunto com outros modos (`r`, `w`, `a`, `x`)**
            - Por padrão, o Python abre arquivos em modo de texto (`t`), o que significa que ele lida com o conteúdo como strings.
            - Porém, para arquivos não baseados em texto, como .jpg, vídeos, PDFs, executáveis, precisamos usar o modo binário.
            - Neste modo, o Python lê e escreve os dados como bytes brutos, sem tentar interpretá-los como caracteres. 
        - `+`: É como uma extensão. Se abrirmos um arquivo no modo de leitura, também poderemos escrever e vice-versa.
        - `a`: append mode / adiciona linhas no final do arquivo

### Nota sobre binários
- No fim das contas, essa manipulação de baixo nível normalmente é feita com bibliotecas específicas. Sendo assim, quase nunca será utilizado o modo `b`

---

## Observação importante sobre abertura de arquivos
- Sempre que abrimos um arquivo, é necessário que ele seja fechado. Caso contrário, o arquivo poderá sofrer problemas (corromper, não salvar, etc)
- As operações são realizadas entre a abertura e fechamento do arquivo

## Criando arquivo

In [1]:
## Criando um arquivo
arquivo = open("teste.txt", "w")
arquivo.write("Tentando escrever num arquivo")
##Fechando o arquivo depois de criá-lo
arquivo.close()

---

# Context Manager
- Como foi visto, é preciso lembrar de fechar um arquivo.
- Uma solução para isso seria passar o `arquivo.close` no bloco `finally` de um `try/except`. Porém, para automatizar isso podemos usar o **`CONTEXT MANAGER`**

## with open
- Para utilizar o context manager, utilizamos o comando `with open`
- Ao fazer isso, o Python já se encarrega de abrir e fechar o arquivo. Basta utilizá-lo e a cada bloco, o arquivo será aberto e fechado automaticamente.

In [2]:
with open("teste.txt", "w") as file:
    file.write("Linha 1\n")
    file.write("Linha 2\n")

with open("teste.txt", "r") as file:
    print(file.read())

Linha 1
Linha 2



## encoding
- Ao abrir um arquivo, o ideal é passar o tipo de codificação de caracteres desejado. O padrão global é o `utf-8`.
- Deve ser passado após o modo de abertura.

## notas sobre quebras de linhas e exibição na tela
- O `.write()` não se encarrega de quebrar linhas. É preciso definir isso explicitamente com `\n`
- O `.read()` não se encarrega de exibir o conteúdo na tela. É preciso definir isso explicitamente com `print()`

---
# Realizando diferentes operações numa mesma abertura de arquivos
- Para fazer isso, devemos usar o `+`, assim: `with open("teste.txt", "w+")`

## Movimentação do cursor no arquivo
- É importante observar que o cursor "se move" junto com os nossos comandos, por exemplo:
    - Ao passar um `arquivo.write("Linha 1\n")`, o cursor se moverá ao longo de toda a primeira linha (até depois do número 1) e, ao quebrar, passará para a segunda linha.
    - **Sendo assim, ao escrever algo e depois solicitar a leitura, ele irá começar a leitura já do final do arquivo, ou seja, *não irá ler nada***
    - Para corrigir isso, usamos o método **`seek()`**

## Método seek
- Ao passar `arquivo.seek(0, 0)`, o cursor volta ao início do arquivo.

In [3]:
with open("teste.txt", "w+") as file:
    file.write("Linha 1\n")
    file.write("\n")
    file.write("Linha 2\n")
    file.write("\n")
    file.write("Vamos \"resetar o cursor\", pois no momento ele está aqui ->")
    file.seek(0, 0)
    print(file.read())

Linha 1

Linha 2

Vamos "resetar o cursor", pois no momento ele está aqui ->


# read, writelines, write, readline, readlines
## `read()`
- Lê todo o arquivo de uma vez só

## `readline()`
- Lê uma linha por vez, como o `next()` do iterator
- Não gera erros ao chegar ao fim do arquivo. Na verdade, ele ficaria 'lendo' linhas em branco infinitamente
- Normalmente usado quando precisamos processar linha por linha, mas temos controle sobre quantas linhas queremos ler

In [4]:
with open("frutas.txt", "w", encoding = "utf-8") as f:
    f.write("Maçã\n")
    f.write("Banana\n")
    f.write("Uva\n")
    f.write("Laranja")

print("--- Usando readline() ---")

with open("frutas.txt", "r", encoding="utf-8") as f:
    linha1 = f.readline()
    print(f"Linha 1: {linha1.strip()}")

    linha2 = f.readline()
    print(f"Linha 2: {linha2.strip()}")
    
    linha3 = f.readline()
    print(f"Linha 3: {linha3.strip()}")
    
    linha4 = f.readline()
    print(f"Linha 4: {linha4.strip()}")

    linha5 = f.readline()
    print(f"Linha 5 (vazia): {linha5.strip()}")

--- Usando readline() ---
Linha 1: Maçã
Linha 2: Banana
Linha 3: Uva
Linha 4: Laranja
Linha 5 (vazia): 


## `readlines()`
- Lê todas as linhas de uma vez e as retorna como uma lista de strings, sendo cada linha, uma string
- Bom para ler o conteúdo de arquivos pequenos

In [5]:
print("--- Usando readlines() ---")

with open("frutas.txt", "r", encoding = "utf-8") as f:
    todas_as_linhas = f.readlines()
    print("---- Printando a lista ----")
    print(todas_as_linhas)

    print("---- Printando os elementos da lista individualmente ----")
    for linha in todas_as_linhas:
        print(linha, end="")

--- Usando readlines() ---
---- Printando a lista ----
['Maçã\n', 'Banana\n', 'Uva\n', 'Laranja']
---- Printando os elementos da lista individualmente ----
Maçã
Banana
Uva
Laranja

## `write()`
- Escreve todo o conteúdo numa única string. Ou seja, é como se ele fosse uma única linha.

### Como escrever mais de uma linha?
- No `write()` é preciso delimitar as quebras de linha com `\n`

---

## `writelines()`
- Escreve múltiplas strings que estão num iterável
- Também não acrescenta as quebras de linha automaticamente.
- Pode ser mais eficiente que chamar `write()` num loop

In [6]:
with open("frutas.txt", "r", encoding = "utf-8") as file:
    frutas = file.readlines()

frutas.pop()
frutas.extend(["Laranja\n", "Mamão\n", "Abacate\n", "Abacaxi\n"])


with open("frutas2.txt", "w+", encoding = "utf-8") as file2:
    file2.writelines(frutas)
    file2.seek(0, 0)
    print(file2.read())

Maçã
Banana
Uva
Laranja
Mamão
Abacate
Abacaxi



---
# Diferença entre `a` e `w`
- O `w` apaga tudo que já foi escrito no arquivo e escreve novamente
- O `a` adiciona ao final do arquivo
    - A escrita é feita com `write` ou `writelines()` como já vimos anteriormente

---
# Módulo `os`
- É preciso importar

## `os.listdir()`
- Lista os nomes de todos os arquivos e diretórios que estão dentro de um diretório específico. Para isso, passamos o caminho do diretório.
- Se quisermos nos referir ao diretório atual, usamos `.`
- Se quisermos nos referir ao diretório de nível abaixo (pai), usamos `..`

## `os.remove` ou `os.unlink`
- Apaga o arquivo

## `os.rename`
- Renomeia o arquivo ou move ele
- Para mover, passamos o novo caminho com o nome novo ou mesmo nome. Se quiser apenas renomear, passamos apenas o novo nome, pois iremos renomear para o mesmo lugar

In [7]:
import os

arquivos = os.listdir(".")
for arquivo in arquivos:
    print(arquivo)

.ipynb_checkpoints
08_funcoes.ipynb
09_dict.ipynb
10_set.ipynb
11_shallow_and_deep_copy.ipynb
12_lambda_sort_sorted.ipynb
13_kwargs.ipynb
14_importando_modulos_e_biblioteca_padrao.ipynb
15_list-comprehension.ipynb
16_dict_e_set-comprehension_isinstance.ipynb
17_dir_hasattr_getattr.ipynb
18_reversed_zip_zip_longest.ipynb
19_iterables_and_iterators.ipynb
20_generator-expressions.ipynb
21_generator-function.ipynb
22_try-except_exceptions_else_finally_raise.ipynb
23_modularizacao.ipynb
24_pacotes.ipynb
25_decorators.ipynb
26_zip_longest_count_combinations_permutations_product_groupby.ipynb
27_map_partial_generato_type_esgotamento_de_iterators_filter_reduce.ipynb
28_funcoes_recursivas.ipynb
29_ambientes_virtuais.ipynb
30_manipulacao_de_arquivos.ipynb
31_json.ipynb
exercicios
frutas.txt
frutas2.txt
teste.txt


- Veja que temos os arquivos frutas, frutas2 e teste, todos txt que foram criados anteriormente. Para excluí-los, podemos usar o `os.remove()` e `os.unlink()`

In [8]:
os.remove("frutas.txt")
os.unlink("frutas2.txt")

arquivos = os.listdir(".")
for arquivo in arquivos:
    print(arquivo)

.ipynb_checkpoints
08_funcoes.ipynb
09_dict.ipynb
10_set.ipynb
11_shallow_and_deep_copy.ipynb
12_lambda_sort_sorted.ipynb
13_kwargs.ipynb
14_importando_modulos_e_biblioteca_padrao.ipynb
15_list-comprehension.ipynb
16_dict_e_set-comprehension_isinstance.ipynb
17_dir_hasattr_getattr.ipynb
18_reversed_zip_zip_longest.ipynb
19_iterables_and_iterators.ipynb
20_generator-expressions.ipynb
21_generator-function.ipynb
22_try-except_exceptions_else_finally_raise.ipynb
23_modularizacao.ipynb
24_pacotes.ipynb
25_decorators.ipynb
26_zip_longest_count_combinations_permutations_product_groupby.ipynb
27_map_partial_generato_type_esgotamento_de_iterators_filter_reduce.ipynb
28_funcoes_recursivas.ipynb
29_ambientes_virtuais.ipynb
30_manipulacao_de_arquivos.ipynb
31_json.ipynb
exercicios
teste.txt


- Veja que agora os arquivos `frutas` e `frutas2` foram apagados.

In [9]:
os.rename("teste.txt", "novo_nome.txt")
arquivos = os.listdir()
for arquivo in arquivos:
    print(arquivo)

.ipynb_checkpoints
08_funcoes.ipynb
09_dict.ipynb
10_set.ipynb
11_shallow_and_deep_copy.ipynb
12_lambda_sort_sorted.ipynb
13_kwargs.ipynb
14_importando_modulos_e_biblioteca_padrao.ipynb
15_list-comprehension.ipynb
16_dict_e_set-comprehension_isinstance.ipynb
17_dir_hasattr_getattr.ipynb
18_reversed_zip_zip_longest.ipynb
19_iterables_and_iterators.ipynb
20_generator-expressions.ipynb
21_generator-function.ipynb
22_try-except_exceptions_else_finally_raise.ipynb
23_modularizacao.ipynb
24_pacotes.ipynb
25_decorators.ipynb
26_zip_longest_count_combinations_permutations_product_groupby.ipynb
27_map_partial_generato_type_esgotamento_de_iterators_filter_reduce.ipynb
28_funcoes_recursivas.ipynb
29_ambientes_virtuais.ipynb
30_manipulacao_de_arquivos.ipynb
31_json.ipynb
exercicios
novo_nome.txt


- O arquivo foi renomeado com sucesso