# Manipulando arquivos

Em Python, utilizamos objetos de arquivo para interagir com arquivos externos no seu computador. Esses objetos de arquivo podem ser de qualquer tipo de arquivo que você tenha no seu computador, seja um arquivo de áudio, um arquivo de texto, e-mails, documentos do Excel, etc. Lembre-se de que provavelmente você precisará instalar certas bibliotecas ou módulos para interagir com esses diversos tipos de arquivo, mas eles estão facilmente disponíveis (abordaremos o download de módulos mais adiante no curso).

Python possui uma função embutida chamada "open" que nos permite abrir e trabalhar com tipos de arquivo básicos. No entanto, primeiro precisamos de um arquivo. Vamos usar alguns recursos do IPython para criar um arquivo de texto! 

## Escrevendo um Arquivo no IPython
 Esta função é específica para notebooks Jupyter! Como alternativa, você pode criar rapidamente um arquivo .txt simples com um editor de texto como o Sublime Text.

In [6]:
%%writefile test.txt
Oi, este eh um arquivo de teste rapido.

Overwriting test.txt


## Python abrindo um arquivo

Vamos começar abrindo o arquivo "test.txt" que está localizado no mesmo diretório que este caderno. Por enquanto, trabalharemos com arquivos localizados no mesmo diretório do caderno ou script .py que você está usando.

É muito fácil cometer um erro neste passo:

In [7]:
myfile = open('oops.txt')

FileNotFoundError: [Errno 2] No such file or directory: 'oops.txt'

Para evitar esse erro, certifique-se de que seu arquivo .txt está salvo na mesma localização que o seu caderno. Para verificar a localização do seu caderno, use o comando **pwd** (print working directory):

In [8]:
pwd

'c:\\CDA\\CDA\\2. Criando Automações'

**Alternativamente, para acessar arquivos de qualquer local em seu computador, basta fornecer o caminho completo do arquivo.** 

Para Windows, você precisa usar duas barras invertidas para que o Python não trate a segunda barra invertida como um caractere de escape. Um caminho de arquivo tem a seguinte forma:

```python
myfile = open("C:\\Users\\SeuNomeDeUsuário\\Pasta\\meuarquivo.txt")
```

Para MacOS e Linux, você usa barras na direção oposta:

```python
myfile = open("/Users/SeuNomeDeUsuário/Pasta/meuarquivo.txt")
```

In [9]:
my_file = open('test.txt')

In [10]:
# Agora podemos ler o arquivo
my_file.read()

'Oi, este eh um arquivo de teste rapido.\n'

In [11]:
# Mas o que acontece se tentarmos lê -lo novamente?
my_file.read()

''

Isso acontece porque você pode imaginar que o "cursor" de leitura está no final do arquivo depois de tê-lo lido. Portanto, não há mais nada para ler. Podemos redefinir o "cursor" de leitura da seguinte forma:

In [12]:
# Procure o início do arquivo (índice 0)
my_file.seek(0)

0

In [13]:
# Agora leia novamente
my_file.read()

'Oi, este eh um arquivo de teste rapido.\n'

Você pode ler um arquivo linha por linha usando o método `readlines`. Tenha cuidado com arquivos grandes, pois tudo será mantido na memória. Aprenderemos a iterar sobre arquivos grandes mais adiante no curso.

In [14]:
# ReadLines retorna uma lista das linhas no arquivo
my_file.seek(0)
my_file.readlines()

['Oi, este eh um arquivo de teste rapido.\n']

Quando você terminar de usar um arquivo, é sempre uma boa prática fechá-lo.


In [15]:
my_file.close()

É uma boa prática fechar o arquivo após terminar de trabalhar com ele em Python por várias razões:

- Liberação de Recursos: Ao fechar um arquivo, você libera recursos do sistema operacional que estavam sendo utilizados por ele. Isso é especialmente importante em sistemas com recursos limitados, como dispositivos embarcados ou servidores.

- Garantir que os Dados Sejam Gravados: Em alguns casos, o Python pode fazer um cache dos dados que foram escritos em um arquivo, e eles podem não ser gravados imediatamente no disco. Fechar o arquivo garante que todos os dados sejam gravados no disco.

- Evitar Vazamentos de Memória: Se você não fechar um arquivo, o Python ainda manterá uma referência a ele na memória, mesmo depois que terminar de trabalhar com ele. Isso pode causar vazamentos de memória se você estiver lidando com muitos arquivos ou se estiver em um loop que abre muitos arquivos.

- Evitar Problemas de Concorrência: Em ambientes multi-threaded ou multi-processamento, deixar arquivos abertos pode causar problemas de concorrência se vários threads ou processos tentarem acessar o mesmo arquivo simultaneamente.


Para garantir que os arquivos sejam fechados mesmo em caso de exceção, é comum usar a declaração with, que garante que o arquivo seja fechado automaticamente ao sair do bloco with. Por exemplo:



In [34]:
with open("test.txt", "r") as my_file:
    # Faça algo com o arquivo
    my_file.seek(0)
    print(my_file.read())
# O arquivo é fechado automaticamente aqui

Esta é uma nova linha


## Escrevendo um arquivo

Por padrão, a função `open()` permite apenas a leitura do arquivo. Para escrever no arquivo, você deve passar o argumento `'w'`. Por exemplo:

In [29]:
# Adicione um segundo argumento à função, 'w', que significa Write.
# Passando 'w+' permite ler e escrever no arquivo

my_file = open('test.txt','w+')

**<strong><font color='red'>Tenha cuidado!</font></strong>** Abrir um arquivo com `'w'` ou `'w+'` trunca o original, ou seja, tudo o que estava no arquivo original **é deletado**!

In [30]:
# Escreva no arquivo
my_file.write('Esta é uma nova linha')

21

In [31]:
# Leia o arquivo
my_file.seek(0)
my_file.read()

'Esta é uma nova linha'

In [32]:
my_file.close()  # Sempre faça isso quando terminar 

## Anexando a um Arquivo

Passar o argumento `'a'` abre o arquivo e coloca o ponteiro no final, de modo que qualquer coisa escrita é anexada. Como `'w+'`, `'a+'` nos permite ler e escrever em um arquivo. Se o arquivo não existir, um novo será criado.

In [35]:
my_file = open('test.txt','a+')
my_file.write('\nEste é um texto sendo anexado a test.txt')
my_file.write('\nE outra linha aqui.')

20

In [36]:
my_file.seek(0)
print(my_file.read())

Esta é uma nova linha
Este é um texto sendo anexado a test.txt
E outra linha aqui.


In [37]:
my_file.close()

### Anexando com `%%writefile`
Podemos fazer a mesma coisa usando a mágica da célula IPython:

In [39]:
%%writefile -a test.txt

Este é um texto sendo anexado a test.txt
E outra linha aqui.


Appending to test.txt


Adicione um espaço em branco se você quiser que a primeira linha comece em sua própria linha, pois o Jupyter não reconhecerá sequências de escape como `\n`.

## Iterando sobre um arquivo

Vamos dar uma breve prévia de um loop *for* iterando sobre um arquivo de texto. Primeiro, vamos criar um novo arquivo de texto com alguma mágica do IPython:

In [40]:
%%writefile test.txt
Primeira Linha
Segunda Linha

Overwriting test.txt


Agora, podemos usar um pouco de fluxo para dizer ao programa em todas as linhas do arquivo e fazer algo:

In [41]:
for line in open('test.txt'):
    print(line)

Primeira Linha

Segunda Linha



Obs. Por não chamar `.read()` no arquivo, o arquivo de texto inteiro não foi armazenado na memória.
