# Trabalhando com arquivos no Google Colab

Com relaçao à leitura e escrita de arquivos, o ambiente Google Colab funciona de maneira diferente de um computador usual.

Se você executar um program Python em seu próprio computador, o interpretador Python vai receber uma operação ```open``` (abrir um arquivo) e em seguida vai negociar com o sistema operacional do seu computador para localizar o arquivo (se ele já existir) ou para criar um arquivo novo. As operações seguintes de leitura ou escrita de dados vão acionar o disco rígido do seu computador, trazendo dados do disco ou inserindo novos dados nele.

O Google Colab é um ambiente de computação em *nuvem*, isso significa que o código Python de um caderno interativo não é executado no seu computador, mas sim em algum computador remoto, conectado à rede. Isso implica que:
- Quando você criar um arquivo no Colab, este arquivo será armazenado na infra-estrutura de nuvem do Google, e não no seu computador.
- Se você quiser abrir um arquivo já existente em um caderno interativo, antes será preciso armazenar este arquivo na infra-estrutura do Google.

Na célula de código abaixo, nós vamos criar um arquivo novo chamado *teste.txt*, escrever algumas linhas no arquivo e depois fechá-lo. A operação de fechar o arquivo (método ```close```) é necessária para garantir que todo o conteúdo seja efetivamente gravado no dispositivo de armazenamento (geralmente, o disco rígido).

In [1]:
ref_arquivo = open("./teste.txt", "w")
ref_arquivo.write("Primeira linha\n")
ref_arquivo.write("Segunda linha\n")
ref_arquivo.write("Terceira linha\n")
ref_arquivo.close()

Agora, vamos abrir o arquivo criado acima e imprimir seu conteúdo, para verificar se foi gravado corretamente. Note que para cada linha lida, nós usamos o método ```rstrip```  para remover do string qualquer caractere de nova linha (```"\n"```) que possa existir.

In [2]:
ref2 = open("./teste.txt", "r")
for linha in ref2:
    print(linha.rstrip())
ref2.close()


Primeira linha
Segunda linha
Terceira linha


Se você quiser transferir um arquivo do Google Colab para seu computador, você precisará fazer o *download* dele. A célula abaixo mostra como fazer isso usando código. O método ```download``` inicia o processo de baixar arquivos do seu navegador.

In [3]:
# Precisamos importar este módulo para poder fazer o download
from google.colab import files

files.download("./teste.txt")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Caso você queira trabalhar no Colab com algum arquivo já existente, uma das maneiras é fazer o *upload* do arquivo para a infra-estrutura do Google. Note que este armazenamento não é permanente: o arquivo permanecerá na estrutura do Google enquanto durar a *sessão* em que você está usando o caderno interativo. Grosso modo, isso significa que o arquivo será acessível enquanto o caderno estiver aberto no seu navegador, depois disso o arquivo será apagado. **Importante**: **não use** o Colab para fazer cópia de segurança de arquivos, sempre mantenha uma cópia independente de arquivos importantes.

O código abaixo mostra como fazer *upload* de um arquivo usando código Python. Você pode copiar e colar o código abaixo em uma célula quando precisar usar um arquivo que exista em seu computador dentro de um caderno interativo. Quando você executar o código abaixo, um botão aparecerá logo abaixo da célula, com o texto *Choose files*, ao clicar nesse botão, uma nova janela será mostrada e você poderá usá-la para selecionar um ou mais arquivos para upload (para transferir mais de um arquivo, segure a tecla ```Ctrl``` pressionada enquanto clicar no nome dos arquivos desejados).

In [4]:
# Precisamos importar este módulo para poder fazer o upload
from google.colab import files

# O método upload abre um menu para selecionarmos os
# arquivos que queremos transferir para o ambiente do
# Colab
# A variável uploaded guarda uma sequência de arquivos
# foram gravados na infra-estrutura do Colab
uploaded = files.upload()

nome = None
# vamos imprimir os nomes dos arquivos
for nome in uploaded:
    print("Nome:", nome)

# vamos abrir um arquivo para leitura
if nome != None:
    ref_arq = open(nome, "r")
    print(ref_arq.readline())


Saving teste.txt to teste (1).txt
Nome: teste (1).txt
Primeira linha

