# Arquivos em Python



## Motivação
Precisamos de uma forma de armazenar dados permanentemente.

Além disso, precisamos de uma forma simples de entrada e saída de dados para programas. Afinal, ficar digitando sempre várias entradas pode levar muito tempo.

A maneira mais simples de se resolver isso é através de **arquivos**.


## Arquivos

Um **arquivo** é uma área em um disco, gerenciada pelo sistema operacional, onde podemos ler e gravar informações.

Do ponto de vista do programa, só precisamos saber do seu nome e como os dados serão lidos e/ou gravados (se em modo texto ou binário).

## Abrindo arquivos

Para acessar um arquivo, antes de mais nada, precisamos abri-lo.

Durante a abertura, dizemos o **nome do arquivo** (inclusive com o nome do diretório onde ele está) e o tipo de operação que queremos realizar: leitura e/ou escrita.

Em Python abrimos arquivos com a função open e ela retorna um objeto para acessar o arquivo.

```python
arquivo = open( nome_do_arquivo, modo)
```

## Modos de abertura

* `r` : leitura, o arquivo já deve existir (padrão)
* `w`: escrita, apaga o conteúdo se já existir. Cria um novo arquivo se não existir.
* `a`: escrita, mas preserva o conteúdo se já existir. O a é de append.
* `t`: modo texto (padrão)
* `b`: modo binário
* `+`: atualização: leitura e escrita

Alguns modos podem ser combinados: "r+", "w+", "a+", "r+b", "w+b".

Para outros modos e mais detalhes consulte a [documentação do Python](https://docs.python.org/3/library/functions.html#open).

## Fechando arquivos

Depois quando não precisarmos mais do arquivo (a leitura ou escrita já foram concluídas), é necessário fechá-lo.

```python
arquivo.close()
```

> **Lembre-se sempre de fechar o arquivo quando terminar de lidar com ele. Deixar um arquivo aberto pode corrompê-lo se outros programas tentarem acessá-lo ao mesmo tempo.**

In [1]:
# Abrindo um arquivo para leitura em modo texto
arquivo = open("arquivos/exemplo.txt","r")
print(type(arquivo))
arquivo.close()

FileNotFoundError: [Errno 2] No such file or directory: 'arquivos/exemplo.txt'

In [2]:
# Abrindo um arquivo para escrita. Se o arquivo não existir, ele será criado.
# Se o arquivo já existe, ele será apagado. Cuidado!!
arq2 = open("arquivos/apagueme.txt","w")
arq2.close()

## Leitura e Escrita de arquivos

Depois de abrir um arquivo, usamos as seguintes funções:

* `conteudo = arquivo.read()`: lê todo o conteúdo de arquivo de uma vez como uma string.
* `linhas = arquivo.readlines()`: lê todo o conteúdo de arquivo de uma vez, separando cada linha de texto como um elemento da lista linhas 
* `arquivo.write(conteudo)`: para escrever o conteúdo no arquivo.

In [3]:
# Abrindo um arquivo para leitura em modo texto
arq1 = open("arquivos/exemplo.txt","r")
# Ler todo o arquivo de uma só vez
texto = arq1.read()
print(texto)
arq1.close()

Isso deve ser o arquivo inteiro.



Arquivos só podem ser lidos uma vez depois de abertos. 

Para lê-los novamente, você precisa fechá-los e abri-los, ou mover o cursor para o início do arquivo novamente:

In [None]:
# Abrindo um arquivo para leitura em modo texto
arq1 = open("arquivos/exemplo.txt","r")
# Ler todo o arquivo de uma só vez
texto = arq1.read()
print("texto: ", texto)
# Tentar ler o arquivo mais uma vez
texto2 = arq1.read()
print("texto2:", texto2)
arq1.close()

In [None]:
# Abrindo um arquivo para leitura em modo texto
arq1 = open("arquivos/exemplo.txt","r")
# Ler todo o arquivo de uma só vez
texto = arq1.read()
print("texto: ", texto)
# Movendo o cursor para o início do arquivo antes de lê-lo novamente:
arq1.seek(0)
texto2 = arq1.read()
print("texto2:", texto2)
arq1.close()

Quando quisermos guardar as linhas do arquivo em uma lista em memória, usamos a função `.readlines()`:

In [None]:
# Abrindo um arquivo para leitura em modo texto
arq2 = open("arquivos/exemplo2.txt","r")
# Ler as linhas do arquivo de uma vez, guardando-as em uma lista:
linhas = arq2.readlines()
print(linhas)
arq2.close()

Outra maneira de ler as linhas de um arquivo é através do comando for:

```python
for linha in arquivo:
    # faça alguma coisa com a linha
```


In [None]:
# Abrindo um arquivo para leitura em modo texto
arq2 = open("arquivos/exemplo2.txt","r")
# Ler uma linha do arquivo de cada vez 
for linha in arq2:
    print(linha)
arq2.close()

Vejamos um exemplo com a função `.write(conteudo)`:

In [4]:
# Abrindo um arquivo para escrita em modo texto
# Se o arquivo numeros.txt na pasta arquivos já existir, ele será apagado.
# Se ele não existir, será criado
arquivo = open("arquivos/numeros.txt","w")
# Vamos escrever um número para cada linha do arquivo, de 1 a 100
for numero in range(1,101):
    arquivo.write("%d\n" % numero)
arquivo.close()
print("Fim.")

Fim.


# Exercícios

## Exercício 1

Como primeiro exercício, leia o conteúdo do arquivo criado na célula anterior e mostre os números na tela. Não se esqueça de fechar o arquivo quando terminar de lê-lo. Você pode usar qualquer uma das funções de leitura que vimos anteriormente.

In [None]:
# Escreva o seu código aqui

# Abra o arquivo para leitura

# Leia o conteúdo do arquivo e mostre na tela

# Feche o arquivo

## Exercício 2

Escreva um programa que lê o arquivo `arquivos/v_cholerae_ori.txt` que contém a sequência de nucleotídeos que formam a origem do genoma de *Vibrio Cholerae* e mostra quantos nucleotídeos existem na origem.

In [5]:
# Escreva o seu código aqui

# Abra o arquivo para leitura

# Leia o arquivo e calcule o tamanho da string

# Feche o arquivo

## Exercício 3

Escreva um programa que gera dois arquivos com 500 linhas cada. No primeiro arquivo, o programa escreve apenas os números pares de 1 a 1000 e no outro os ímpares.

In [None]:
# Escreva o seu código aqui

# Abra os arquivos para escrita

# Escreva os números apropriados nos arquivos

# Feche os arquivos

## Exercício 4
Na pasta arquivos, existe um arquivo chamado `notas.txt` que contém um número inteiro de 0 a 100 em cada linha. Leia esse arquivo, calcule e mostre a média das notas.

In [None]:
# Escreva o seu código aqui

# Abra o arquivo para leitura

# Leia o conteúdo do arquivo

# Calcule a média e mostre na tela

# Feche o arquivo

## Arquivos mais complexos

Algumas vezes os arquivos que precisamos ler possuem várias informações em cada linha (imagine uma planilha de dados).

Nesse caso, usaremos outras funções que nos ajudarão a processar as informações.


## Exemplo: Agenda de telefones

Por exemplo, suponha que tenhamos um arquivo de nomes e telefones (`telefones.txt`), cujo conteúdo é mostrado abaixo:

```
ringo,6543
elvis,7723
paul,4897
mary,1234
john,1475
mark,2003
george,1029
peter,4456
```

Queremos ler os dados e guardá-los em uma agenda de telefones: no nosso caso, usaremos um dicionário onde as chaves são os nomes e os valores serão os telefones (iremos supor que não existam nomes repetidos).

Iremos precisar das seguintes funções:


## Função `.split(sep)`

Usamos a função `split(sep)` para transformar uma string em uma lista, quebrando os elementos em `sep`, sep é uma string separadora que será ignorada e não será inserida na lista.

Por exemplo:

In [4]:
linha = "ringo,6543\n"
lista = linha.split(',')
print(lista)

['ringo', '6543\n']


## Função `.strip()`

Usamos a função `strip()` para remover os caracteres em branco e quebras de linha do começo e do final de uma string.

São removidos brancos, tabs e \n (você também pode passar uma string de outros caracteres que queira remover. Por exemplo:

In [5]:
linha = "ringo,6543\n"
lista = linha.split(',')
lista[1] = lista[1].strip()
print(lista)

['ringo', '6543']


## Função `.join(list)`

Para salvar a agenda para um arquivo, você pode usar formatação de string ou a função `join(list)`.

A função `join(list)` é uma função de string que cria uma outra string concatenando todas as strings em `list`. O separador utilizado é a própria string que chamou o join(list). Por exemplo:

In [None]:
lista = ['ringo', '6543']
linha = ','.join(lista)
print(linha)

Exemplo completo nas próximas células:

In [6]:
# Definindo a agenda como um dicionário:
agenda = {}
# Abrindo o arquivo de telefones
arquivo = open('arquivos/telefones.txt', 'r')
for linha in arquivo:
    dados = linha.split(',')
    nome = dados[0]
    telefone = dados[1].strip()
    agenda[nome] = telefone # Inserindo no dicionário
arquivo.close()
print('Agenda carregada com sucesso.')

Agenda carregada com sucesso.


1234


In [9]:
# inserindo um novo contato na agenda
agenda['phil'] = '9873'

In [11]:
# Abrindo o arquivo de telefones para escrita
arquivo = open('arquivos/telefones.txt', 'w')
for nome in agenda:
    arquivo.write('%s,%s\n' % (nome,agenda[nome]))
arquivo.close()
print('Agenda salva com sucesso.')

Agenda salva com sucesso.


# Exercícios

## Exercício 5

Ler um arquivo de notas em `'arquivos/notas2.txt'` (nomes e notas separados por tab). Mostre a lista de alunos aprovados e a lista de alunos reprovados (ambas em ordem alfabética). Para ser aprovado a média deve ser maior ou igual a 7.0

In [None]:
# Escreva o seu código aqui

# Abra o arquivo para leitura

# Leia o conteúdo do arquivo

# Calcule os resultados dos alunos 

# Mostre a lista de alunos aprovados e reprovados

# Feche o arquivo

## Exercício 6

Ler um arquivo de notas em `'arquivos/notas3.txt'` (nome, nota1 e nota2 separados por tab, com uma linha de cabeçalho). Mostre a lista de alunos aprovados e a lista de alunos reprovados (ambas em ordem alfabética). Para ser aprovado, a média das notas deve ser superior ou igual a 7.0.

In [None]:
# Escreva o seu código aqui

# Abra o arquivo para leitura

# Leia o conteúdo do arquivo

# Calcule os resultados dos alunos 

# Mostre a lista de alunos aprovados e reprovados

# Feche o arquivo

Ao terminar, você já pode ir para o próximo notebook: [Exercícios sobre Arquivos](26-arquivos-exercicios.ipynb).