# Aula 06 - Arquivos

Utilizar arquivos é uma forma de garantir o armazenamento
permanente dos dados que são importantes no seu programa, pois
nenhuma variável continua existindo depois que o programa termina.


Então , utilizar um arquivo é uma maneira excelente de trabalhar com
a entrada e a saída de dados para os programas

Existem dois tipos de arquivos:

* Arquivos texto :

    * Arquivos contendo linhas de texto formadas por strings

    * A codificação dos caracteres da string pode ser definido pela plataforma ou pelo
    programador

    * Normalmente salvos com a extensão . txt , cvs ou . dat

* Arquivos binários :

    * Todos os dados são lidos e gravados exatamente como estão, em bytes, sem
    qualquer tratamento.

 O tratamento de arquivos envolve os seguintes passos:
1. Definição do arquivo 
    
2. Abrir
    
3. Manipular
    
4. Fechar
    


### Abertura de Arquivos - `open()`
*Na programação , assim como na nossa interação com o computador , o primeiro
passo para acessar um arquivo é abri lo.

* Para abrir o arquivo , utilizamos a função `open()`

Sintaxe:
```python
    arquivo = open("NomeDoArquivo.extensão(.png,.txt,.csv)","Modo de abertura de arquivos")
```
* A variável arquivo salva o arquivo em si.
    * É por meio desta variável que executaremos as funções de escrita e leitura.

* Os modos mais comum são:
<div align = "center">

|   MODO   	| OPERAÇÂO                                                                 	|
|:--------:	|--------------------------------------------------------------------------	|
|     r    	| leitura (read)                                                           	|
|     w    	| escrita ( write ) um arquivo pre existente com o mesmo nome será apagado 	|
|     a    	| escrita , preservando o conteúdo existente append()                      	|
|     +    	| atualização (combinado com r ou w)                                       	|
| rb ou wb 	| Leitura ou escrita de arquivo binário.                                   	|

</div>

__Lembrando que o arquivo lido, deve estar na mesa pasta se o comando descrito na Sintaxe for utilizado. Caso contratirio utilize esse modo :__

```python
    arquivo = open("C://Users//Usuario//Desktop//Aprendizado//Python//Aula6.py")
```
Clique com o botão direito do mouse sobre o arquivo que queira utilizar e procure por propriedades e copie o local do arquivo, nao se esquecendo de colocar backslash do modo apresentado

### Abrindo o arquivo com uma determinada codificação
* Por padrão, o Python abre o arquivo usando a codificação de caracteres
padrão do sistema operacional.

* Falamos dos direntes tipos na aula 5

* O terceiro parâmetro da função open() é opcional e nele especificamos a
codificação do arquivo:
```python
    meufile = open("test.dat","w", encoding = "utf - 8")
```

### Teste de abertura
* E se o arquivo não existir???

* Se o programa tentar abrir um arquivo inexistente para leitura, o
interpretador retornará um erro:
```python
    FileNotFoundError: [Errno 2] No such file or directory : 'teste.dat'
``` 
* Soluções:
  * Verificar se o arquivo existe antes de abrir

  * Abrir usando controle de exceções

Verificar se o arquivo existe antes de abrir :
```python
  import os
  import sys
  exists = os.path.isfile (('teste.dat'))
  if exists == False:
    print (("O arquivo não existe.))
    sys.exit()
```


### Fechamento `file.close()`
* Depois que escrevemos no arquivo, precisamos fechá lo, utilizando o
método close()

```python
    arquivo.close()
```
* É sempre importante fechar o arquivo para informar ao Sistema
Operacional que não vamos mais utilizá-lo:

    * O Sistema Operacional salva as informações que queremos escrever em
uma memória auxiliar chamada buffer e deixa a operação de escrever
realmente no arquivo só quando informamos que vamos fechá-lo.
* Se não fechamos um arquivo, corremos o risco de perder o que
gostaríamos de escrever.

Ainda:

* Fechar um arquivo liberará os recursos que estavam vinculados ao
arquivo.

    * Python tem um coletor de lixo para limpar objetos não referenciados,
mas não devemos confiar nele para fechar o arquivo.


### Manipulação
* A manipulação dos arquivos constitui em ler, escrever, remover e
inserir dados dos arquivos.

* Pode ser feita em arquivos texto e binários.

Entrada:
```python
    read(), readline(), readlines()
```
Saída:
```python
    write(), writelines()
```

### Leitura
* Para ler do arquivo, precisamos seguir o procedimento:

    * Abrir o arquivo em modo leitura "r"
```python
    meuFile = open("test.txt","r")
```    
* Utilizar um método para ler o arquivo.

* Fechar o arquivo com o método close:
```python
    meuFile.close()
``` 
Podemos usar os seguintes métodos:
```python
    readline () retorna uma string com uma linha
``` 
```python
    read () retorna uma string com tudo
``` 
```python
    readlines () retorna uma lista com todas as linhas como itens da lista.
``` 

__Para os exemplos a seguir utilizaremos o arquivo test.txt__

### Leitura - file.readlines()
Devolve todas as linhas do arquivo, como uma lista onde cada linha é
um item no objeto da lista.


In [36]:
meuFile = open("test.txt", "r")
texto = meuFile.readlines()
print(texto)
meuFile.close()

['Linha: 0\n', 'Linha: 1\n', 'Linha: 2\n', 'Linha: 3\n', 'Linha: 4\n', 'Linha: 5\n', 'Linha: 6\n', 'Linha: 7\n', 'Linha: 8\n', 'Linha: 9\n', 'Linha: 10\n', 'Linha: 11\n', 'Linha: 12\n', 'Linha: 13\n', 'Linha: 14\n', 'Linha: 15\n', 'Linha: 16\n', 'Linha: 17\n', 'Linha: 18\n', 'Linha: 19\n', 'Linha: 20\n', 'Linha: 21\n', 'Linha: 22\n', 'Linha: 23\n', 'Linha: 24\n', 'Linha: 25\n', 'Linha: 26\n', 'Linha: 27\n', 'Linha: 28\n', 'Linha: 29\n', 'Linha: 30\n', 'Linha: 31\n', 'Linha: 32\n', 'Linha: 33\n', 'Linha: 34\n', 'Linha: 35\n', 'Linha: 36\n', 'Linha: 37\n', 'Linha: 38\n', 'Linha: 39\n', 'Linha: 40\n', 'Linha: 41\n', 'Linha: 42\n', 'Linha: 43\n', 'Linha: 44\n', 'Linha: 45\n', 'Linha: 46\n', 'Linha: 47\n', 'Linha: 48\n', 'Linha: 49\n', 'Linha: 50\n', 'Linha: 51\n', 'Linha: 52\n', 'Linha: 53\n', 'Linha: 54\n', 'Linha: 55\n', 'Linha: 56\n', 'Linha: 57\n', 'Linha: 58\n', 'Linha: 59\n', 'Linha: 60\n', 'Linha: 61\n', 'Linha: 62\n', 'Linha: 63\n', 'Linha: 64\n', 'Linha: 65\n', 'Linha: 66\n', 'Lin

Percebece que não é mostrado todos os item, pois eles estão guardados em uma lista.

A seguir, com o uso da ferramenta de repetição `For` mostrarei todas as linhas:

In [37]:
meuFile = open("test.txt", "r")
for linha in meuFile.readlines():
    print(linha)
meuFile.close()

Linha: 0

Linha: 1

Linha: 2

Linha: 3

Linha: 4

Linha: 5

Linha: 6

Linha: 7

Linha: 8

Linha: 9

Linha: 10

Linha: 11

Linha: 12

Linha: 13

Linha: 14

Linha: 15

Linha: 16

Linha: 17

Linha: 18

Linha: 19

Linha: 20

Linha: 21

Linha: 22

Linha: 23

Linha: 24

Linha: 25

Linha: 26

Linha: 27

Linha: 28

Linha: 29

Linha: 30

Linha: 31

Linha: 32

Linha: 33

Linha: 34

Linha: 35

Linha: 36

Linha: 37

Linha: 38

Linha: 39

Linha: 40

Linha: 41

Linha: 42

Linha: 43

Linha: 44

Linha: 45

Linha: 46

Linha: 47

Linha: 48

Linha: 49

Linha: 50

Linha: 51

Linha: 52

Linha: 53

Linha: 54

Linha: 55

Linha: 56

Linha: 57

Linha: 58

Linha: 59

Linha: 60

Linha: 61

Linha: 62

Linha: 63

Linha: 64

Linha: 65

Linha: 66

Linha: 67

Linha: 68

Linha: 69

Linha: 70

Linha: 71

Linha: 72

Linha: 73

Linha: 74

Linha: 75

Linha: 76

Linha: 77

Linha: 78

Linha: 79

Linha: 80

Linha: 81

Linha: 82

Linha: 83

Linha: 84

Linha: 85

Linha: 86

Linha: 87

Linha: 88

Linha: 89

Linha: 90

Linha: 91

`f.readline()` lê uma única linha do arquivo    
* Um caracter newline (\n) é deixado no final da sequência, e só é omitido na
última linha do arquivo se o arquivo não terminar em uma nova linha.
* Isso torna o valor de retorno inequívoco:
    * Se o final do arquivo foi atingido, `f.readlines()` retorna uma string vazia.
    * Se for lida uma linha em branco, `f.readlines()` retorna uma string contendo "\n".


Por que pula duas linhas?    
* O programa anterior pula duas linhas a cada impressão:
    * Executa um newline devido ao \n que esta na string lida.
    * Executa um newline devido ao print
* Como resolver isso?
```python
    print(linha, end = "")
```    
Sem pular duas linhas:


In [38]:
meuFile = open("test.txt", "r")
for linha in meuFile.readlines():
    print(linha, end = "")
meuFile.close()

Linha: 0
Linha: 1
Linha: 2
Linha: 3
Linha: 4
Linha: 5
Linha: 6
Linha: 7
Linha: 8
Linha: 9
Linha: 10
Linha: 11
Linha: 12
Linha: 13
Linha: 14
Linha: 15
Linha: 16
Linha: 17
Linha: 18
Linha: 19
Linha: 20
Linha: 21
Linha: 22
Linha: 23
Linha: 24
Linha: 25
Linha: 26
Linha: 27
Linha: 28
Linha: 29
Linha: 30
Linha: 31
Linha: 32
Linha: 33
Linha: 34
Linha: 35
Linha: 36
Linha: 37
Linha: 38
Linha: 39
Linha: 40
Linha: 41
Linha: 42
Linha: 43
Linha: 44
Linha: 45
Linha: 46
Linha: 47
Linha: 48
Linha: 49
Linha: 50
Linha: 51
Linha: 52
Linha: 53
Linha: 54
Linha: 55
Linha: 56
Linha: 57
Linha: 58
Linha: 59
Linha: 60
Linha: 61
Linha: 62
Linha: 63
Linha: 64
Linha: 65
Linha: 66
Linha: 67
Linha: 68
Linha: 69
Linha: 70
Linha: 71
Linha: 72
Linha: 73
Linha: 74
Linha: 75
Linha: 76
Linha: 77
Linha: 78
Linha: 79
Linha: 80
Linha: 81
Linha: 82
Linha: 83
Linha: 84
Linha: 85
Linha: 86
Linha: 87
Linha: 88
Linha: 89
Linha: 90
Linha: 91
Linha: 92
Linha: 93
Linha: 94
Linha: 95
Linha: 96
Linha: 97
Linha: 98
Linha: 99
Linha: 100

### Simplificando a leitura file.readline

* Para ler linhas de um arquivo, você pode fazer loop sobre o objeto de arquivo.

* Isso é eficiente em memória, rápido e leva a um código simples.

* Usa o `file.realine()` implicitamente...

In [39]:
meuFile = open("test.txt", "r")
for linha in meuFile:
    print(linha, end = "")
meuFile.close()

Linha: 0
Linha: 1
Linha: 2
Linha: 3
Linha: 4
Linha: 5
Linha: 6
Linha: 7
Linha: 8
Linha: 9
Linha: 10
Linha: 11
Linha: 12
Linha: 13
Linha: 14
Linha: 15
Linha: 16
Linha: 17
Linha: 18
Linha: 19
Linha: 20
Linha: 21
Linha: 22
Linha: 23
Linha: 24
Linha: 25
Linha: 26
Linha: 27
Linha: 28
Linha: 29
Linha: 30
Linha: 31
Linha: 32
Linha: 33
Linha: 34
Linha: 35
Linha: 36
Linha: 37
Linha: 38
Linha: 39
Linha: 40
Linha: 41
Linha: 42
Linha: 43
Linha: 44
Linha: 45
Linha: 46
Linha: 47
Linha: 48
Linha: 49
Linha: 50
Linha: 51
Linha: 52
Linha: 53
Linha: 54
Linha: 55
Linha: 56
Linha: 57
Linha: 58
Linha: 59
Linha: 60
Linha: 61
Linha: 62
Linha: 63
Linha: 64
Linha: 65
Linha: 66
Linha: 67
Linha: 68
Linha: 69
Linha: 70
Linha: 71
Linha: 72
Linha: 73
Linha: 74
Linha: 75
Linha: 76
Linha: 77
Linha: 78
Linha: 79
Linha: 80
Linha: 81
Linha: 82
Linha: 83
Linha: 84
Linha: 85
Linha: 86
Linha: 87
Linha: 88
Linha: 89
Linha: 90
Linha: 91
Linha: 92
Linha: 93
Linha: 94
Linha: 95
Linha: 96
Linha: 97
Linha: 98
Linha: 99
Linha: 100

### Leitura - `file.read()`
* Para ler o conteúdo de um arquivo, pode se também utilizar` f.read(size)`

* Lê “ size ” quantidade de dados e os retorna como uma string (no modo de texto) ou bytes
objeto (no modo binário).

* "size"  é um argumento numérico opcional

* Se o final do arquivo tiver sido atingido, `f.read()` retornará uma sequência vazia (")

* Quando “ size ” for omitido ou negativo, todo o conteúdo do arquivo será lido e devolvido:

    * É seu problema se o arquivo for maior que a memória da sua máquina.
* Quando “ size ” for menor que o tamanho do arquivo:
    * a função “ size ” lê quantidade de dados e os retorna como uma string (no modo de texto) ou
bytes objeto (no modo binário).

Para ler do arquivo, podemos utilizar o método `read()`

Exemplo:


In [40]:
meuFile = open("test.txt", "r")
for linha in meuFile.read(49):
    print(linha, end = "")
meuFile.close()

Linha: 0
Linha: 1
Linha: 2
Linha: 3
Linha: 4
Linh

Note que lemos apenas 49 carcteres da do arquivo test.txt

### Escrita - `file.write()`
* Para escrever no arquivo, utilizamos o método `write()`:
```python
    file.write("Texto a ser escrito no arquivo")
```
* O método write funciona de maneira similar que o print com marcadores (%d , %f , %s ),

__IMPORTANTE!__
Precisamos sempre incluir o “\n” quando queremos ir para a próxima

* Retorna o número de caracteres escrito no arquivo


In [41]:
meuFile = open("NovoTexto.txt", "w")
for linha in range(1,101):
    meuFile.write("Numero %d\n" % linha)
meuFile.close()

Voce pode verificar no local aonde voce salvou este codigo, um novo arquivo irá aparecer!!!

### Escrita - file.writelines()
* O método writelines () grava os itens de uma lista para o arquivo.
* Onde os textos serão inseridos depende do modo de abertura do arquivo:
    * "a": Os textos serão inseridos na posição atual do arquivos, por padrão no final do arquivo.
    * "w": O arquivo será esvaziado antes que os textos sejam inseridos na posição inicial do arquivo.

In [42]:
meuFile = open("Texto3.txt","w")
meuFile.writelines(["\n Hello There!","\n\n General Kenobi"])
meuFile.close()

Exemplo: Exemplo: gerar e gravar números pares e
ímpares em arquivos
separados. Números de
0 a 999.


In [43]:
impares = open("impares.txt","w")
pares = open("pares.txt","w")

for n in range(1000):
    if n % 2 == 0:
        pares.write("%d\n" %n)
    else:
        impares.write("%d\n" %n)

impares.close()
pares.close()        

### Arquivos - Codificação
* Python 3 sempre armazena strings de texto como sequências em codificação
Unicode.

    * Estes são valores na faixa 0 0x10FFFF.

    * Eles nem sempre correspondem diretamente aos caracteres que você lê na tela,
mas essa distinção não importa para a maioria das tarefas de manipulação de
texto.

* Para armazenar texto em outro formato, você deve especificar uma
codificação para esse arquivo usando “ encoding = xxx".

In [44]:
meuFile = open("Testeemoji.txt","w", encoding="utf-8")
meuFile.write("Teste UTF-8\n")
meuFile.write("\U0001f600\n")
meuFile.write("\U0001f606\n")
meuFile.write("\U0001f923\n")
meuFile.close()

### Arquivo ASCII

In [51]:
meuFile = open("TesteASCII.txt","w", encoding="ascii")
meuFile.write("Teste UTF-8\n")
meuFile.write(u'\u000e\n')
meuFile.write(u"\u0023\n")
meuFile.write(u"\u0024\n")
meuFile.close()

### Gerando Arquivos de Arquivos
Exemplo: Utilizando o arquivo “pares. gerado no último exemplo,
vamos criar outro arquivo que deve conter somente os números
múltiplos de 4.

In [55]:
multiplosde4 = open("multiplosde4.txt","w")
pares = open("pares.txt","r")
for linhas in pares.readlines():
    if int(linhas)%4 == 0:
        multiplosde4.write(linhas)
pares.close()
multiplosde4.close()        

* Até agora, estamos utilizando somente um dado por linha.

* Porém, podemos salvar informações correlatas na mesma linha.

    Exemplo:
    * Criar um arquivo com o nome e o telefone de pessoas, conforme são digitados
pelo usuário.

    * O programa deve funcionar em loop até que o nome digitado seja vazio.

In [56]:
contatos = open("Contatos.dat","w")
nome = input("Nome: ")
telefone = input("Telefone: ")

while nome != "":       #Para sair é so apresentar 2 vezes enter
    contatos = open("Contatos.dat","a")
    contatos.write("%s %s\n" %(nome,telefone))
    contatos.close()
    nome = input("Nome: ")
    telefone = input("Telefone: ")

### Arquivos - Leitura de dois dados na mesma linha
* Entendendo melhor o `readlines()`
    * O `readlines ()` retorna uma lista onde cada uma das linhas ocupa uma
posição/ índice: 

In [57]:
contatos = open("Contatos.dat","r")
conteudo_do_arquivo = contatos.readlines()
print(conteudo_do_arquivo)

['Gabriel (55)123456789\n', 'Joao (55)987654321\n']


### Método `split(x)`
Divide as informações no caractere informado como parâmetro.

In [59]:
nome, telefone = input("Entre com o nome e o telefone: ").split(" ")
print(nome)
print(telefone)

['Gabriel']
['(55)123456789']


* Como ler uma linha com duas informações

In [69]:
contatos = open("Contatos.dat","r")
contato = []

for linha in contatos.readlines():
    linha_separada = linha.split(" ")
    contato.append(linha_separada)

print(contato[0])
print(contato[0][1])

['Gabriel', '(55)123456789\n']
(55)123456789

