# Aula 20b - Arquivos

Este documento apresenta brevemente como ler dados de arquivos de texto na linguagem Python.

## 1. Abrindo Arquivos em Python

Para trabalhar com arquivos na linguagem Python,
utilizamos a função `open`, que precisa de dois
parâmetros:

1. Uma string informando o caminho completo do arquivo a ser aberto
    - Pode ser usada só com o nome do arquivo, para arquivos no mesmo 
      diretório do arquivo sendo executado
2. Uma string informando a forma de abertura do arquivo
    - Leitura: `"r"`
    - Escrita: `"w"`
    - Leitura e escrita: `"r+"`
    - Escrita acrescentando ao final do arquivo: `"a"`

Todo arquivo é aberto como arquivo de texto, a não
ser quando assinalado com (`"b"`), que abre o
arquivo como binário.

Para os exemplos a seguir, baixe o arquivo [texto.txt](https://raw.githubusercontent.com/ect-info/POO_2021.2/master/docs/20b-arquivos/texto.txt) e mova-o para a mesma pasta deste
notebook.

In [1]:
# Abrir um arquivo (modo leitura)

# O arquivo lista.txt deve estar armazenado no mesmo diretório 
arq = open('texto.txt', 'r')
print(type(arq)) # Tipo de arq

# Fechar o arquivo! (sempre devemos fechar os arquivos abertos)
arq.close()

<class '_io.TextIOWrapper'>


O código acima cria um objeto `arq` da classe `TextIOWrapper`
(manipulador de arquivo de texto), abrindo o arquivo
indicado no modo leitura.

Depois de utilizar o arquivo, sempre deve ser chamado  o método `close` para liberar os recursos.

## 2. Arquivos e Exceções

As operações com arquivos sempre podem lançar exceções. Portanto, é recomendado utilizar blocos ```try... except```. 

In [2]:
try:
    arq = open('arq_que_nao_existe.txt', 'r') # o arquivo não existe!
except Exception as err:
    print(err)    
finally:
    arq.close() # bloco finally que sempre executa

[Errno 2] No such file or directory: 'arq_que_nao_existe.txt'


## 3. Lendo de Arquivos em Python

Após aberto nos modos `r` ou `r+`, é possível
ler as informações do arquivo com alguns métodos
da classe ```TextIOWrapper```:

- `readline`: retorna uma string contendo a próxima
  linha do arquivo. Este método altera a posição do "ponteiro"
  no arquivo para o início da próxima linha, então se o método
  for chamado novamente, a linha apontada pelo ponteiro será lida.
- `readlines`: retorna uma `list` de strings contendo todo o conteúdo 
  do arquivo, sendo uma linha do arquivo por item da lista.
  Altera a posição do "ponteiro" no arquivo para o final do arquivo.
- `read`: retorna uma string contendo todo o conteúdo do arquivo em 
  uma única string. Altera a posição do ponteiro no arquivo para o 
  final do arquivo.

In [4]:
print('--- Ler todas as linhas v 1.0 ---')
arq = open('texto.txt', 'r')
try:
    l = arq.readline()
    while l: #EOF (end of file) == '' == False
        print(l) #Note os 2 quebra linhas (\n)
        # para remover a quebra: print(l, end='') ou l = rstrip('\n')
        l = arq.readline()
except Exception as err:
    print(err)
finally:
    arq.close() #Sempre executar a operação close

print('\n--- Ler todas as linhas v 2.0 ---')
arq = open('texto.txt', 'r')
try:
    for l in arq.readlines():
        print(l, end='') 
except Exception as err:
    print(err)
finally:
    arq.close()
    
print('\n--- Ler todas as linhas v 3.0---')
#Podemos iterar diretamente no objeto arq. A forma mais pythonica!
arq = open('texto.txt', 'r')
try:
    for l in arq:
        print(l, end='')
except Exception as err:
    print(err)
finally:
    arq.close()
    
print('\n--- Ler todo o arquivo ---')
arq = open('texto.txt', 'r')
try:
    print(arq.read())
except Exception as err:
    print(err)
finally:
    arq.close() #Sempre executar a operação close

--- Ler todas as linhas v 1.0 ---
linha 1

segunda linha

linha 03

esta é a quarta linha

5a. linha

--- Ler todas as linhas v 2.0 ---
linha 1
segunda linha
linha 03
esta é a quarta linha
5a. linha
--- Ler todas as linhas v 3.0---
linha 1
segunda linha
linha 03
esta é a quarta linha
5a. linha
--- Ler todo o arquivo ---
linha 1
segunda linha
linha 03
esta é a quarta linha
5a. linha


# 4. Escrevendo em Arquivos

Após aberto nos modos `w`, `r+` ou `a`,
é possível escrever informações no arquivo com alguns métodos
da classe ```TextIOWrapper```:

- `write`: escreve uma string passada como parâmetro no
  arquivo (não adiciona quebra de linha)
- `writelines`: escreve cada uma das strings contidas em uma lista
  passada como parâmetro no arquivo (não adiciona quebra de linha)
  
Utilizando um editor de texto do sistema operacional, veja o conteúdo do arquivo novo.txt após executar o código.

In [None]:
try:
    arq = open('novo.txt', 'w')
    arq.write('Texto 1\n')
    arq.write('Texto 2\n')
except Exception as err:
    print(err)
finally:
    arq.close()

try:
    # O conteúdo é sobrescrito!
    arq = open('novo.txt', 'w')
    arq.write('Texto 3\n')
    arq.write('Texto 4\n')
except Exception as err:
    print(err)
finally:
    arq.close()

try:
    #Adicionar no final 
    arq = open('novo.txt', 'a')
    arq.write('Texto 5\n')
    arq.write('Texto 6\n')
except Exception as err:
    print(err)
finally:
    arq.close()


## 5. Trabalhando com Arquivos de Forma Pythônica

A forma Pythônica de se trabalhar com arquivos é utilizando é utilizando o comando `with` seguido do comando `open` para abrir o arquivo desejado nomeando-o com um nome qualquer, como a seguir.

In [6]:
# Abrir, ler e fechar (A forma mais pythonica)
with open('texto.txt') as arq:
    for l in arq:
        print(l, end='')

linha 1
segunda linha
linha 03
esta é a quarta linha
5a. linha

Quando o `with` é utilizado, um `try.. except/finally`
é utilizado de forma implícita, deixando o código mais limpo.

### Extra: como funciona o `with`

O comando `with` foi criado para facilitar o trabalho
com o uso de recursos, como arquivos.

Este comando executa os métodos mágicos `__enter__`
e `__exit__` de objetos considerados gerenciadores de
recursos, tal como é a classe `TextIOWrapper`.

O código da classe `C` a seguir implementa os métodos mágicos
`__enter__` e `__exit__` de forma a deixá-los compatíveis
com o uso esperado com o comando `with`.

In [None]:
class C:
    def __init__(self, val):
        self.val = val
        print('Init...')
        
    def m(self):
        print('Método m...')
        
    def __enter__(self):
        print('Entrando...')
        return self 
    
    def __exit__(self, ex_type, ex_value, ex_traceback):
        #Não se preocupe por enquanto com os parâmetros desse método.
        print(f'Saindo...{ex_type, ex_value, ex_traceback}')

#Versão não pythonica
c = C(3)
c.__enter__()
try:
    c.m()
finally:
    c.__exit__(None,None,None)

#Versão pythonica
with C(3) as c2: #note que __enter__ retorna self
    c2.m()

with C(3) as c2: #note que __enter__ retorna self
    print(f'{1 / 0}') # Divisão por 0 (lança uma exceção )
    #Note que Python passa automaticamente os parâmetros necessários ao método __exit__
    c2.m()


Em suma, o bloco de código
```
with EXP:
    BLOCO
```

é equivalente a
```
EXP.__enter__()
try:
    BLOCO
finally:
    EXP.__exit__(ex_type, ex_value, ex_traceback)
```

## Prática - 3.1b - Arquivo com Livros

Um arquivo `.txt` está estruturado da seguinte forma:

- A sua primeira linha contém um inteiro $n$ com a quantidade de 
  livros que estão no arquivo.
- Logo após, o arquivo contém $3n$ linhas, que por sua vez possuem:
    - O título de um livro
    - O ano da edição do livro
    - O ISBN (código identificador) do livro

Considere a classe `Livro` especificada de acordo com a
`Prática 3.1a` (com o lançamento de exceções implementado como pedido naquela prática).

Implemente uma classe `LeitorLivro` que deve
ler os dados dos livros de um arquivo `.txt` no
formato acima.

Atributos da classe:

- `nome_arquivo`: `str` denotando o nome do arquivo a ser aberto
- `livros`: `list` para armazenar uma lista de livros lida do arquivo
- `arquivo`: `TextIOWrapper` para armazenar o arquivo sendo lido

Unico método da interface pública da classe: `processa`.
Este método é responsável por abrir o arquivo de nome `nome_arquivo` para ler os dados dos livros no arquivo.

A sua classe deve obrigatoriamente ignorar livros com dados inválidos
e adicionar livros com todos os dados válidos à lista de livros que
é atributo de instância da classe.

Por exemplo, uma ideia de código possível para o método seria:

```
def processa(self):
    with open(self.nome_arquivo, 'r') as self.arquivo:
        # Lê a a qtd. de livros n
        # Para i = 0.. n-1
            try:
                l = Livro()
                # Obtém título (método privado auxiliar)
                # Obtém ano (método privado auxiliar)
                # Obtém ISBN (método privado auxiliar)
            except ExcecaoSistema as err: # (prática anterior)
                # Imprime informação dos erros
            else:
                # Adiciona livro à self.livros
```

Ao fazer desta forma, o método é capaz de adicionar livros que foram lidos corretamente à lista e ignorar livros com dados (título, ano ou ISBN) inválidos.
Isto acontece porque qualquer exceção levantada nas chamadas aos setters da classe `Livro` da prática anterior serão tratadas pelo `except ExcecaoSistema` apenas com a impressão do erro.
Como o método contém um laço para ler `n` livros, a leitura
do próximo livro será tentada para o próximo livro.

Os seguintes arquivos `.txt` foram construídos para provocar
diferentes exceções no seu programa:

- [1_dados_corretos.txt](https://raw.githubusercontent.com/ect-info/POO_2021.2/master/docs/20b-arquivos/1_dados_corretos.txt): contém 3 livros válidos
- [2_titulo_em_branco.txt](https://raw.githubusercontent.com/ect-info/POO_2021.2/master/docs/20b-arquivos/2_titulo_em_branco.txt): contém 3 livros. O segundo livro possui título em branco
- [3_ano_invalido.txt](https://raw.githubusercontent.com/ect-info/POO_2021.2/master/docs/20b-arquivos/3_ano_invalido.txt): contém 3 livros. O terceiro livro possui ano inválido
- [4_isbn_invalido.txt](https://raw.githubusercontent.com/ect-info/POO_2021.2/master/docs/20b-arquivos/4_isbn_invalido.txt): contém 3 livros. O terceiro livro possui ISBN inválido

Utilize o block `main` a seguir para testar a sua classe.

In [None]:
if __name__ == "__main__":
    nom_arq = input('Insira o nome do arquivo: ')
    leitor = LeitorLivros(nom_arq)
    leitor.processa()

    print('Livros lidos corretamente do arquivo:')
    for l in leitor.livros:
        print('\t' + str(l))