## Lógica de programação II - Arquivos

Na aula de hoje iremos explorar os seguintes tópicos em Python:

- Arquivos de texto
- CSV
- Json


### Arquivos

Até o momento, todas as informações eram armazenadas na memória RAM, ou seja, uma vez que o programa/notebook fosse finalizado, seja por desligarmos o computador ou por reiniciar o kernel, as informações de cada linha de código eram perdidas. Sendo necessário a execução completa do programa/células, para termos acessos aos dados novamente.

Em outras palavras não tinhamos a **persistência** dos dados. No programa de cadastros, por exemplo, era necessário a reinserção de todos os dados dos usuários para que pudesse ser reaproveitado. Um processo pouco prático e eficiente. Para contornar e permitir que esses dados sejam reaproveitados no mesmo programa ou em diferentes aplicações, podemos **persistir essas informações** no formato de **arquivos**. Esses arquivos são armazenados em unidades de armazenamento, como SSD ou HDD, sendo ele local (seu computador, por exemplo) ou num servidor da nuvem.

#### Arquivos em Python

Há dois tipos de arquivos: binários e texto

**Texto:**

Arquivos de texto são representados sequências de caracteres (ASCII, por exemplo) separado por linhas. Tipicamente arquivos de texto são fácilmente entendidos por humanos.

**Binários:**

São arquivos que incluem dados que não foram escritos utilizando um padrão de codificação de caracteres, esses arquivos são armazenados da mesma forma que foram armazenados na memória durante o processamento. 


Um passo importante ao manipular arquivos é **fechar** o mesmo, utilizando a método `close`. 

- Se o arquivo for alterado porém não finalizado, suas modificações não serão salvas
- Se o arquivo não for finalizado, outros programas podem ter problemas de acesso a este arquivo.



#### Escrevendo arquivos

Há três passos para a escrita de arquivos de texto

- 1. Abertura do arquivo no modo correto
- 2. Escrita do conteúdo
- 3. Fechar o arquivo

|modo|simbolo|descrição|
|--|--|--|
|read|`r`|lê um arquivo existente|
|write|`w`|cria um novo arquivo|
|append|`a`|abre um arquivo existente para adicionar informações ao seu final|
|update|`+`|ao combinar com outros modos, permite a alteração do arquivo existente (ex: `r+` abre um arquivo existente permitindo a sua modificação (read and write)|
|text|`t`|Abre um arquivo no modo texto (default)|
|binary|`b`|abre um arquivo no modo binário|

**Quando utilizamos o modo write, um novo arquivo é criado**

In [1]:
# Abrindo um arquivo
arquivo = open(
    './ola.txt', # Nome do arquivo
    "w" # Modo de escrita
)
arquivo.write('Olá mundo') # Escreve a frase
arquivo.close()

Arquivos de texto somente aceitam strings!

In [2]:
# Abrindo um arquivo
arquivo = open(
    './ola.txt', # Nome do arquivo
    "w" # Modo de escrita
)
arquivo.write('Olá mundo') # Escreve a frase
arquivo.write(1) # Escreve o número
arquivo.close()

TypeError: write() argument must be str, not int

Precisamos inserir novas linhas ('\n') para separar as frase

In [4]:
# Abrindo um arquivo
arquivo = open(
    './ola2.txt', # Nome do arquivo
    "w" # Modo de escrita
)
arquivo.write('Olá mundo\n') # Escreve a frase
arquivo.write('Olá mundo') # Escreve o número
arquivo.close()

In [6]:
# Abrindo um arquivo
arquivo = open(
    './ola3.txt', # Nome do arquivo
    "w" # Modo de escrita
)
arquivo.write('Olá mundo') # Escreve a frase
arquivo.write('\n') # Escrevendo uma nova linha (newline character)
arquivo.write('Olá mundo') # Escreve o número
arquivo.close()

**Adicionando novo conteúdo**

In [5]:
arquivo = open(
    './ola4.txt',
    'a'
)
frases = ['Hoje era um bom dia!', 'Estava sol e consegui caminhar.']
arquivo.write('\n'.join(frases))
arquivo.close()

In [7]:
frases2 = ['Amanhã será um bom dia também!', 'Apesar de chover conseguirei estudar.']
arquivo.write('\n'.join(frases2))

ValueError: I/O operation on closed file.

No passo anterior, o arquivo estava fechado e por este motivo não conseguimos escrever um novo conteúdo! Precisamos abrir novamente o arquivo!

In [8]:
arquivo = open(
    './ola4.txt',
    'a'
)

arquivo.write('\n'.join(frases2))
arquivo.close()

Note que não houve separação entre a segunda frase e a terceira frase!
Por este motivo é muito comum utilizar compreensões de lista!

In [9]:
arquivo = open(
    './ola5.txt',
    'a'
)
frases = ['Hoje era um bom dia!', 'Estava sol e consegui caminhar.', 'Não sei se vou pra faculdade hoje']
arquivo.write(''.join([f'{frase}\n' for frase in frases]))
arquivo.close()

arquivo = open(
    './ola5.txt',
    'a'
)
frases2 = ['Amanhã será um bom dia também!', 'Apesar de chover conseguirei estudar.']
arquivo.write(''.join([f'{frase}\n' for frase in frases2]))
arquivo.close()

Como é "difícil" lembrar de fechar o arquivo, o Python permite que seja utilizada uma forma "mais segura" quando trabalhamos com conexões (arquivos/banco de dados, por exemplo). 

De forma resumida damos um contexto utilizando a palavra reservada `with`. Ao executar esse bloco de código, ele irá fechar a conexão ou o arquivo para a gente.

In [10]:
with open('ola6.txt', 'w') as arquivo:
    arquivo.write('Olá tudo bem?\nQue lindo dia!')

#### Lendo arquivos

Para ler o conteúdo de arquivos podemos utilizar o método `read`, note que o arquivo precisa estar no modo de leitura (`r`)

In [11]:
arquivo = open('ola6.txt', 'r')
print(arquivo)

<_io.TextIOWrapper name='ola6.txt' mode='r' encoding='UTF-8'>


Podemos ler linha a linha

In [15]:
arquivo.readline()

''

In [None]:
arquivo.readline()

'Que lindo dia!'

In [None]:
arquivo.readline()

''

In [16]:
arquivo.close()

Para ler o arquivo todo podemos utilizar o `read`

In [17]:
arquivo = open('ola6.txt', 'r')
print(arquivo)
texto = arquivo.read()
print(texto)
arquivo.close()

<_io.TextIOWrapper name='ola6.txt' mode='r' encoding='UTF-8'>
Olá tudo bem?
Que lindo dia!


In [None]:
texto

'Olá tudo bem?\nQue lindo dia!'

É muito comum termos que manipular os dados de texto, por exemplo separar em linhas

In [None]:
frases = texto.split('\n')

In [None]:
frases

['Olá tudo bem?', 'Que lindo dia!']

**Exercício 1**

Crie um arquivo chamado `frutas.txt`.

Nesse arquivo adicione em cada linha o nome de uma fruta contida na lista frutas.

In [None]:
frutas = ['maça', 'acerola', 'uva']

with ... as ...:
  ...

**Exercício 2**

Leia o arquivo `frutas.txt` criado acima atribua o seu conteúdo em uma lista, em que cada elemento represente uma fruta.

O nome da nova lista deve ser `frutas`

In [None]:

with ... as ...:
  ...

print(frutas)

#### Escrevendo tabelas

O formato mais comum para trabalhar com tabelas, é o uso de um formato especifico chamado de `csv` (Comma-separated values, valores separados por virgula).

In [21]:
tabela = [['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
          ['Luke', 7, 9, 15],
          ['Han', 4, 7, 10],
          ['Leia', 9, 9, 16]]
tabela

[['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
 ['Luke', 7, 9, 15],
 ['Han', 4, 7, 10],
 ['Leia', 9, 9, 16]]

Escrevendo um arquivo csv

In [22]:
def escreve_linha(arquivo, linha):
    arquivo.write(','.join(linha)) # Escrevendo a linha separada por virgula
    arquivo.write('\n') # Adicionando uma nova linha a cada linha inserida
    return True

def escreve_tabela(tabela, nome_arquivo):
    # Gerenciando contexto
    # Abrindo o arquivo com o `nome_arquivo`
    with open(nome_arquivo, 'a') as arquivo: 
        for idx, linha in enumerate(tabela, start=1):
            print(f'Escrevendo linha #{idx}/{len(tabela)}')
            sucesso = escreve_linha(arquivo, linha)
            print('Linha escrita com sucesso')
    return True

In [23]:
escreve_tabela(tabela, 'notas.csv')

Escrevendo linha #1/4
Linha escrita com sucesso
Escrevendo linha #2/4


TypeError: sequence item 1: expected str instance, int found

Um erro ocorreu! Pois só conseguimos escrever string!

In [26]:
def converter_para_string(linha):
    # Função para converter para string
    linha_string = [str(ele) for ele in linha]
    return linha_string

def escreve_linha(arquivo, linha):
    arquivo.write(','.join(linha)) # Escrevendo a linha separada por virgula
    arquivo.write('\n') # Adicionando uma nova linha a cada linha inserida
    return True

def escreve_tabela(tabela, nome_arquivo):
    # Gerenciando contexto
    # Abrindo o arquivo com o `nome_arquivo`
    with open(nome_arquivo, 'w') as arquivo: 
        for idx, linha in enumerate(tabela, start=1):
            print(f'Escrevendo linha #{idx}/{len(tabela)}')
            linha_string = converter_para_string(linha)
            sucesso = escreve_linha(arquivo, linha_string)
            print('Linha escrita com sucesso')
            print(f'Arquivo, "{nome_arquivo}", escrito com sucesso!')
    return True

In [27]:
escreve_tabela(tabela, 'notas.csv')

Escrevendo linha #1/4
Linha escrita com sucesso
Arquivo, "notas.csv", escrito com sucesso!
Escrevendo linha #2/4
Linha escrita com sucesso
Arquivo, "notas.csv", escrito com sucesso!
Escrevendo linha #3/4
Linha escrita com sucesso
Arquivo, "notas.csv", escrito com sucesso!
Escrevendo linha #4/4
Linha escrita com sucesso
Arquivo, "notas.csv", escrito com sucesso!


True

Apesar de ser simples essa operação, precisamos codificar algumas funções!

Para facilitar esse processo podemos utilizar o módulo `csv` do Python

In [28]:
import csv

In [29]:
tabela = [['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
          ['Luke', 7, 9, 15],
          ['Han', 4, 7, 10],
          ['Leia', 9, 9, 16]]
tabela

[['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
 ['Luke', 7, 9, 15],
 ['Han', 4, 7, 10],
 ['Leia', 9, 9, 16]]

Escrevendo arquivos csv de forma simples

In [31]:
with open('notas2.csv', 'w') as arquivo:
    escritor = csv.writer(arquivo, delimiter=',', lineterminator='\n')
    escritor.writerows(tabela)

Podemos utilizar dicionários!

In [40]:
tabela_dict = [{'Aluno': 'Luke', 'Nota 1': 7, 'Nota 2': 9, 'Presenças': 15},
 {'Aluno': 'Han', 'Nota 1': 4, 'Nota 2': 7, 'Presenças': 10},
 {'Aluno': 'Leia', 'Nota 1': 9, 'Nota 2': 9, 'Presenças': 16}]

colunas = tabela_dict[0].keys()

In [41]:
with open('notas_dict.csv', 'w') as arquivo:
    escritor = csv.DictWriter(arquivo, fieldnames=colunas, lineterminator='\n')
    escritor.writeheader() # Escrevendo os nomes das colunas
    escritor.writerows(tabela_dict)

**Lendo o csv**

In [35]:
with open('notas_dict.csv', 'r') as arquivo:
    planilha = csv.reader(arquivo, delimiter=',', lineterminator='\n')
    tabela = list(planilha)

In [36]:
tabela

[['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
 ['Luke', '7', '9', '15'],
 ['Han', '4', '7', '10'],
 ['Leia', '9', '9', '16']]

In [39]:
frase = "Camisa, Criança"
frase.split(',')

['Camisa', ' Criança']

**Exercício**

Escreva um arquivo no formato `tsv` (Tab-separated values), cujo simbolo é `\t`.

Para tal utilize os dados abaixo da variável `tabela`.

Após a sua escrita, leia o mesmo arquivo utilizando o módulo `csv` e de forma clássica utilizando o `read`.

In [None]:
tabela = [['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
 ['Luke', '7', '9', '15'],
 ['Han', '4', '7', '10'],
 ['Leia', '9', '9', '16']]

with open('notas.tsv', 'w') as arquivo:
  escritor = csv.writer(arquivo, delimiter=..., lineterminator='\n')  # Preencha aqui
  escritor.... # Preencha aqui



In [None]:
# Lendo o arquivo
with open('notas.tsv', 'r') as arquivo:
  planilha = csv.reader(arquivo, delimiter=..., lineterminator='\n')  # Preencha aqui
  tabela = ... # Preencha aqui
print(tabela)

#### JSON

JSON é uma sigla para `JavaScript Object Notation`. Apesar dessa estrutura de arquivo ser primeiro utilizada em linguagens web, esse formato de arquivo é amplamente utilizada por diversas aplicações.

Um dos motivos é que a representação de objetos nesse formato é legível e de fácil entendimento para humanos.

Em JavaScript temos:
```javascript
{
  nome: 'Mario',
  modulo: 3,
  media: 9.5
}
```

No exemplo acima, ele é parecido com os dicionários em Python.

```Python
{
  "nome": "Mario",
  "modulo": 3,
  "media: 9.5
}
```

Os valores de um json podem assumir diferentes tipos, como inteiros, reais, strings, booleanos, nulos...

|Python|Json|
|--|--|
|dict|	Object|
|list|	Array|
|tuple|	Array|
|str|	String|
|int|	Number|
|float|	Number|
|True|	true|
|False|	false|
|None|	null|



**Json para dicionário**

In [42]:
# Importando o módulo para trabalhar com json
import json

O `json.loads` permite que seja carregada um texto (string) no formato Json e seja retornado um dicionário

In [43]:
jogador = '{"nome": "Mario", "pontuação":100}'

dicionario = json.loads(jogador)
print('string json', jogador)

print('dicionario', dicionario)

print('nome', dicionario.get('nome'))

string json {"nome": "Mario", "pontuação":100}
dicionario {'nome': 'Mario', 'pontuação': 100}
nome Mario


**Convertendo para Json**

Uma forma de persistir os dados, sem ser tabulares (estruturados) é no formato Json!

Para converter uma estrutura Python em Json utilizamos o `json.dumps` que retorna uma string no formato Json.

In [44]:
dados = {
    "jogadores": [
        {
        "nome": "Fulano",
        "pontuacao": 20,
        "level": 3
    },
        {
        "nome": "Maria",
         "pontuacao": 100,
         "level": 4
    }
    ],
    "max_levels": 100,
    "max_vidas": 5,
    "versao": 1.0,
    "autores": ["João", "Helder"],
    "infos": None
}
dados

{'jogadores': [{'nome': 'Fulano', 'pontuacao': 20, 'level': 3},
  {'nome': 'Maria', 'pontuacao': 100, 'level': 4}],
 'max_levels': 100,
 'max_vidas': 5,
 'versao': 1.0,
 'autores': ['João', 'Helder'],
 'infos': None}

In [45]:
string_dados = json.dumps(dados)
print(type(string_dados))
print(string_dados)

<class 'str'>
{"jogadores": [{"nome": "Fulano", "pontuacao": 20, "level": 3}, {"nome": "Maria", "pontuacao": 100, "level": 4}], "max_levels": 100, "max_vidas": 5, "versao": 1.0, "autores": ["Jo\u00e3o", "Helder"], "infos": null}


In [46]:
# Deixando mais bonito o json
string_dados = json.dumps(dados, indent=2)
print(type(string_dados))
print(string_dados)

<class 'str'>
{
  "jogadores": [
    {
      "nome": "Fulano",
      "pontuacao": 20,
      "level": 3
    },
    {
      "nome": "Maria",
      "pontuacao": 100,
      "level": 4
    }
  ],
  "max_levels": 100,
  "max_vidas": 5,
  "versao": 1.0,
  "autores": [
    "Jo\u00e3o",
    "Helder"
  ],
  "infos": null
}


**Salvando um arquivo json**

In [47]:
json.dump(dados, open('dados.json', 'w'), indent=2)

**Carregando um arquivo json**

In [48]:
dados_novos = json.load(open('dados.json', 'r'))

In [49]:
dados_novos

{'jogadores': [{'nome': 'Fulano', 'pontuacao': 20, 'level': 3},
  {'nome': 'Maria', 'pontuacao': 100, 'level': 4}],
 'max_levels': 100,
 'max_vidas': 5,
 'versao': 1.0,
 'autores': ['João', 'Helder'],
 'infos': None}

Logo temos que:

Arquivos no formato json são ótimos para armazenar dados que não tem uma estrutura tabular (como no exemplo acima).

São um formato que permitem que seja obtido estruturas de objeto de forma simples e rápida (dicionários, listas).

São amplamente utilizados como armazenamento de informações, como no exemplo acima, e para configurações de sistema!

Utilizamos:
Os comandos com **`s`** para realizar operações locais e sem **`s`** para operações de arquivo

`loads`: transforma uma **string json** em um objeto

`dumps`: transforma um objeto em uma **string json**

`load`: carrega um **arquivo json** em um objeto

`dump`: salva um objeto em um **arquivo json**

