# Arquivos

Uma característica que nenhum de nossos programas teve agora é a **persistência** de dados. Sempre que nossos programas eram executados, eles precisavam que os usuários digitassem todos os dados de entrada novamente, e após exibir os dados de saída na tela, o programa era fechado e esses dados eram perdidos para sempre.

A persistência se dá através de **arquivos**: estruturas abstratas para armazenar dados em uma memória permanente, como o disco rígido, um _drive_ USB ou um servidor _web_.


## Arquivos em Python
O Python possui algumas funções prontas para manipular arquivos binários puros (onde, conhecendo a estrutura interna de qualquer formato, podemos salvar qualquer tipo de arquivo) e para manipular arquivos de texto (onde os binários são decodificados como _strings_).

Focaremos no básico de manipulação de arquivo de texto, pois, na prática, quando formos trabalhar com arquivos mais complexos, é provável que usaremos bibliotecas específicas para lidar com eles, e elas já terão funções próprias para ler e salvar esses arquivos da maneira correta.



### Abrindo e fechando arquivos
Podemos criar arquivos novos ou abrir arquivos já existentes utilizando a função _open()_. Ela possui 2 argumentos: uma com o caminho do arquivo e outra com o modo de operação. Para saber mais:
<br>
https://www.w3schools.com/python/ref_func_open.asp
<br>
https://docs.python.org/3/library/functions.html#open
<br>

| Modo   | Símbolo | Descrição                                                                                                                             |
|--------|---------|---------------------------------------------------------------------------------------------------------------------------------------|
| _create new_  | x       | Abre exclusivamente para criar, dando falha se o arquivo já existir                                                                                                       |
| _write_  | w       | Abre um arquivo para escrever. Caso arquivo não exista cria um novo arquivo                                                                                                                  |
| _append_ | a       | Abre um arquivo existente para adicionar informações ao seu final                                                                     |
| _read_   | r       | Abre para ler um arquivo existente. Esse é o argumento padrão do parâmetro _mode_ na função _open()_                                                                        |
| _update_ | +       | Abre para atualizar. ao ser combinado com outros modos, permite alteração de arquivo já existente tanto para escrever quanto para ler. exemplo: r+ abre um arquivo existente e permite modificá-lo) |

Após abrirmos (ou criarmos) um arquivo, podemos realizar diversas operações. Ao final de todas elas, devemos **fechar** o nosso arquivo usando a função _close()_. Essa etapa é importante por 2 motivos:
* 1. Se alteramos o arquivo mas não o fechamos, as alterações não serão salvas.
* 2. Se esquecermos de fechar um arquivo, outros programas podem ter problemas de acesso a ele.

A função _open_ retorna alguns dados que devem ser salvos em uma variável que será responsável por guardar alguns dados de acesso ao arquivo, para uso interno do Python.



### Escrevendo arquivos
Para entender melhor o _open_ e o _close_, façamos um programinha que escreve algo em um arquivo. Além das duas funções que já vimos, também utilizaremos a função _write_, que escreve um texto em um arquivo. É quase como um _print_ mais simples, mas ele aceita apenas uma _string_.

In [None]:
arquivo = open("ola.txt", 'x') # cria um arquivo ola.txt
arquivo.write('olá mundo')  # escreve olá mundo no arquivo
arquivo.close()

In [None]:
arquivo = open("ola.txt", 'x') # cria um arquivo ola.txt
arquivo.write('olá pessoal')  # escreve olá mundo no arquivo
arquivo.close()

FileExistsError: [Errno 17] File exists: 'ola.txt'

Por que deu erro aqui?

<br> <br> <br> <br> <br>

Utilizamos o modo 'x' que ele cria um novo arquivo se não existir esse nome

Agora podemos utilizar o modo W para escrever "por cima" caso já tenha um arquivo com esse nome

In [None]:
arquivo = open("ola.txt", 'w') # cria um arquivo ola.txt
arquivo.write('olá de novo mundo')  # escreve olá mundo no arquivo
arquivo.close()

In [None]:
arquivo = open("ola.txt", "a")
arquivo.write('olá de novo mundo')
arquivo.close()

In [None]:
arquivo = open("ola.txt", "a")
arquivo.write('\nolá de novo mundo')
arquivo.close()

Após executar a célula acima, abra a pasta onde seu _notebook_ está salvo. Note que apareceu um ```ola.txt``` lá. Abra-o e verifique seu conteúdo.

### Lendo arquivos
Para ler um arquivo existente, não basta usar o _open_ para abri-lo. É necessário carregar seu conteúdo para uma _string_, de modo que possamos trabalhar com o texto da mesma forma que sempre trabalhamos. A função _read_ faz o oposto da _write_: ela retorna o texto existente no arquivo.

Rode a célula abaixo.

In [None]:
arquivo = open('ola.txt', 'r')
conteudo = arquivo.read()
print(conteudo)
arquivo.close()

olá de novo mundoolá de novo mundo
olá de novo mundo


In [None]:
type(conteudo)

str

In [None]:
conteudo.split("\n")

['olá de novo mundoolá de novo mundo', 'olá de novo mundo']

In [None]:
for element in conteudo.split("\n"):
  print(element)

olá de novo mundoolá de novo mundo
olá de novo mundo


## Gerenciador de contexto

Uma forma alternativa e "mais segura" de trabalhar com arquivos é utilizando um _gerenciador de contextos_. O gerenciador de contextos é, de maneira resumida, um pequeno bloco de código que realiza algumas tarefas e tratamentos de erro de maneira automatizada para nós.

Com ele não precisamos nos preocupar em fechar o arquivo ao final da manipulação, pois ele irá fechar automaticamente para nós ao final do bloco.

In [None]:
with open("ola.txt", 'r') as arquivo:
  conteudo = arquivo.read()
  print(conteudo)

conteudo2 = arquivo.read()

olá de novo mundoolá de novo mundo
olá de novo mundo


ValueError: I/O operation on closed file.

No restante dos exemplos **seguiremos utilizando a primeira forma que aprendemos para reforçar que, por dentro, há sempre uma abertura e um fechamento de arquivo**. Mas sinta-se livre para utilizar a nova forma sempre que quiser!

In [None]:
# obs: também conseguimos criar um arquivo xls
arquivo = open("arquivo_excel_teste.xls", 'x')
arquivo.write('olá mundo')  # escreve olá mundo no arquivo
arquivo.close()

## Utilizando o Google Colab e lendo arquivos do meu Google Drive

- Uma característica diferente que o Google Colab tem das outras IDEs populares é o fato dela estar online e ter facilidade de utilizar o Google Drive

- Por que pode ser importante utilizar o Google Drive?
 - Permite você guardar e ler informações de um local na nuvem
 - Se utilizarmos o diretório padrão ele só persistirá durante o a sessão presente

* Como posso integrar meu notebook no meu google drive? arquivos > montar drive

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


Agora conseguimos interagir com os arquivos do Google Drive da mesma maneira se fosse em outro diretório

In [None]:
arquivo = open("/content/drive/MyDrive/01_arquivo_no_drive.txt","x")
arquivo.write("olá mundo\n")
arquivo.close()

In [None]:
arquivo = open("/content/drive/MyDrive/01_arquivo_no_drive.txt", 'r+')
conteudo = arquivo.read()
print(conteudo)
arquivo.write('olá mundo2\n')
arquivo.close()

olá mundo



In [None]:
arquivo = open("/content/drive/MyDrive/01_arquivo_no_drive.txt","r")
conteudo = arquivo.read()
print(conteudo)
arquivo.close()

olá mundo
olá mundo2



# Exercícios - parte 1


Use o conteúdo ensinado até o momento para realizar os exercícios abaixo.

Para os exercícios envolvendo números, você pode utilizar o arquivo ```numeros.txt``` fornecido junto deste _notebook_ . link do arquivo ```numeros.txt```: https://drive.google.com/file/d/1iKodt0gYVQnwNZ0-FXnW4HBQp8ZS2Ml9/view?usp=sharing


1) Escreva um código que lê um arquivo de texto contendo uma série de números separados por quebra de linha (```'\n'```) e os adiciona a uma lista. Imprima a lista na tela.

In [None]:
arquivo_numeros = open("numeros.txt","r+")
numeros = arquivo_numeros.read()

lista_str_numeros = numeros.split("\n")

print(lista_str_numeros)

2) Escreva um programa que lê um arquivo de texto contendo uma série de números inteiros separados por quebra de linha (```\n```) e escreva na tela o somatório dos números.

In [None]:
arquivo_numeros = open("numeros.txt","r+")
numeros = arquivo_numeros.read()

lista_numeros = []
lista_str_numeros = numeros.split("\n")

for elemento in lista_str_numeros:
    lista_numeros.append(int(elemento))

print(f'A soma dos elementos é {sum(lista_numeros)}')

arquivo_numeros.close()

3) Crie uma função que cheque se um número inteiro é primo (divisível por apenas 1 e por ele mesmo) ou não.
- Se for primo retornar "primo"
- Caso contrário, retorne "não-primo"

In [None]:
def e_primo (num):
    for x in range(2, int(num ** 0.5)+1):
        if num % x == 0:
          return "não-primo"

    return ("primo")

arquivo = open("/content/numeros.txt","r")

num = arquivo.read()
lista_str_numeros = num.split("\n")

for elemento in lista_str_numeros:
    lista_numeros.append(int(elemento))

for num in lista_numeros:
  print(f'{num}: {e_primo(num)}')

- projeto
- exercícios de arquivos
- csv / json
- tratamento de exceção (try/except/else/finally)
- exercicios de tratamento de excecao


4) Escreva um programa que lê um arquivo de texto contendo uma série de números separados por quebra de linha (```\n```). Crie um novo arquivo onde você irá escrever "primo" ou "não-primo" na linha correspondente a cada número.

- Importante: Além dos argumento que já passamos comumente para o open(), passe o argumento 'utf-8' para parâmetro encoding dentro do open().

In [None]:
def is_primo (num):
    for x in range(2, int(num ** 0.5)+1):
        if num % x == 0:
          return False

    return True

arquivo = open("/content/numeros.txt","r")

num = arquivo.read()
lista_str_numeros = num.split("\n")

for elemento in lista_str_numeros:
    lista_numeros.append(int(elemento))

num_primo = open("num_primo.txt", 'x')

for num in lista_numeros:
  if is_primo(num):
    num_primo.write(f'{num} é primo\n')

  else:
    num_primo.write(f'{num} não é primo\n')

arquivo.close()
num_primo.close()

# Arquivos CSV
Muitos dados interessantes ou importantes estão disponíveis na forma de tabela. A capacidade de manipular planilhas foi determinante no sucesso dos computadores pessoais, dada sua importância para empresas e indivíduos.

Aprenderemos a manipular dados utilizando um dos formatos de planilha mais amplamente utilizados na _web_: o formato CSV. Mas antes, como podemos representar tabelas em Python?

## Tabelas em Python
Conforme já mencionamos, temos módulos prontos para realizar muitas tarefas para nós. Um dos módulos mais populares em Python é o _pandas_, que mesmo não vindo instalado por padrão é provavelmente o módulo mais usado para manipular planilhas. Porém, como este é um curso introdutório, convém entendermos um pouquinho de lógica de como manipular uma tabela para futuramente sermos capazes de trabalhar corretamente com os módulos prontos.

Uma das formas mais simples de se representar uma tabela em Python seria através de uma lista de listas. Nossa lista principal seria a tabela como um todo, e cada lista interna seria uma linha da tabela.

Para acessar um elemento individual, utilizamos 2 índices: o primeiro indica a lista interna (linha) e o segundo o elemento individual na lista (coluna). Para percorrer a tabela inteira, utilizamos 2 _for_ aninhados: o mais externo fixa uma linha e o mais interno percorre cada elemento daquela linha.

In [None]:
csv
comma separated values

nome | idade
theo | 50

nome,idade
theo,50

In [None]:
import pandas as pd
pd.DataFrame([["aluno","nota1",'nota2',"presenças"],['luke',7,9,15]] )

Unnamed: 0,0,1,2,3
0,aluno,nota1,nota2,presenças
1,luke,7,9,15


## O formato CSV
A sigla CSV significa _Comma-Separated Values_, ou "valores separados por vírgula". Este formato é uma forma padrão de representar tabelas usando arquivos de texto simples: cada elemento é separado por uma vírgula, e cada linha é separada por uma quebra de linha.

Na prática, nem sempre o padrão é seguido à risca: podemos utilizar outros símbolos para fazer a separação. Um bom motivo é o fato de a vírgula ser utilizada para representar casa decimal em algumas línguas, como a língua portuguesa. O importante é ser coerente: todos os elementos deverão ser separados pelo mesmo símbolo, e todas as linhas deverão ter o mesmo número de elementos.

Caso queira fazer depois: Cole o texto abaixo em um editor de texto puro (como o Bloco de Notas, no Windows) e salve-o com a extensão .csv.

```
Aluno;Nota 1;Nota 2;Presenças
Luke;7;9;15
Han;4;7;10
Leia;9;9;16
```

Caso você tenha um editor de planilha instalado, como o Excel, é provável que o ícone representando o arquivo seja o ícone do editor de planilhas, e não de um arquivo de texto. Abra-o com seu editor de planilha e observe como ele interpreta corretamente os dados!

Devido ao fato de ser um formato aberto (ou seja, não é necessário pagar por propriedade intelectual para usar) e ser muito fácil de manipular, diversos programas diferentes possuem a opção de importar ou exportar dados em CSV, e diversas bases de dados na _web_ fornecem a opção de baixar os dados neste formato.

## O módulo CSV em Python
Devido à facilidade de trabalhar com arquivos CSV, com o que vimos sobre arquivos até o momento já conseguimos facilmente escrever um programinha que escreva uma planilha (representada como lista de listas) em um arquivo CSV. Da mesma forma, utilizando as funções que vimos de _strings_, conseguimos abrir um arquivo CSV e adequadamente reconhecer seus elementos (dica: _split_).

Porém, como mencionamos antes, o Python possui muita coisa pronta, então não precisamos constantemente reinventar a roda. Existe um módulo chamado _csv_ que já vem instalado com o Python. Ele já faz sozinho o serviço bruto de transformar nossa lista de listas em um texto separado por símbolos e vice-versa.


### Escrevendo um CSV
Para escrever um CSV utilizando o módulo, precisamos ter nossos dados representados como uma lista de listas. Criaremos (ou abriremos) um arquivo usando o _open_, como já fizemos antes, e utilizaremos um _CSV writer_ - uma estrutura que guardará as regrinhas para escrever nosso CSV. Execute o exemplo abaixo:

In [None]:
import csv

tabela = [['Aluno','Nota1','Nota2','Presenças'], ['Luke',7,9,15] , ['Han',4,7,10] , ['Leia',9,9,16]]

arquivo = open("alunos.csv", 'w')

escritor = csv.writer(arquivo,delimiter=';', lineterminator='\n')
escritor.writerows(tabela)


arquivo.close()

Após executar o programa acima, deve ter surgido um programa _alunos.csv_ na mesma pasta, e seu editor de planilhas provavelmente o reconhece com sucesso. Se você abri-lo com um editor de texto puro, verá os dados separados por **;** igualzinho ao arquivo que criamos manualmente antes.

### Lendo um CSV
O processo para ler o CSV é semelhante: utilizamos um _CSV reader_, com os mesmos parâmetros utilizados no _CSV writer_. A função _csv.reader_ já retorna para nós uma estrutura iterável (ou seja, que pode ser percorrida com _for_) contendo cada linha já organizada como lista.

In [None]:
import csv

arquivo = open("alunos.csv", 'r')

planilha = csv.reader(arquivo,delimiter=';', lineterminator='\n')
for linha in planilha:
  print(linha)

arquivo.close()

['Aluno', 'Nota1', 'Nota2', 'Presenças']
['Luke', '7', '9', '15']
['Han', '4', '7', '10']
['Leia', '9', '9', '16']


Note que a estrutura **não é** uma lista, mas um objeto iterável. Vejamos o que acontece se tentarmos imprimi-lo diretamente:

In [None]:
import csv

arquivo = open("alunos.csv", 'r')

planilha = csv.reader(arquivo,delimiter=';', lineterminator='\n')
print(planilha)

arquivo.close()

<_csv.reader object at 0x7b67fb33adc0>


Caso você precise de mais flexibilidade para trabalhar com a sua planilha - por exemplo, caso deseje editá-la, criar novas colunas etc, convém converter a estrutura para uma lista de verdade. É possível usar um ```list``` no objeto para fazer a conversão:

In [None]:
import csv

arquivo = open("alunos.csv", 'r')

planilha = list(csv.reader(arquivo,delimiter=';', lineterminator='\n'))
print(planilha)

arquivo.close()

[['Aluno', 'Nota1', 'Nota2', 'Presenças'], ['Luke', '7', '9', '15'], ['Han', '4', '7', '10'], ['Leia', '9', '9', '16']]


In [None]:
planilha

[['Aluno', 'Nota1', 'Nota2', 'Presenças'],
 ['Luke', '7', '9', '15'],
 ['Han', '4', '7', '10'],
 ['Leia', '9', '9', '16']]

# Exercícios - parte 2

Use o módulo ```csv``` recém-estudado para fazer os próximos exercícios.

5) Faça um código que pede para o usuário digitar a quantidade de provas aplicadas, a quantidade de alunos em uma turma e cada uma das notas.

- O seu programa deverá salvar apenas as notas digitadas em um arquivo CSV onde cada linha representa um aluno e cada coluna é uma nota da prova.

In [None]:
# quantidade_provas = int(input("Digite a quantidade de provas aplicadas: "))
# quantidade_alunos = int(input("Digite a quantidade de alunos: "))

quantidade_provas = 2
quantidade_alunos  = 3

todas_notas_alunos = [] # [[9,9,10],[8,7,9]]

for aluno in range(quantidade_alunos):
  print(aluno)
  notas_aluno = [] # [9,9,10]
  for prova in range(quantidade_provas):
    nota = float(input(f"cadastre a nota da prova de número {prova} do aluno de número {aluno}"))
    notas_aluno.append(nota)
  todas_notas_alunos.append(notas_aluno)

todas_notas_alunos


0
cadastre a nota da prova de número 0 do aluno de número 010
cadastre a nota da prova de número 1 do aluno de número 09
1
cadastre a nota da prova de número 0 do aluno de número 18
cadastre a nota da prova de número 1 do aluno de número 17
2
cadastre a nota da prova de número 0 do aluno de número 26
cadastre a nota da prova de número 1 do aluno de número 25


[[10.0, 9.0], [8.0, 7.0], [6.0, 5.0]]

In [None]:
arquivo = open("notas.csv", "w")
escritor = csv.writer(arquivo,delimiter=",",lineterminator="\n")
escritor.writerows(todas_notas_alunos)
arquivo.close()

In [None]:
alunos = int(input('Digite a quantidade de alunos na turma: '))
provas = int(input('Digite a quantidade de provas aplicadas: '))

dic_notas = {}
for aluno in range (1, alunos + 1):
    print(f'Notas do {aluno}º aluno: ')
    notas = []

    for prova in range(1, provas +1):
        nota= float(input(f'Digite a nota do {prova}º prova: '))
        notas.append(nota)

    print(f'Notas do {aluno}º aluno: {notas}.')
    dic_notas[f'Aluno{aluno}'] = notas

dic_notas

# {'aluno 0' : [1,3,4,6]}

Digite a quantidade de alunos na turma: 2
Digite a quantidade de provas aplicadas: 1
Notas do 1º aluno: 
Digite a nota do 1º prova: 9
Notas do 1º aluno: [9.0].
Notas do 2º aluno: 
Digite a nota do 1º prova: 10
Notas do 2º aluno: [10.0].


{'Aluno1': [9.0], 'Aluno2': [10.0]}

In [None]:
csv.DictWriter()


6) Faça um programa que carrega um arquivo CSV de notas (como o gerado pelo exercício anterior) e pede para o usuário digitar a nota mínima para aprovação. Ele deverá gerar um novo arquivo contendo as notas originais e 2 colunas adicionais: A média de cada aluno na primeira (com 2 casas decimais) e "APR" ou "REP" na segunda, indicando se a média atingiu o valor mínimo ou não.

- Para arredondar, pode utilizar a função round()

In [None]:
round(3.1415,2)

3.14

In [None]:
import csv

arquivo = open('notas.csv', 'r')
leitor = csv.reader(arquivo, delimiter=',', lineterminator='\n')

tabela_notas_alunos = []
for linha in leitor:
  tabela_notas_alunos.append(list(map(float,linha)))




arquivo.close()


In [None]:
tabela_notas_alunos

[[10.0, 9.0], [8.0, 7.0], [6.0, 5.0]]

In [None]:
nota_minima = float(input("digite a nota mínima para aprovação"))


for aluno in tabela_notas_alunos:
  soma = 0
  for nota in aluno:
    soma += nota
  media = round(soma/len(aluno),2)
  print(media)
  aluno.append(media)
  if media >= nota_minima:
    aluno.append("APR")
  else:
    aluno.append("REP")


print(tabela_notas_alunos)

  # sum(aluno) / len(aluno)



# agora criamos o arquivo e populamos ele com a variavel tabela_notas_alunos
arquivo = open("resultado_notas.csv", "w")
escritor = csv.writer(arquivo,delimiter=',', lineterminator="\n")

escritor.writerows(tabela_notas_alunos)

arquivo.close()



digite a nota mínima para aprovação8
9.5
7.5
5.5
[[10.0, 9.0, 9.5, 'APR'], [8.0, 7.0, 7.5, 'REP'], [6.0, 5.0, 5.5, 'REP']]


# Bônus: arquivos JSON

JSON é uma sigla para _JavaScript Object Notation_. O _JavaScript_ é uma linguagem muito utilizada em web, e assim como o Python, ela é uma linguagem orientada a objeto. Ocorre que a forma como objetos são representados nessa linguagem é bastante legível para seres humanos e fácil de decompor usando programação também.

Veja um exemplo de como podemos representar, por exemplo, um estudante em JavaScript:

```
{
    nome: 'Mario',
    modulo: 2,
    media: 9.5
}
```

Parece familiar? É extremamente parecido com dicionários em Python. O Python possui um módulo já instalado chamado ```json``` que nos ajuda a converter entre uma _string_ contendo um JSON e um dicionário.

> **Atenção:** No caso do JSON faremos *exatamente* como nos dicionários em Python: as chaves deverão vir entre aspas.

Os valores de um JSON podem ser vários tipos de dados que estamos acostumados em Python: inteiros, reais, _strings_, booleanos, e até mesmo listas (representadas com colchetes) e outros JSON/dicionários (representados por chaves). Por exemplo:

```
{
    'escola':"Let's Code",
    'cursos':[{'nome':'Python Pro', 'duracao':2},
            {'nome':'Data Science', 'duracao':2},
            {'nome':'Front-End', 'duracao':2}]
}
```

### JSON para dicionário
O método ```loads``` recebe uma _string_ contendo um JSON e retorna um dicionário, o que torna bastante fácil o acesso a informações individuais:

In [None]:
import json

jogador = '{"nome":"Mario","pontuacao":0}'

dicionario = json.loads(jogador)

print(dicionario['nome'])
print(dicionario['pontuacao'])

Mario
0


### Dicionário para JSON
Já o método ```dumps``` recebe um dicionário e retorna uma _string_ pronta para ser salva ou enviada como JSON:

In [None]:
import json

jogador = dict()
jogador["nome"]  = "Mario"
jogador["pontuacao"] = 0

string_json = json.dumps(jogador)

print(string_json)

{"nome": "Mario", "pontuacao": 0}


In [None]:
print(type(string_json), type(jogador))

<class 'str'> <class 'dict'>


In [None]:
string_json['nome']

TypeError: string indices must be integers

Por que deu erro?

In [None]:
jogador['nome'] # jogador é um dicionário. e string_json é uma string

'Mario'

### E os arquivos?

Arquivos JSON, assim como CSV, são arquivos de texto puro onde o texto deve representar a estrutura dada acima. Sendo assim, caso você tenha um arquivo ```.json```, você pode abri-lo usando as mesmas técnicas que estudamos para arquivos de texto (```open```/```read```) e em seguida usar o ```loads``` para obter um dicionário.

Já quando temos um dicionário que gostaríamos de salvar como um ```.json```, basta usar o ```dumps``` para obter a string, e em seguida podemos utilizar ```write``` no arquivo desejado.

In [None]:
arquivo = open("arquivo_json.json", "w")
arquivo.write(string_json)
arquivo.close()

In [None]:
import json

arquivo = open("arquivo_json.json", "r")
conteudo = arquivo.read()

dicionario = json.loads(conteudo)
print(dicionario.items())
arquivo.close()

dict_items([('nome', 'Mario'), ('pontuacao', 0)])
