## 📍 Agenda 📍
<br>

- [Arquivos](#um)
- [Exercícios](#dois)

## Arquivos <a class="anchor" id="um"></a>
<br>

Até o presente momento deste módulo, trabalhamos apenas com dados em memória de trabalho (ou princial... RAM). Exemplos disso são os famosos input's que solicitávamos ao usuário, a cada execução do código. Não é mesmo?
<br>
<br>
Porém, e se precisássemos de **persistir** ou recuperar esses dados a partir de um arquivo salvo em nosso computador?
<br>
<br>
Na aula de hoje, vamos aprender a manipular alguns tipos de arquivos de dados a partir do python, e entender um pouco mais do conceito de **persistência** em disco.
<div align="justify">
&emsp;
</div>
<br>

### Abrindo e fechando arquivos.


Para a manipular (abrir) arquivos em python, podemos utilizar a função **open**. Ela possui dois argumentos: **caminho do arquivo** e **modo de operação a ser realizada no arquivo**.
<br>
<br>
Vejamos alguns modos e suas respectivas descrições.

| **Modo**  | **Símbolo** | **Descrição** |
|---|---|---|
| read | r | Lê um arquivo existente |
| write | w | Cria um novo arquivo |
| append | a | Abre um arquivo existente para adicionar informações ao seu final |
| update | + | ao ser combinado com outros modos, permite alteração de arquivos já existente (ex: r+ abre um arquivo existente e permite modificá-lo)|

<br>
<br>
Uma vez que um arquivo é aberto com a função **open**, e manipulado, devemos fechá-lo para que as modificações sejam consolidadas, e que outros programas possam utilizar o arquivo alterado. Para isso, usamos a função **close**.

In [None]:
# escrevendo em um arquivo
arquivo = open("hello.txt", "w")
arquivo.write("Hello World!")
arquivo.close()

In [None]:
# exemplo com loop
lista = list(range(10))
arquivo = open("hello.txt", "w")
for elemento in lista:
  arquivo.write(f"{elemento}\n")
arquivo.close()

In [None]:
lista = list(range(10))
arquivo = open("hello.txt", "a")
for elemento in lista:
  arquivo.write(f"{elemento}\n")
arquivo.close()

In [None]:
lista = [str(x) for x in lista]
print("\n".join(lista))

0
1
2
3
4
5
6
7
8
9


In [None]:
# exemplo de lista escrita com loop e writelines
arquivo = open("lista2.txt", "w")
arquivo.writelines("\n".join(lista))
arquivo.close()

In [None]:
arquivo = open("lista2.txt", "w")
arquivo.writelines("\n".join(lista))
arquivo.close()

In [None]:
# lendo o conteúdo de um arquivo
arquivo = open("lista2.txt", "r")
print(arquivo.read())
arquivo.close()

0
1
2
3
4
5
6
7
8
9


In [None]:
# exemplo com loop - readlines()
arquivo = open("lista2.txt", "r")
linhas = arquivo.readlines()
for linha in linhas:
  print(linha)
arquivo.close()

0

1

2

3

4

5

6

7

8

9


### Gerenciador de contexto

Note que com as instruções definidas anteriormente, sempre que abrimos um arquivo com a função **open**, devemos fechar com a função **close**. Porém, se o programador se esquecer de fechar o arquivo, todo o conteúdo (re)escrito no arquivo pode ser perdido.
<br>
<br>
Neste sentido, temos uma forma mais segura de manipular arquivos que utilizando um **gerenciador de contexto** com o comando **with**.
<br>
<br>
Vejamos alguns exemplos:

In [None]:
# lendo em um arquivo
with open("hello.txt", "r") as arquivo:
  c = arquivo.read()
print(c)

0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9



In [None]:
with open("hello.txt", "r") as arquivo:
  c = arquivo.read()
  print(c.replace('\n', ' '))
  lista = c.replace('\n', ' ').split()
  print(lista)

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9']


In [None]:
c

'0\n1\n2\n3\n4\n5\n6\n7\n8\n9\n0\n1\n2\n3\n4\n5\n6\n7\n8\n9\n0\n1\n2\n3\n4\n5\n6\n7\n8\n9\n'

In [None]:
# escrevendo de um arquivo
with open("arquivo.txt", "w") as f:
  f.write("arquivo qualquer")

### Arquivos CSV


Muitos dados interessantes ou importantes estão disponíveis na forma de tabela. A capacidade de manipular planilhas foi determinante no sucesso dos computadores pessoais, dada sua importância para empresas e indivíduos.

#### Tabelas em python

Conforme já mencionamos, temos módulos prontos para realizar muitas tarefas para nós. Um dos módulos mais populares em Python é o pandas, que mesmo não vindo instalado por padrão é provavelmente o módulo mais usado para manipular planilhas. Porém, como este é um curso introdutório, convém entendermos um pouquinho de lógica de como manipular uma tabela para futuramente sermos capazes de trabalhar corretamente com os módulos prontos.
<br>
<br>
Uma das formas mais simples de se representar uma tabela em Python seria através de uma lista de listas. Nossa lista principal seria a tabela como um todo, e cada lista interna seria uma linha da tabela.
<br>
<br>
Para acessar um elemento individual, utilizamos 2 índices: o primeiro indica a lista interna (linha) e o segundo o elemento individual na lista (coluna). Para percorrer a tabela inteira, utilizamos 2 for aninhados: o mais externo fixa uma linha e o mais interno percorre cada elemento daquela linha. Execute o código abaixo e verifique o resultado mostrado na tela.

In [None]:
tabela = [['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
          ['Luke', 7, 9, 15],
          ['Han', 4, 7, 10],
          ['Leia', 9, 9, 16]]

In [None]:
tabela

[['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
 ['Luke', 7, 9, 15],
 ['Han', 4, 7, 10],
 ['Leia', 9, 9, 16]]

In [None]:
tabela[0][1]

'Nota 1'

In [None]:
for linha in tabela:
  print(linha)

['Aluno', 'Nota 1', 'Nota 2', 'Presenças']
['Luke', 7, 9, 15]
['Han', 4, 7, 10]
['Leia', 9, 9, 16]


In [None]:
print('Imprimindo cada elemento individual da tabela:')
for linha in tabela:
    for elemento in linha:
        print(elemento)

Imprimindo cada elemento individual da tabela:
Aluno
Nota 1
Nota 2
Presenças
Luke
7
9
15
Han
4
7
10
Leia
9
9
16


In [None]:
print('Imprimindo cada "linha" da tabela:')
for linha in tabela:
    print(linha)

Imprimindo cada "linha" da tabela:
['Aluno', 'Nota 1', 'Nota 2', 'Presenças']
['Luke', 7, 9, 15]
['Han', 4, 7, 10]
['Leia', 9, 9, 16]


In [None]:
print('Imprimindo o elemento na linha 2, coluna 0:')
print(tabela[2][0])

Imprimindo o elemento na linha 2, coluna 0:
Han


#### O formato CSV

A sigla significa *Comma-Separed Values*, ou *Valores separados por vírgula*.

<br>
Nem sempre usamos a separação dos valores por vírgulas. Podemos alterar essas formas. Exemplo em que os valores são separados por ';'.

Aluno;Nota 1;Nota 2;Presenças<br>
Luke;7;9;15<br>
Han;4;7;10<br>
Leia;9;9;16

Manipulando arquivos CSV com o o módulo csv.

### Escrevendo um CSV

Para escrever um CSV utilizando o módulo, precisamos ter nossos dados representados como uma lista de listas. Criaremos (ou abriremos) um arquivo usando o open, como já fizemos antes, e utilizaremos um CSV writer - uma estrutura que guardará as regrinhas para escrever nosso CSV. Execute o exemplo abaixo:

In [None]:
import csv # pandas

tabela = [['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
          ['Luke', 7, 9, 15],
          ['Han', 4, 7, 10],
          ['Leia', 9, 9, 16]]

# cria o arquivo CSV
arquivo = open('alunos.csv', 'w')

escritor = csv.writer(
    arquivo,
    delimiter=';',
    lineterminator='\n'
)

# escreve uma lista de listas em formato CSV:
escritor.writerows(tabela)

# fecha e salva o arquivo
arquivo.close()

In [None]:
print(csv.reader.__doc__)

    csv_reader = reader(iterable [, dialect='excel']
                        [optional keyword args])
    for row in csv_reader:
        process(row)

The "iterable" argument can be any object that returns a line
of input for each iteration, such as a file object or a list.  The
optional "dialect" parameter is discussed below.  The function
also accepts optional keyword arguments which override settings
provided by the dialect.

The returned object is an iterator.  Each iteration returns a row
of the CSV file (which can span multiple input lines).



### Lendo um arquivo CSV

O processo para ler o CSV é semelhante: utilizamos um CSV reader, com os mesmos parâmetros utilizados no CSV writer. A função csv.reader retorna uma estrutura iterável (ou seja, que pode ser percorrida com for) contendo cada linha já organizada como lista.

In [None]:
import csv

arquivo = open('alunos.csv', 'r')

planilha = csv.reader(
    arquivo,
    delimiter=';',
    lineterminator='\n'
  )

# generator
# iterando na planilha e imprimindo
tabela = []
for linha in planilha:
    tabela.append(linha)
arquivo.close()

In [None]:
tabela

[['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
 ['Luke', '7', '9', '15'],
 ['Han', '4', '7', '10'],
 ['Leia', '9', '9', '16']]

In [None]:
import csv # pandas

arquivo = open('alunos.csv', 'r')

planilha = csv.reader(
    arquivo,
    delimiter=';',
    lineterminator='\n'
  )

# cast para lista
lista = list(planilha)

arquivo.close()

In [None]:
lista

[['Aluno,Nota 1,Nota 2,Presenças'],
 ['Luke,7,9,15'],
 ['Han,4,7,10'],
 ['Leia,9,9,16']]

### Arquivos JSON

JSON é uma sigla para JavaScript Object Notation. O JavaScript é uma linguagem muito utilizada em web, e assim como o Python, ela é uma linguagem orientada a objeto. Ocorre que a forma como objetos são representados nessa linguagem é bastante legível para seres humanos e fácil de decompor usando programação também.
<br>
Veja um exemplo de como podemos representar, por exemplo, um estudante em JavaScript:

`
  {
    nome: 'Mario',
    modulo: 2,
    media: 9.5
 }
`

Note que a sintaxe de um objeto JavaScript é bem similar os dicionários em python.

<br>
<br>
Neste sentido, temos um módulo chamado **json** que podemos manipular este tipo de dados.

<br>
<br>
**Atenção:** No caso do JSON faremos exatamente como nos dicionários em Python: as chaves deverão vir entre aspas.


<br>
<br>
Vejamos alguns exemplos:

`
{'escola':"Let's Code",
  'cursos':[{'nome':'Python Pro', 'duracao':2},
            {'nome':'Data Science', 'duracao':2},
            {'nome':'Front-End', 'duracao':2}]
}
`

In [None]:
# JSON para dicionários
import json
aluno = '{"nome": "Ana", "nota": 10.0}'
print(type(aluno))
dicionario = json.loads(aluno) # método loads
print(dicionario)

<class 'str'>
{'nome': 'Ana', 'nota': 10.0}


In [None]:
dicionario["nome"]

'Ana'

In [None]:
# dicionario para JSON
import json
aluno = {
  "nome": "Ana",
  "nota": 10.0
}
print(type(aluno))
string_json = json.dumps(aluno)
print(string_json)
print(type(string_json))

<class 'dict'>
{"nome": "Ana", "nota": 10.0}
<class 'str'>


In [None]:
inteiro = 1 # loads/dumps
float(inteiro)

In [None]:
# escrevendo JSON em arquivo
with open("aluno.json", "w") as arquivo:
  json.dump(aluno, arquivo) # dict, fp

In [None]:
# lendo JSON do arquivo
with open("aluno.json", "r") as arquivo:
  # load() é similar ao read()
  aluno = json.load(arquivo)
aluno

{'nome': 'Ana', 'nota': 10.0}

In [None]:
arquivo = open("aluno.json", "r")
a = json.load(arquivo)
arquivo.close()

In [None]:
a

{'nome': 'Ana', 'nota': 10.0}

In [None]:
type(aluno)

dict

In [None]:
aluno["nome"]

'Ana'

In [None]:
import csv

arquivo = open('projeto.csv', 'r')

planilha = csv.reader(
    arquivo,
    delimiter=';',
    lineterminator='\n'
  )

lista = list(planilha)
arquivo.close()