# Lidando com txt e csv em Python

Nesta nota, vamos explorar os seguintes tópicos em Python:

- 1) Arquivos em Python
- 2) Arquivos csv

_____________

Problema gerador: como podemos processar um arquivo com as notas de alunos?

---
---
---

## 1) Arquivos em Python

Todos os programas que fizemos até o momento tinham variáveis, input e output **temporários**, guardados na memória RAM do computador **enquanto o programa é executado**.

Após o programa ser finalizado, todas as variáveis, inputs e outputs eram perdidos.

Muitas vezes queremos que esses valores sejam armazenados, que os dados processados pelo programa sejam preservados. O termo para esta característica é **persistência de dados**.

A persistência se dá através de **arquivos**: documentos criados para **armazenar dados em uma memória permanente**, como o **disco rígido**, um **USB** ou um **servidor web**.

O Python têm algumas funções padrão para a manipulação de arquivos. Vamos vê-las!

A função `open()` é usada pra abrir arquivos existentes ou criar um arquivo novo. 

Ela possui 2 argumentos: o primeiro é o caminho do arquivo, com seu nome (se apenas o nome do arquivo for passado, isso é interpretado como o arquivo estando na mesma pasta que o código!); e o segundo é o modo de operação. Os modos são:

- r -	lê um arquivo existente
- w -	cria um novo arquivo
- a -	abre um arquivo existente para adicionar informações ao seu final
- \+ -	ao ser combinado com outros modos, permite alteração de arquivo já existente (ex: r+ abre um arquivo existente e permite modificá-lo)

O terceiro argumento é o "encoding", que dá a codificação do arquivo. Pra evitar problemas, é legal sempre usar `encoding="utf-8"`



In [2]:
arquivo = open("ola_mundo.txt", "w", encoding="utf-8")

Se analisarmoms a variável "arquivo" (é um retur da função `open()`), note que há algumas coisas estranhas..

In [3]:
arquivo

<_io.TextIOWrapper name='ola_mundo.txt' mode='w' encoding='utf-8'>

Uma vez aberto o arquivo, podemos escrever alguma coisa nele. Para isso, usamos o método `write()`

Essa função aceita apenas um argumento, que é o que você quer escrever no arquivo -- e **deve ser uma string!**

In [4]:
arquivo.write("Olá, mundo!")

11

Após abrirmos (ou criamos) um arquivo, e fazer as operações desejadas com ele, devemos fecha-ló usando o método\
`close()`. Essa etapa é importante por 2 motivos:

- Se alerarmos o aquivo mas não o fecharmos, as alterações não serão salvas.
- Se esquercermos de fechar um arquivo, outros programas podem ter problemas de acesso a ele.

Por isso, **nunca se esqueça de fechar os arquivos abertos!**

In [5]:
arquivo.close()

Apesar desta ser uma forma clara e direta, existe um procedimento mais robusto e mais seguro, que é utilizando\
o ambiente `with`.

O `with` garante que, quando o bloco de código em seu interior for executado, todos os recursos que foram criados\
(indicados após o `as`) serão liberados!

No nosso caso, o recurso é justamento um arquivo! Com o `with`, nós garantimos que **o arquivo será aberto e fechado**,\
independente se ocorro qualquer erro antes do arquivo ser fechado! Isso é muito importante, pois garante maior segurança\
e robustez ao nosso código!

In [6]:
with open("ola_mundo_2.txt", "w", encoding="utf-8") as f:
    f.write("Olá, mundo!\nEsse é meu segundo arquivo usando o ambiente with")

Agora quero escrever mais informações

In [7]:
with open("ola_mundo.txt", "r", encoding="utf-8") as f:
    f.write("Escrevendo algo novo")

UnsupportedOperation: not writable

Note que encontramos um erro, pois o modo "r" permite **apenas a leitura do arquivo**

Se queremos escrever algo nele, usamos o "r+"

In [8]:
with open("ola_mundo.txt", "r+", encoding="utf-8") as f:
    f.write("Escrevendo algo novo")

Note, no entanto, que se usarmos o modo "r+", o write substitui o conteúdo anterior da primeira linha\
do arquivo! Isso porque este modo equivale a colocar o cursor **no começo do arquivo** e escreve a partir dali,\
como se tivesse com o `Insert` selecionado.

Para corrigir isso, usamos o modo "a", que permite escrever **AO FIM** do arquivo. Isso equivale a colocar\
o cursos **no último caractere escrito**, e começar a escrever a partir dali!

In [10]:
with open("ola_mundo.txt", "a", encoding="utf-8") as f:
    f.write("\nEscrevendo algo novo")

O método `write()` pode apenas ser usado para escrever strings ao arquivo!

Agora vamos trabalhar com a leitura.

In [13]:
with open("ola_mundo.txt", "r", encoding="utf-8") as f:
    cont = f.read()

In [14]:
cont

'Escrevendo algo novoEscrevendo algo novo\nEscrevendo algo novo'

Da mesma forma que o `write()` apenas escrevia strings, o `read()` lê o arquivo como uma string.

Como o `read()` lê o que estiver no arquivo em forma de uma string, temos que as quebras de linha\
serão, portanto, armazenadas como "\n".

A partir daí, dá para pegar cada linha e colcoar numa lista:

In [15]:
print(cont)

Escrevendo algo novoEscrevendo algo novo
Escrevendo algo novo


In [None]:
cont.split("\n")

['Escrevendo algo novoEscrevendo algo novo', 'Escrevendo algo novo']

In [20]:
notas = [8, 9, 8.5, 10, 10, 6, 7, 8.8]

with open("notas.txt", "w", encoding='utf-8') as f:

    f.write(f"{notas[0]}")

    for elemento in notas[1:]:
        f.write(f"\n{elemento}")

In [21]:
with open("notas.txt", "r", encoding='utf-8') as f:

    conteudo = f.read()


In [24]:
notas_lidas_float = [float(elemento) for elemento in notas]
notas_lidas_float

[8.0, 9.0, 8.5, 10.0, 10.0, 6.0, 7.0, 8.8]

In [26]:
sum(notas_lidas_float)/len(notas_lidas_float)

8.4125

## 2) Arquivios CSV

Um tipo de arquivo muito comum é o **CSV**

A sigla **CSV** significa **Comma-Separated Values**, "**valores separados por vírgula**".

Este formato é uma forma padrão de representar tabelas usando arquivos de texto simples: cada elemento é separado por\
vírgula (ou pontp-e-vírgula, ou, qualquer outro separador), e cada linha é separada por uma quebra de linha.

Em Python, podemos entender um arquivo CSV como uma lista de lista.

Imagine que queremos armazenar um arquivo csv. Começamos com uma lista de listas:

In [27]:
tabela = [['Aluno', 'Nota 1', 'Nota 2', 'Presença'],
          ['Luke', 7, 8, 75],
          ['Han', 4, 7, 100],
          ['Leia', 9, 9, 50]]

In [28]:
tabela

[['Aluno', 'Nota 1', 'Nota 2', 'Presença'],
 ['Luke', 7, 8, 75],
 ['Han', 4, 7, 100],
 ['Leia', 9, 9, 50]]

Pode não ser tão simples escrever esta lista de liestas em um arquivo usando o método `write()`, como vimos antes.

Para trabalhar com arquivos csv, vamos utilizar a biblioteca `csv` do python!

Desta biblioteca, vamos usar duas funções:

 - **método de escrita**: `csv.writer().writerows()`
 - **método de leitura**: `csv.reader()`

In [29]:
import csv

Como queremos escrever o arquivo.

In [30]:
with open("alunos_SW.csv", "w", encoding='utf-8') as f:

    csv.writer(f, delimiter=',', lineterminator='\n').writerows(tabela)

E como lemos  este arquivo?

Para isso, temos que utilizar a função `reader()` da bibliioteca csv:

In [35]:
with open("alunos_SW.csv", "r", encoding='utf-8') as f:

    primeira_linha = f.readline()

primeira_linha

'Aluno,Nota 1,Nota 2,Presença\n'

Desta forma conseguimos ler apenas a primeira linha do nosso arquivo, assim conseguimos identificar como o arquivo\
está estruturado

In [38]:
with open("alunos_SW.csv", "r", encoding='utf-8') as f:
    tabela_lida = []
    leitor = csv.reader(f, delimiter=',', lineterminator='\n')

    for linha in leitor:
        tabela_lida.append(linha)

In [39]:
tabela_lida

[['Aluno', 'Nota 1', 'Nota 2', 'Presença'],
 ['Luke', '7', '8', '75'],
 ['Han', '4', '7', '100'],
 ['Leia', '9', '9', '50']]

Um ponto importante. 

Inicialmente, os números eram `int()`, apos a leitura, o conteúdo da lista são strings.

In [40]:
with open("alunos_SW.csv", "r", encoding='utf-8') as f:

    tabela_lida = [linha for linha in csv.reader(f, delimiter=',', lineterminator='\n')]

In [41]:
tabela_lida

[['Aluno', 'Nota 1', 'Nota 2', 'Presença'],
 ['Luke', '7', '8', '75'],
 ['Han', '4', '7', '100'],
 ['Leia', '9', '9', '50']]

**Vamos agora processar esse arquivo que acabemos de ler.**

Imagina que queremos calcular qual é a média de determinado aluno, a partir  do seu nome!

Para fazer isso, usamos **list comprehension** para fazer uma lista com os nomes dos alunos:

In [53]:
aluno = "Han"

dados_aluno = tabela_lida[[linha[0] for linha in tabela_lida].index(aluno)]
media = (float(dados_aluno[1]) + float(dados_aluno[2]))/2
print(f"A média do aluno {aluno} é: {media}")

A média do aluno Han é: 5.5


In [49]:
media = (float(dados_aluno[1]) + float(dados_aluno[2]))/2
media

7.5