# Aula 6 - bibliotecas próprias e arquivos

Na aula de hoje, vamos explorar os seguintes tópicos em Python:

- 1) Criando a importando nossas próprias bibliotecas
- 2) Arquivos em Python
- 3) Arquivos csv

_______


______
________
______

## 1) Criando e importando nossas próprias bibliotecas

Como vimos na última aula, podemos fazer um programa no Jupyter Notebook, e exportá-lo com a extensão ".py", para, por exemplo, executá-lo no terminal, ou em alguma outra plataforma.

Com isso, podemos criar uma **biblioteca nossa!**

_

Após criar a biblioteca, podemos importa-la como fazemos com qualquer outra bilioteca

In [10]:
from src.minha_biblioteca import *

In [11]:
fatorial(5)

120

In [5]:
def fatorial(n):
    
    if n == 0:
        return 1
    else:
        return n*fatorial(n-1)

E aí, podemos utilizar suas funções em diferentes programas!

____
____
____

## 2) Arquivos em Python

Todos os programas que fizemos até o momento tinham variáveis, input e output **temporários**, guardados na memória RAM do computador **enquanto o programa é executado**.

Após o programa ser finalizado, todas as variáveis, inputs e outputs eram perdidos.

Muitas vezes queremos que esses valores sejam armazenados, que os dados processados pelo programa sejam preservados. O termo para esta característica é **persistência de dados**.

A persistência se dá através de **arquivos**: documentos criados para **armazenar dados em uma memória permanente**, como o **disco rígido**, um **USB** ou um **servidor web**.

O Python têm algumas funções padrão para a manipulação de arquivos. Vamos vê-las!

A função `open()` é usada pra abrir arquivos existentes ou criar um arquivo novo. 

Ela possui 2 argumentos principais: o primeiro é o caminho do arquivo, com seu nome (se apenas o nome do arquivo for passado, isso é interpretado como o arquivo estando na mesma pasta que o código!); e o segundo é o modo de operação. Os modos são:

- r -	lê um arquivo existente
- w -	cria um novo arquivo
- a -	abre um arquivo existente para adicionar informações ao seu final
- \+ -	ao ser combinado com outros modos, permite alteração de arquivo já existente (ex: r+ abre um arquivo existente e permite modificá-lo)

O terceiro argumento é o "encoding", que dá a codificação do arquivo. 

In [None]:
# absolute path
C:\Usuarios\Vinicius\ .......... \meu_arquivo.txt
# relative path
..\meu_arquivo.txt

In [16]:
arquivo = open('teste.txt', 'w')

Se analisarmos a variável "arquivo" (é o return da função "open"), temos...

In [17]:
arquivo

<_io.TextIOWrapper name='teste.txt' mode='w' encoding='UTF-8'>

Uma vez aberto o arquivo, podemos escrever alguma coisa nele. Para isso, usamos a função `write()`

Essa função aceita apenas um argumento, que é o que vc quer escrever no arquivo

In [18]:
arquivo.write('Bom dia, arquivo!')

17

Após abrirmos (ou criarmos) um arquivo, e fazer as operações desejadas com ele, devemos fechá-lo usando a função `close()`. Essa etapa é importante por 2 motivos:

- Se alteramos o arquivo mas não o fechamos, as alterações não serão salvas.
- Se esquecermos de fechar um arquivo, outros programas podem ter problemas de acesso a ele.

Por isso, **nunca se esqueca de fechar os arquivos abertos!**

In [19]:
arquivo.close()

__Fazendo todas as operações em uma única célula__

In [21]:
arquivo = open('teste.txt', 'w')
arquivo.write('Bom dia, !')
arquivo.close()

Ter que lembrar de chamar o `close()` é muito incoveniente. Para fechar os arquivos automaticamente, podemos usar o `with`

In [22]:
with open('teste.txt', 'w') as arquivo:
    arquivo.write('Bom dia, mundo!')
# arquivo.close()

Vamos escrever mais algumas coisas no nosso arquivo...

Como o arquivo já existe, vamos tentar escrever mais alguma coisa usando o modo "r"...

In [23]:
with open('teste.txt', 'r') as arquivo:
    arquivo.write('Bom dia, mundo!')

UnsupportedOperation: not writable

Note que encontramos um erro, pois o modo "r" permite **apenas a leitura do arquivo**

Se queremos escrever algo nele, usamos "r+", 'w', 'w+', 'a' ou 'a+', dependendo do caso

In [24]:
with open('teste.txt', 'r+') as arquivo:
    arquivo.write('Boa tarde!')

Note, no entanto, que se usarmos o modo "r+", o write substitui o conteúdo anterior da primeira linha do arquivo!

Prra corrigir isso, usamos o modo "a", que permite escrever AO FIM do arquivo

In [26]:
with open('teste.txt', 'a') as arquivo:
    arquivo.write('Boa tarde!')

Se quisermos escrever em uma nova linha, usamos o "\n":

In [28]:
with open('teste.txt', 'a') as arquivo:
    arquivo.write('Boa tarde!' + '\n')

Agora, imagina que queremos apenas **ler** o arquivo, sem intenção de modificá-lo.

Nesse caso, utilizamos o modo "r" do open.

Além disso, se quisermos de fato armazenar os dados do arquivo em uma variável do python, usamos a função `read()`

In [29]:
with open('teste.txt', 'r') as arquivo:
    texto = arquivo.read()

In [30]:
texto

'Boa tarde!undo!Boa tarde!Boa tarde!Boa tarde!\nBoa tarde!\n'

A função `read()` lê o que estiver no arquivo em forma de uma string!

As quebras de linha serão, portanto, armazenadas como "\n".

In [32]:
texto.split('\n')

['Boa tarde!undo!Boa tarde!Boa tarde!Boa tarde!', 'Boa tarde!', '']

Vamos para um outro exemplo... Imagine que eu quero armazenar uma lista, para depois lê-la novamente. Como faço isso?

In [33]:
notas = [8, 7, 6, 10, 10, 8]

with open('teste.txt', 'w') as arquivo:
    arquivo.write(notas)


TypeError: write() argument must be str, not list

Só é possível escrever strings com o "write()"! Então, vamos ter que modificar um pouco o programa...

In [43]:
str(notas)

'[8, 7, 6, 10, 10, 8]'

In [42]:
','.join(str(notas))

'[,8,,, ,7,,, ,6,,, ,1,0,,, ,1,0,,, ,8,]'

In [44]:
notas = [8, 7, 6, 10, 10, 8]
notas_txt = ','.join([str(n) for n in notas])
with open('teste.txt', 'w') as arquivo:
    arquivo.write(notas_txt)


Agora, pra ler o arquivo, e já calcular a média das notas armazenadas!

In [50]:
from statistics import mean
with open('teste.txt', 'r') as f:
    texto = f.read()
mean([int(i) for i in texto.split(',')])


8.166666666666666

Vamos fazer um arquivo de várias linhas, e depois lê-lo:

In [52]:
with open('teste.txt', 'w') as f:
    f.write("Batatinha quando nasce,\n")
    f.write("espalha a rama pelo chão.\n")
    f.write("Menininha quando dorme,\n")
    f.write("põe a mão no coração.")

Lendo o arquivo inteiro

In [53]:
with open('teste.txt', 'r') as f:
    texto = f.read()
texto

'Batatinha quando nasce,\nespalha a rama pelo chão.\nMenininha quando dorme,\npõe a mão no coração.'

Lendo apenas a primeira linha, com a função `readline()`:

In [55]:
with open('teste.txt', 'r') as f:
    texto = []
    for i in range(4):
        texto.append(f.readline())
texto

['Batatinha quando nasce,\n',
 'espalha a rama pelo chão.\n',
 'Menininha quando dorme,\n',
 'põe a mão no coração.']

Ler cada uma das linhas, separadamente

Neste caso, não precisa nem de readline!

In [58]:
with open('teste.txt', 'r') as f:
    texto = []
    for line in f:
        texto.append(line)
texto

['Batatinha quando nasce,\n',
 'espalha a rama pelo chão.\n',
 'Menininha quando dorme,\n',
 'põe a mão no coração.']

Apesar de termos tratado sobre as funções acima, existem **bibliotecas específicas** para a leitura/escrita de determinados tipos de arquivos.

Na prática, é muito mais conveniente usarmos estas bibliotecas, a depender do tipo de arquivo que desejamos ler/escrever!

____
____
___

## 3) Arquivos CSV

Um tipo de arquivo muito comum é o **csv**

A sigla CSV significa **Comma-Separated Values**, ou **"valores separados por vírgula"**. 

Este formato é uma forma padrão de representar tabelas usando arquivos de texto simples: cada elemento é separado por uma vírgula (ou ponto-e-vírgula, ou, qualquer outro separador), e cada linha é separada por uma quebra de linha. 

In [None]:
, ; | 

Em Python, podemos entender um arquivo CSV como uma lista de listas. 

Imagine que queremos armazenar um arquivo csv. Começamos com uma lista de listas:

In [61]:
tabela = [['Aluno', 'Nota 1', 'Nota 2', 'Presença'],
          ['Luke', 7, 9, 15],
          ['Han', 4, 7, 10],
          ['Leia', 9, 9, 16]]

Pode não ser tão simples escrever esta lista de listas em um arquivo usando a função write(), como vimos antes, né?

Para trabalhar com arquivos csv, vamos utilizar a biblioteca `csv` do python!

Desta biblioteca, vamo usar duas funções:

- **função de escrita**: `csv.writer().writerows()`

- **função de leitura**: `csv.reader()`

In [62]:
import csv

Primeiramente, abrimos o arquivo, como fizemos antes

Depois, utilizamos a função "writer" da biblioteca "csv", juntamente da função "writerows" para escrever a lista de listas ao arquivo:

In [74]:
with open('teste.csv', 'w') as f:
    writer = csv.writer(f, delimiter=';')
    writer.writerows(tabela)
    

A primeira parte, 

```python
csv.writer(arquivo, delimiter=';', lineterminator='\n')
```

Indica:

- em que arquivo você quer escrever
- como que você vai separar os valores (neste caso, com ";")
- como vc vai separar as diferentes linhas do arquivo (neste caso, com "\n")

A segunda parte, indica quais os dados que você quer escrever no arquivo (no caso, a lista de listas "tabela"):

```python
writerows(tabela)
```

E como lemos este arquivo?

Para isso, temos que utilizar a função `reader()` da biblioteca csv:

```python
csv.reader(f, delimiter=';', lineterminator='\n')
```

Essa função tem como argumentos:

- o arquivo aberto (no caso, a variável "f");
- o separador entre os valores (no caso, ";");
- o separador de linhas (no caso, "\n");

Aí, basta iterar neste objeto com o for para popular a lista de listas "planilha":

In [75]:
with open('teste.csv', 'r') as f:
    reader = csv.reader(f, delimiter=';')
    planilha = []
    for linha in reader:
        planilha.append(linha)
planilha

[['Aluno', 'Nota 1', 'Nota 2', 'Presença'],
 ['Luke', '7', '9', '15'],
 ['Han', '4', '7', '10'],
 ['Leia', '9', '9', '16']]

É possíver fazer o **processamento de dados tabulares** de forma muito mais simples e natural do que usando listas de listas. Para isso utilizamos uma biblioteca própria para isso: o [pandas](https://pandas.pydata.org/)! Vamos introduzi-la nas aulas seguintes!

In [79]:
import pandas as pd
pd.read_csv('teste.csv', sep=';')

Unnamed: 0,Aluno,Nota 1,Nota 2,Presença
0,Luke,7,9,15
1,Han,4,7,10
2,Leia,9,9,16


____
____
____
____

# Exercicios

## Exercicio 1
1. Crie um arquivo `frases.txt` contendo o conteúdo de uma lista de frases.
2. Copie o conteúdo do arquivo linha a linha `frases.txt` para `frases_copia.txt`.



In [None]:
frases = ['a terra é redonda', 'meu carro quebrou']

## Exercicio 2

| Aluno | Nota 1 | Nota 2 | Frequencia |
|-------|--------|--------|------------|
| Luke  | 7      | 9      | 90         |
| Han   | 4      | 7.7    | 60         |
| Leia  | 9      | 9      | 100        |

1. Crie um arquivo no excel com a tabela acima e salve em formato `.csv`
2. Leia o arquivo e guarde os valores em uma estrutura de dados (lista de listas)
3. Faça uma função que recebe a estrutura de dados com a tabela acima, o nome do aluno e devolve a média dele
4. Crie um programa que o usuário fornece o nome do aluno e o programa imprime a média das notas do aluno.

# Exercicios extras
## Ex. 1
Faça uma função que calcula o resultado de uma multiplicação de matrizes (representadas como lista de listas).

Por exemplo:
```
matriz_0 = [
    [0, 2],
    [1, 2]
]

matriz_1 = [
    [6, 7],
    [0, 9]
]

multiplica_matriz(matriz_0, matriz_1)


[
    [ 0, 18],
    [ 6, 25]
]
```

## Ex. 2
Faça uma função que calcula os primeiros `n` números primos