# Aula 6 - bibliotecas próprias e arquivos

Na aula de hoje, vamos explorar os seguintes tópicos em Python:

- 1) Criando a importando nossas próprias bibliotecas
- 2) Arquivos em Python
- 3) Arquivos csv


______
________
______

## 1) Criando e importando nossas próprias bibliotecas

Como vimos na última aula, podemos fazer um programa no Jupyter Notebook, e exportá-lo com a extensão ".py", para, por exemplo, executá-lo no terminal, ou em alguma outra plataforma.

Com isso, podemos criar uma **biblioteca nossa!**

Para isso, use o notebook "minha_biblioteca.ipybn" como exemplo. Faça o processo todo de baixar como arquivo .py, e coloque o arquivo .py na mesma pasta que este notebook.

Após criar a biblioteca, podemos importa-la como fazemos com qualquer outra bilioteca

In [1]:
import minha_biblioteca as mb

In [2]:
mb.cumprimenta("André")

Olá, André


In [3]:
fatorial = mb.fatorial(4)

In [4]:
fatorial

24

E aí, podemos utilizar suas funções em diferentes programas!

____
____
____

## 2) Arquivos em Python

Todos os programas que fizemos até o momento tinham variáveis, input e output **temporários**, guardados na memória RAM do computador **enquanto o programa é executado**.

Após o programa ser finalizado, todas as variáveis, inputs e outputs eram perdidos.

Muitas vezes queremos que esses valores sejam armazenados, que os dados processados pelo programa sejam preservados. O termo para esta característica é **persistência de dados**.

A persistência se dá através de **arquivos**: documentos criados para **armazenar dados em uma memória permanente**, como o **disco rígido**, um **USB** ou um **servidor web**.

O Python têm algumas funções padrão para a manipulação de arquivos. Vamos vê-las!

A função `open()` é usada pra abrir arquivos existentes ou criar um arquivo novo. 

Ela possui 2 argumentos: o primeiro é o caminho do arquivo, com seu nome (se apenas o nome do arquivo for passado, isso é interpretado como o arquivo estando na mesma pasta que o código!); e o segundo é o modo de operação. Os modos são:

- r -	lê um arquivo existente
- w -	cria um novo arquivo
- a -	abre um arquivo existente para adicionar informações ao seu final
- \+ -	ao ser combinado com outros modos, permite alteração de arquivo já existente (ex: r+ abre um arquivo existente e permite modificá-lo)

O terceiro argumento é o "encoding", que dá a codificação do arquivo. Pra evitar problemas, é legal sempre usar `encoding="utf-8"`

In [5]:
arquivo = open("ola.txt", "w", encoding="utf-8")

Se analisarmos a variável "arquivo" (é o return da função "open"), note que há algumas coisas estranhas... É assim que o python entende seu arquivo, mas não precisa se preocupar muito com isso

In [6]:
arquivo

<_io.TextIOWrapper name='ola.txt' mode='w' encoding='utf-8'>

Uma vez aberto o arquivo, podemos escrever alguma coisa nele. Para isso, usamos a função `write()`

Essa função aceita apenas um argumento, que é o que vc quer escrever no arquivo

In [7]:
arquivo.write("olá, mundo!!!!!!")

16

Após abrirmos (ou criarmos) um arquivo, e fazer as operações desejadas com ele, devemos fechá-lo usando a função `close()`. Essa etapa é importante por 2 motivos:

- Se alteramos o arquivo mas não o fechamos, as alterações não serão salvas.
- Se esquecermos de fechar um arquivo, outros programas podem ter problemas de acesso a ele.

Por isso, **nunca se esqueca de fechar os arquivos abertos!**

In [8]:
arquivo.close()

__Fazendo todas as operações em uma única célula__

In [9]:
f = open("ola.txt", "w", encoding="utf-8")

f.write("olá, andré!")

f.close()

Vamos escrever mais algumas coisas no nosso arquivo...

Como o arquivo já existe, vamos tentar usar o modo "r"...

In [10]:
# como o arquivo já existe, vamos usar o modo de leitura, "r"
arquivo = open("ola.txt", "r", encoding="utf-8")

arquivo.write('Minha segunda frase') 

arquivo.close()

UnsupportedOperation: not writable

Note que encontramos um erro, pois o modo "r" permite **apenas a leitura do arquivo**

Se queremos escrever algo nele, usamos o "r+"

In [11]:
# modo r+, pra poder escrever no arquivo
arquivo = open("ola.txt", "r+", encoding="utf-8")

arquivo.write('Minha') 

arquivo.close()


Note, no entanto, que se usarmos o modo "r+", o write substitui o conteúdo anterior da primeira linha do arquivo!

Prra corrigir isso, usamos o modo "a", que permite escrever AO FIM do arquivo

In [12]:
# modo a, pra poder escrever ao fim do arquivo coisas novas
arquivo = open("ola.txt", "a", encoding="utf-8")

arquivo.write('\nMinha quarta frase') 

arquivo.close()

Se quisermos escrever em uma nova linha, usamos o "\n":

In [13]:
# modo a, pra poder escrever ao fim do arquivo coisas novas
arquivo = open("ola.txt", "a", encoding="utf-8")

for i in range(5):
    
    arquivo.write(str(i) + " - olá mundo!!\n")

arquivo.close()

In [14]:
nomes = ["André", "João", "Maria"]

f = open("nomes_2.txt", "w", encoding="utf-8")

for item in nomes:
    
    f.write(item)
    f.write("\n")
    
f.close()

Agora, imagina que queremos apenas **ler** o arquivo, sem intenção de modificá-lo.

Nesse caso, utilizamos o modo "r" do open.

Além disso, se quisermos de fato armazenar os dados do arquivo em uma variável do python, usamos a função `read()`

In [15]:
# modo r para a leitura, apenas
arquivo = open('ola.txt', 'r', encoding="utf-8")

conteudo = arquivo.read()

In [16]:
conteudo

'Minha andré!\nMinha quarta frase0 - olá mundo!!\n1 - olá mundo!!\n2 - olá mundo!!\n3 - olá mundo!!\n4 - olá mundo!!\n'

In [17]:
conteudo.split('\n')

['Minha andré!',
 'Minha quarta frase0 - olá mundo!!',
 '1 - olá mundo!!',
 '2 - olá mundo!!',
 '3 - olá mundo!!',
 '4 - olá mundo!!',
 '']

In [18]:
# modo r para a leitura, apenas
arquivo = open('ola.txt', 'r', encoding="utf-8")

# lê o conteúdo do arquivo
conteudo = arquivo.read()

print(conteudo)

arquivo.close()

Minha andré!
Minha quarta frase0 - olá mundo!!
1 - olá mundo!!
2 - olá mundo!!
3 - olá mundo!!
4 - olá mundo!!



In [19]:
conteudo_lista = conteudo.split("\n")

conteudo_lista

['Minha andré!',
 'Minha quarta frase0 - olá mundo!!',
 '1 - olá mundo!!',
 '2 - olá mundo!!',
 '3 - olá mundo!!',
 '4 - olá mundo!!',
 '']

A função `read()` lê o que estiver no arquivo em forma de uma string!

As quebras de linha serão, portanto, armazenadas como "\n".

Vamos para um outro exemplo... Imagine que eu quero armazenar uma lista, para depois lê-la novamente. Como faço isso?

In [20]:
notas = [8, 7, 6, 10, 10, 8]

f = open("minhas_notas.txt", "w", encoding="utf-8")

f.write(notas) 

f.close()

TypeError: write() argument must be str, not list

Só é possível escrever strings com o "write()"! Então, vamos ter que modificar um pouco o programa...

In [22]:
notas = [8, 7, 5, 6, 4, 6]

f = open("notas.txt", "w", encoding="utf-8")

for elemento in notas:
    
    f.write(str(elemento) + "\n")
    
f.close()

Agora, pra ler o arquivo, e já calcular a média das notas armazenadas!

In [23]:
f = open("notas.txt", "r", encoding="utf-8")

string_de_notas = f.read()

lista_de_notas = string_de_notas.split('\n')

lista_de_notas.remove("")

# usando compreensão de lista (list comprehension)
lista_de_inteiros = [float(elementos) for elementos in lista_de_notas]

media = sum(lista_de_inteiros)/len(lista_de_inteiros)

print(media)

f.close()

6.0


Vamos fazer um arquivo de várias linhas, e depois lê-lo:

In [24]:
f = open("poema.txt", "w", encoding="utf-8")

f.write("Batatinha quando nasce,\n")
f.write("espalha a rama pelo chão.\n")
f.write("Menininha quando dorme,\n")
f.write("põe a mão no coração.")

f.close()

Lendo o arquivo inteiro

In [25]:
f = open("poema.txt", "r", encoding="utf-8")

conteudo = f.read()

f.close()

conteudo

'Batatinha quando nasce,\nespalha a rama pelo chão.\nMenininha quando dorme,\npõe a mão no coração.'

In [26]:
conteudo.split("\n")

['Batatinha quando nasce,',
 'espalha a rama pelo chão.',
 'Menininha quando dorme,',
 'põe a mão no coração.']

Lendo apenas a primeira linha, com a função `readline()`:

In [27]:
f = open("poema.txt", "r", encoding="utf-8")

conteudo = f.readline()

f.close()

conteudo

'Batatinha quando nasce,\n'

Ler cada uma das linhas, separadamente

Neste caso, não precisa nem de readline!

In [28]:
f = open("poema.txt", "r", encoding="utf-8")

lista = []

for x in f:
    
    lista.append(x)
    
print(lista)

['Batatinha quando nasce,\n', 'espalha a rama pelo chão.\n', 'Menininha quando dorme,\n', 'põe a mão no coração.']


In [29]:
f = open("poema.txt", "r", encoding="utf-8")

lista_de_linhas = []

# aqui, o python entende que ele deve percorrer cada linha do arquivo!
for elemento in f:
    
    lista_de_linhas.append(elemento)
    
f.close()

lista_de_linhas

['Batatinha quando nasce,\n',
 'espalha a rama pelo chão.\n',
 'Menininha quando dorme,\n',
 'põe a mão no coração.']

In [30]:
# usando compreensão de listas!

f = open("poema.txt", "r", encoding="utf-8")

lista = [x for x in f]

lista

['Batatinha quando nasce,\n',
 'espalha a rama pelo chão.\n',
 'Menininha quando dorme,\n',
 'põe a mão no coração.']

Apesar de termos tratado sobre as funções acima, existem **bibliotecas específicas** para a leitura/escrita de determinados tipos de arquivos.

Na prática, é muito mais conveniente usarmos estas bibliotecas, a depender do tipo de arquivo que desejamos ler/escrever!

____
____
___

## 3) Arquivos CSV

Um tipo de arquivo muito comum é o **csv**

A sigla CSV significa **Comma-Separated Values**, ou **"valores separados por vírgula"**. 

Este formato é uma forma padrão de representar tabelas usando arquivos de texto simples: cada elemento é separado por uma vírgula (ou ponto-e-vírgula, ou, qualquer outro separador), e cada linha é separada por uma quebra de linha. 

Em Python, podemos entender um arquivo CSV como uma lista de listas. 

Imagine que queremos armazenar um arquivo csv. Começamos com uma lista de listas:

In [31]:
tabela = [['Aluno', 'Nota 1', 'Nota 2', 'Presença'],
          ['Luke', 7, 9, 15],
          ['Han', 4, 7, 10],
          ['Leia', 9, 9, 16]]

Pode não ser tão simples escrever esta lista de listas em um arquivo usando a função write(), como vimos antes, né?

Para trabalhar com arquivos csv, vamos utilizar a biblioteca `csv` do python!

Desta biblioteca, vamo usar duas funções:

- **função de escrita**: `csv.writer().writerows()`

- **função de escrita**: `csv.reader()`

In [32]:
import csv

Primeiramente, criamos o arquivo, como fizemos antes

In [33]:
# cria o arquivo CSV
arquivo = open('alunos_star_wars.csv', 'w', encoding="utf-8")

Depois, utilizamos a função "writer" da biblioteca "csv", juntamente da função "writerows" para escrever a lista de listas ao arquivo:

In [34]:
csv.writer(arquivo, delimiter=';', lineterminator='\n').writerows(tabela)

A primeira parte, 

```python
csv.writer(arquivo, delimiter=';', lineterminator='\n')
```

Indica:

- em que arquivo você quer escrever
- como que você vai separar os valores (neste caso, com ";")
- como vc vai separar as diferentes linhas do arquivo (neste caso, com "\n")

A segunda parte, indica quais os dados que você quer escrever no arquivo (no caso, a lista de listas "tabela"):

```python
writerows(tabela)
```

Fechando o arquivo

In [35]:
arquivo.close()

Tudo junto:

In [36]:
import csv

lista_de_listas = [['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
          ['Luke', 7, 9, 15],
          ['Han', 4, 7.7, 10],
          ['Leia', 9, 9, 16]]

arquivo = open('alunos_star_wars.csv', 'w', encoding="utf-8")

csv.writer(arquivo, delimiter=',', lineterminator='\n').writerows(lista_de_listas)

arquivo.close()

E como lemos este arquivo?

Para isso, temos que utilizar a função `reader()` da biblioteca csv:

```python
csv.reader(f, delimiter=';', lineterminator='\n')
```

Essa função tem como argumentos:

- o arquivo aberto (no caso, a variável "f");
- o separador entre os valores (no caso, ";");
- o separador de linhas (no caso, "\n");

Aí, basta iterar neste objeto com o for para popular a lista de listas "planilha":

In [37]:
import csv

f = open("alunos_star_wars.csv", "r", encoding="utf-8")

leitor = csv.reader(f, delimiter=',', lineterminator='\n')

planilha = []

for linha in leitor:
    
    planilha.append(linha)
    
f.close()

planilha

[['Aluno', 'Nota 1', 'Nota 2', 'Presenças'],
 ['Luke', '7', '9', '15'],
 ['Han', '4', '7.7', '10'],
 ['Leia', '9', '9', '16']]

In [38]:
alunos = []

for i in range(1,len(planilha)):
    
    alunos.append(planilha[i][0])
    
alunos

['Luke', 'Han', 'Leia']

In [39]:
[item[1] for item in planilha]

['Nota 1', '7', '4', '9']

__Vamos agora processar esse arquivo que acabamos de ler?__

Imagina que queremos calcular qual é a média de determinado aluno, a partir do seu nome!

Pra fazer isso, usamos **list comprehension** pra fazer uma lista com os nomes dos alunos:

In [40]:
[item[0] for item in planilha]

['Aluno', 'Luke', 'Han', 'Leia']

Aí, usamos a função index() pra descobrir qual é o índice nesta lista referente a determinado aluno.

Por exemplo, o aluno "Han", está na posição de índice 2:

In [41]:
[item[0] for item in planilha].index("Han")

2

Agora, basta passar esse índice para a lista de listas (que chamamos de "planilha"), pra acessarmos a linha correspondente ao Han:

In [42]:
planilha[[item[0] for item in planilha].index("Han")]

['Han', '4', '7.7', '10']

Legal! Agora, sabemos que as posições de índice 1 e 2 **desta lista** são, respectivamente, a nota1 e a nota2! 

Ou seja, podemos capturar as notas (já as transformando para float!), e aí calcular a média 

In [43]:
nota1 = float(planilha[[item[0] for item in planilha].index("Han")][1])

nota2 = float(planilha[[item[0] for item in planilha].index("Han")][2])

media = (nota1 + nota2)/2

media

5.85

Vamos agora fazer todas as operações acima, mas solicitando ao usuário a média de qual aluno ele deseja:

In [44]:
aluno = input("Que aluno? ")

linha_do_aluno = planilha[[item[0] for item in planilha].index(aluno)]

media = (float(linha_do_aluno[1]) + float(linha_do_aluno[2]))/2

print("\nA média do aluno", aluno, "é:", media)

Que aluno? Luke

A média do aluno Luke é: 8.0


É possíver fazer o **processamento de arquivos** de forma muito mais simples e natural do que foi feito acima, ao utilizarmos uma biblioteca própria para isso: o [pandas](https://pandas.pydata.org/)! Vamos introduzi-la nas aulas seguintes!

____
____
____
____