# Aula 7 - Arquivos

Na aula de hoje, vamos explorar o seguinte tópico em Python:

- Arquivos em Python

_______

### Objetivos

Apresentar o conceito, importância e operacional do uso de arquivos em Python, explicitando como ler, modificar e escrever arquivos;

### Habilidades a serem desenvolvidas

Ao final da aula o aluno deve:

- Conhecer o conceito e importância do uso de arquivos;
- Saber como criar, modificar e ler arquivos;

______
________
______

## 1) Arquivos em Python

Todos os programas que fizemos até o momento tinham variáveis, input e output **temporários**, guardados na memória RAM do computador **enquanto o programa é executado**.

Após o programa ser finalizado, todas as variáveis, inputs e outputs eram perdidos.

Muitas vezes queremos que esses valores sejam armazenados, que os dados processados pelo programa sejam preservados. O termo para esta característica é **persistência de dados**.

A persistência se dá através de **arquivos**: documentos criados para **armazenar dados em uma memória permanente**, como o **disco rígido**, um **USB** ou um **servidor web**.

O Python têm algumas funções padrão para a manipulação de arquivos. Vamos vê-las!

A função `open()` é usada pra abrir arquivos existentes ou criar um arquivo novo. 

Ela possui 2 argumentos: o primeiro é o caminho do arquivo, com seu nome (se apenas o nome do arquivo for passado, isso é interpretado como o arquivo estando na mesma pasta que o código!); e o segundo é o modo de operação. Os modos são:

- r -	lê um arquivo existente
- w -	Abre um arquivo para escrita (cria caso não exista)
- a -	abre um arquivo existente para adicionar informações ao seu final
- x -   Cria um arquivo novo
- \+ -	ao ser combinado com outros modos, permite alteração de arquivo já existente (ex: r+ abre um arquivo existente e permite modificá-lo)

O terceiro argumento é o "encoding", que dá a codificação do arquivo. Pra evitar problemas, é legal sempre usar `encoding="utf-8"`

In [9]:
arquivo = open("ola.txt", "w", encoding="utf-8")

Se analisarmos a variável "arquivo" (é o return da função "open"), note que há algumas coisas estranhas... É assim que o python entende seu arquivo, mas não precisa se preocupar muito com isso

In [10]:
arquivo

<_io.TextIOWrapper name='ola.txt' mode='w' encoding='utf-8'>

Uma vez aberto o arquivo, podemos escrever alguma coisa nele. Para isso, usamos a função `write()`

Essa função aceita apenas um argumento, que é o que vc quer escrever no arquivo

In [11]:
arquivo.write("olá, mundo!!!!!!")

16

Após abrirmos (ou criarmos) um arquivo, e fazer as operações desejadas com ele, devemos fechá-lo usando a função `close()`. Essa etapa é importante por 2 motivos:

- Se alteramos o arquivo mas não o fechamos, as alterações não serão salvas.
- Se esquecermos de fechar um arquivo, outros programas podem ter problemas de acesso a ele.

Por isso, **nunca se esqueca de fechar os arquivos abertos!**

In [12]:
arquivo.close()

__Fazendo todas as operações em uma única célula__

In [13]:
f = open("ola.txt", "w", encoding="utf-8")

f.write("olá, let's code!")

f.close()

Vamos escrever mais algumas coisas no nosso arquivo...

Como o arquivo já existe, vamos tentar usar o modo "r"...

In [14]:
# como o arquivo já existe, vamos usar o modo de leitura, "r"
arquivo = open("ola.txt", "r", encoding="utf-8")

arquivo.write('Minha segunda frase') 

arquivo.close()

UnsupportedOperation: not writable

Note que encontramos um erro, pois o modo "r" permite **apenas a leitura do arquivo**

Se queremos escrever algo nele, usamos o "r+"

In [16]:
# modo r+, pra poder escrever no arquivo
arquivo = open("ola.txt", "r+", encoding="utf-8")

arquivo.write('Minha') 

arquivo.close()


Note, no entanto, que se usarmos o modo "r+", o write substitui o conteúdo anterior da primeira linha do arquivo!

Prra corrigir isso, usamos o modo "a", que permite escrever AO FIM do arquivo

In [17]:
# modo a, pra poder escrever ao fim do arquivo coisas novas
arquivo = open("ola.txt", "a", encoding="utf-8")

arquivo.write('\nMinha quarta frase') 

arquivo.close()

Se quisermos escrever em uma nova linha, usamos o "\n":

In [18]:
# modo a, pra poder escrever ao fim do arquivo coisas novas
arquivo = open("ola.txt", "a", encoding="utf-8")

for i in range(5):
    
    arquivo.write(str(i) + " - olá mundo!!\n")

arquivo.close()

In [19]:
nomes = ["André", "João", "Maria"]

f = open("nomes_2.txt", "w", encoding="utf-8")

for item in nomes:
    
    f.write(item)
    f.write("\n")
    
f.close()

Agora, imagina que queremos apenas **ler** o arquivo, sem intenção de modificá-lo.

Nesse caso, utilizamos o modo "r" do open.

Além disso, se quisermos de fato armazenar os dados do arquivo em uma variável do python, usamos a função `read()`

In [20]:
# modo r para a leitura, apenas
arquivo = open('ola.txt', 'r', encoding="utf-8")

conteudo = arquivo.read()

In [21]:
conteudo

"Minha let's code!\nMinha quarta frase0 - olá mundo!!\n1 - olá mundo!!\n2 - olá mundo!!\n3 - olá mundo!!\n4 - olá mundo!!\n"

In [22]:
conteudo.split('\n')

["Minha let's code!",
 'Minha quarta frase0 - olá mundo!!',
 '1 - olá mundo!!',
 '2 - olá mundo!!',
 '3 - olá mundo!!',
 '4 - olá mundo!!',
 '']

In [23]:
# modo r para a leitura, apenas
arquivo = open('ola.txt', 'r', encoding="utf-8")

# lê o conteúdo do arquivo
conteudo = arquivo.read()

print(conteudo)

arquivo.close()

Minha let's code!
Minha quarta frase0 - olá mundo!!
1 - olá mundo!!
2 - olá mundo!!
3 - olá mundo!!
4 - olá mundo!!



A função `read()` lê o que estiver no arquivo em forma de uma string!

As quebras de linha serão, portanto, armazenadas como "\n".

Vamos para um outro exemplo... Imagine que eu quero armazenar uma lista, para depois lê-la novamente. Como faço isso?

In [25]:
notas = [8, 7, 6, 10, 10, 8]

f = open("minhas_notas.txt", "w", encoding="utf-8")

f.write(notas) 

f.close()

TypeError: write() argument must be str, not list

Só é possível escrever strings com o "write()"! Então, vamos ter que modificar um pouco o programa...

In [26]:
notas = [8, 7, 5, 6, 4, 6]

f = open("notas.txt", "w", encoding="utf-8")

for elemento in notas:
    
    f.write(str(elemento) + "\n")
    
f.close()

Agora, pra ler o arquivo, e já calcular a média das notas armazenadas!

In [27]:
f = open("notas.txt", "r", encoding="utf-8")

string_de_notas = f.read()

lista_de_notas = string_de_notas.split('\n')

lista_de_notas.remove("")

# usando compreensão de lista (list comprehension)
lista_de_floats = [float(elementos) for elementos in lista_de_notas]

media = sum(lista_de_floats)/len(lista_de_floats)

print(media)

f.close()

6.0


Vamos fazer um arquivo de várias linhas, e depois lê-lo:

In [28]:
f = open("poema.txt", "w", encoding="utf-8")

f.write("Batatinha quando nasce,\n")
f.write("espalha a rama pelo chão.\n")
f.write("Menininha quando dorme,\n")
f.write("põe a mão no coração.")

f.close()

Lendo o arquivo inteiro

In [29]:
f = open("poema.txt", "r", encoding="utf-8")

conteudo = f.read()

f.close()

conteudo

'Batatinha quando nasce,\nespalha a rama pelo chão.\nMenininha quando dorme,\npõe a mão no coração.'

In [30]:
conteudo.split("\n")

['Batatinha quando nasce,',
 'espalha a rama pelo chão.',
 'Menininha quando dorme,',
 'põe a mão no coração.']

Lendo apenas a primeira linha, com a função `readline()`:

In [31]:
f = open("poema.txt", "r", encoding="utf-8")

conteudo = f.readline()

f.close()

conteudo

'Batatinha quando nasce,\n'

Ler cada uma das linhas, separadamente

Neste caso, não precisa nem de readline!

In [32]:
f = open("poema.txt", "r", encoding="utf-8")

lista = []

for x in f:
    
    lista.append(x)
    
print(lista)

['Batatinha quando nasce,\n', 'espalha a rama pelo chão.\n', 'Menininha quando dorme,\n', 'põe a mão no coração.']


In [33]:
f = open("poema.txt", "r", encoding="utf-8")

lista_de_linhas = []

# aqui, o python entende que ele deve percorrer cada linha do arquivo!
for elemento in f:
    
    lista_de_linhas.append(elemento)
    
f.close()

lista_de_linhas

['Batatinha quando nasce,\n',
 'espalha a rama pelo chão.\n',
 'Menininha quando dorme,\n',
 'põe a mão no coração.']

In [34]:
# usando compreensão de listas!

f = open("poema.txt", "r", encoding="utf-8")

lista = [x for x in f]

lista

['Batatinha quando nasce,\n',
 'espalha a rama pelo chão.\n',
 'Menininha quando dorme,\n',
 'põe a mão no coração.']

Apesar de termos tratado sobre as funções acima, existem **bibliotecas específicas** para a leitura/escrita de determinados tipos de arquivos.

Na prática, é muito mais conveniente usarmos estas bibliotecas, a depender do tipo de arquivo que desejamos ler/escrever!

## Exercícios

A ACME Inc., uma empresa de 500 funcionários, está tendo problemas de espaço em disco no seu servidor de arquivos. Para tentar resolver este problema, o Administrador de Rede precisa saber qual o espaço ocupado pelos usuários, e identificar os usuários com maior espaço ocupado. Através de um programa, baixado da Internet, ele conseguiu gerar o seguinte arquivo, chamado "usuarios.txt":

```
alexandre       456123789
anderson        1245698456
antonio         123456456
carlos          91257581
cesar           987458
rosemary        789456125
```

Neste arquivo, o nome do usuário possui 15 caracteres. A partir deste arquivo, você deve criar um programa que gere um relatório, chamado "relatório.txt", no seguinte formato:

````
ACME Inc.               Uso do espaço em disco pelos usuários
------------------------------------------------------------------------
Nr.  Usuário        Espaço utilizado     % do uso

1    alexandre       434,99 MB             16,85%
2    anderson       1187,99 MB             46,02%
3    antonio         117,73 MB              4,56%
4    carlos           87,03 MB              3,37%
5    cesar             0,94 MB              0,04%
6    rosemary        752,88 MB             29,16%

Espaço total ocupado: 2581,57 MB
Espaço médio ocupado: 430,26 MB
````

O arquivo de entrada deve ser lido uma única vez, e os dados armazenados em memória, caso sejam necessários, de forma a agilizar a execução do programa. A conversão da espaço ocupado em disco, de bytes para megabytes deverá ser feita através de uma função separada, que será chamada pelo programa principal. O cálculo do percentual de uso também deverá ser feito através de uma função, que será chamada pelo programa principal.