# Arquivos

---
Exercícios sugeridos da lista: 1, 2, 3, 4, 5

Vamos refletir sobre os programas que fizemos até agora

In [None]:
nome = input('digite seu nome: ')

print(nome)

No código acima, as informações fornecidas pelo usuário têm como ser acessadas depois que o programa é fechado?

Até agora nossos programas têm dependido do usuário dar entradas que gerarão saídas. Mas há situações em que é desejável **salvar** as entradas do usuário para uso posterior

Exemplos:
* mensagens do whatsapp
* mensagens de e-mail
* cadastro em uma loja
* dados de um cliente
* dados de uma tabela

Computadores armazenam os dados dos programas em execução (variáveis, funções, retornos, etc.) na *memória RAM*; mas a memória RAM é **volátil**, ou seja: assim que o computador é desligado, ela é completamente esvaziada e, portanto, os dados do programa são perdidos.

Mas como podemos **guardar** essas informações para uso posterior?

## Persistência em Arquivo

Ao salvar dados em um arquivo, garantimos que as informações ficarão salvas no *armazenamento* do computador, e portanto disponíveis para acesso posterior; o armazenamento não é esvaziado quando o computador é desligado.

### Abrindo arquivos

Para salvarmos dados num arquivo, primeiramente precisaremos abrí-lo. Abrir, nesse caso, pode significar tanto abrir um arquivo existente quanto criar um novo.

Para operarmos com arquivos, usaremos a função `open()`

Vamos salvar a palavra entrada pelo usuário no programa acima em um arquivo, chamado `palavra.txt`

**Importante:** sempre que *abrirmos* um arquivo, devemos *fechá-lo* posteriormente, com o método `close()`

In [None]:
arq = open('nome.txt')
arq.close()

### Escrevendo arquivos

Abrimos o arquivo, mas além disso queremos **salvar** informações nele. Para isso, podemos usar um modo de operação da função `open()`, que na prática se traduz em um argumento

| Operação | Argumento |
|----------|-----------|
| ler (*read*)* | r |
| escrever (*write*) | w |
| adicionar (*append*) | a |
| atualizar (*update*) | + |

\* a operação de leitura é a padrão, ou seja, se não especificarmos o argumento o interpretador assumirá que queremos somente ler o arquivo

A sintaxe que usaremos será a seguinte:

`arquivo = open(nome_do_arquivo, operacao)`

Lembre-se que os argumentos da tabela acima são strings!

Ou seja, pra *abrirmos* o arquivo `palavra.txt` e *escrevermos* nele, usaremos a seguinte sintaxe:

`arquivo = open(nome_do_arquivo, 'w')` ou 

`arquivo = open(nome_do_arquivo, "w")`

In [None]:
arq = open('nome.txt', 'w')
arq.close()

Isso nos permite criar o arquivo `palavra.txt`, mas o arquivo estará vazio

Para, de fato, escrevermos no arquivo, usaremos o método `write()`.

`arquivo_aberto.write(texto)`

In [None]:
nome = input('digite seu nome: ')

arq = open('nome.txt', 'w')

arq.write(nome)

arq.close()

print(nome)

In [None]:
outro_arq = open('nome.txt', 'w')

outro_arq.write('eu fui alterado')

outro_arq.close()

In [None]:
arq_append = open('nome.txt', 'a')

arq_append.write('\noi')

arq_append.close()

### Lendo Arquivos

Agora que escrevemos nosso arquivo, podemos pegar os dados salvos de volta, com a função `open()` no modo de *leitura*.

`arquivo = open(nome_do_arquivo, 'r')` ou

`arquivo = open(nome_do_arquivo)`

Como o modo de leitura é o **padrão** para a função `open()`, não precisamos explicitar o argumento `'r'` se não quisermos

Assim como com o método `write()`, para a leitura usaremos o método `read()`

`dados = arquivo_aberto.read()`

In [None]:
arquivo = open('nome.txt')

print(arquivo.read())

arquivo.close()

#### Uma sintaxe mais conveniente

Uma facilidade que o Python nos oferece para trabalhar com arquivos é a palavra reservada `with`, que usaremos da seguinte maneira:

```
with open(nome_do_arquivo, modo_de_operacao) as nome_conveniente:
    operações...
```

Dessa maneira, assim que as operações no meio do código terminarem de serem executadas, o interpretador fechará o arquivo sem que precisemos intervir. 

Leia o código acima da seguinte maneira: "enquanto o arquivo `nome_do_arquivo` estiver aberto no modo de operação `modo_de_operacao`, chame-o de `nome_conveniente` e faça as seguintes `operações`. Quando elas terminarem, feche o arquivo."

Assim, vamos reescrever nossos códigos dessa nova maneira:

In [None]:
nome = input('digite seu nome: ')

with open('nome.txt', 'w') as arquivo:
    arquivo.write(nome)

In [None]:
with open('nome.txt', encoding='UTF-8') as arquivo_com_nome:
    print(arquivo_com_nome.read())

#### Separando linhas de um arquivo

O que acontece se imprimirmos o arquivo diretamente?

In [None]:
with open('haiku.txt') as haiku:
    print(haiku)

Ou seja: para obtermos os dados de um arquivo, vamos usar o método `read()`. 

In [None]:
with open('haiku.txt') as haiku:
    print(haiku.read())

E se quisermos, por exemplo, contar quantas linhas um arquivo tem?

In [None]:
with open('haiku.txt') as haiku:
    num_linhas = 0

    for linha in haiku.read():
        num_linhas += 1

    print(num_linhas)

Ou seja, quando usamos o `read()` o arquivo é lido *caractere por caractere*. Portanto, se precisarmos percorrer o arquivo *linha por linha*, precisamos mudar um pouco a estratégia.

Aqui, temos duas opções:

- o método `readlines()`

In [None]:
with open('haiku.txt') as haiku:
    num_linhas = 0

    for linha in haiku.readlines():
        num_linhas += 1

    print(num_linhas)

- iterar sobre o arquivo

In [None]:
with open('haiku.txt') as haiku:
    num_linhas = 0

    for linha in haiku:
        num_linhas += 1

    print(num_linhas)

#### Processando linhas

E se só quisermos imprimir as linhas que cumprirem alguma condição? 

Exemplo: imprimir do arquivo `haiku.txt` somente as linhas que têm as letras 'sil', tanto em letras maiúsculas quanto minúsculas

In [None]:
with open('haiku.txt') as haiku:
    for linha in haiku.readlines():
        if 'sil' in linha.lower(): # como 'linha' é uma string...
            print(linha)

#### Criando um arquivo em outra pasta

In [None]:
# OBS 1: para o exemplo a seguir funcionar, 
# a pasta nova_pasta precisa existir na pasta atual

# OBS 2: para usuário de Windows ao invés da barra '/'
# é preciso usar a barra invertida '\'
# with open("nova_pasta\arq.txt") as arq:
#         print(arq.readlines())

# para usuários de Linux ou MacOS
with open('nova_pasta/arq.txt', 'r') as arq:
    dados = arq.read()

dados = 'olá'

with open('arq.txt', 'w') as arq:
    arq.write(dados)

### Exercício 1: manipulação de arquivo txt

Escreva uma função em Python que leia o conteúdo de um arquivo dado pelo usuário e imprima cada uma de suas linhas.

In [None]:
def imprime_linhas(arquivo):
    with open(arquivo) as arq:
        for linha in arq.readlines():
            print(linha, end='')

imprime_linhas('haiku.txt')

# print('quebra de\nlinha')
# print('tabula\tção')

### Exercício 2: manipulação de arquivo txt

Escreva um programa em Python que *adicione* texto a um arquivo já existente e imprima seu conteúdo

In [None]:
def adiciona_e_imprime(arquivo, texto):
    with open(arquivo, 'a') as arq:
        arq.write(texto)

    with open(arquivo) as arq:
        for linha in arq.readlines():
            print(linha)

adiciona_e_imprime('haiku.txt', '\nHaikus não fazem sentido')

In [None]:
# variação do programa que só adiciona o texto
# se o arquivo já não o tiver
# ex.: só adiciona 'banana' se 'banana'
# já não estiver escrito em algum lugar do arquivo
with open('haiku.txt', 'a+') as haiku:
    haiku.seek(0) # move o cursor pra posição 0 do arquivo
    
    if 'Haikus não fazem sentido' not in haiku.read():
        haiku.write('\nHaikus não fazem sentido')
    
with open('haiku.txt') as haiku:
    print(haiku.read())

In [None]:
with open('haiku.txt', 'a') as arq:
    arq.write('vivendo e aprendendo')
    
with open('haiku.txt') as haiku:
    print(haiku.read())

### Exercício 3: manipulação de arquivo txt

Escreva uma função em Python que imprima as primeiras n linhas de um arquivo de texto. O valor n deve ser fornecido pelo usuário.

In [None]:
# DESAFIO: solução mais elegante
# aqui estamos pegando a lista retornada pelo método readlines()
# feito isso, usamos o splice para imprimir do primeiro ao n-ésimo item,
# ou seja, arq.readlines[:n] (poderia ser [0:n] também)
# e por fim adicionamos o operador de desenrolar (*) 
# para ler cada item da lista individualmente
def imprime_n_linhas_1(arquivo, n):
    with open(arquivo) as arq:
        print(*arq.readlines()[:n])

# solução mais intuitiva
def imprime_n_linhas_2(arquivo, n):
    with open(arquivo) as arq:
        contador = 0        
        for linha in arq.readlines():
            if contador < n:
                print(linha)

            contador += 1

imprime_n_linhas_1('haiku.txt', 2)
print('---')
imprime_n_linhas_2('haiku.txt', 2)

### Exercício de Fixação: Criptografia

Seu objetivo com essa atividade é criar um programa capaz de criptografar textos. Isso tem vantagens no gerenciamento de senhas, por exemplo. Você deverá estruturar seu programa da seguinte maneira:

Criar uma função que recebe um texto como parâmetro e retorna esse mesmo texto criptografado. A criptografia deve ocorrer conforme a seguinte regra:
- Substituir 'a' por 'z'
- Substituir 'b' por 'y'
- Substituir 'c' por 'x'
- E assim por diante...

Criar uma função que lê o conteúdo de um arquivo e cria um segundo criptografado. Essa função deve receber dois parâmetros:
- O primeiro é o nome do arquivo de entrada, servirá de entrada com os textos originais (ainda a serem criptografados);
- O segundo é o nome do arquivo de saída, servirá de saída com os textos já criptografados.

## Arquivos csv

### Tabelas

Uma estrutura de dados muito útil sobretudo para estudos estatísticos é a tabela. Há diversos formatos de arquivo que podemos usar para trabalhar com tabelas, como `.xls`, `.xlsx`, etc.

No entanto, como podemos implementar uma tabela puramente em Python?

In [3]:
import csv

contatos_lista = [
    ['Nome', 'Sobrenome', 'Email'],
    ['Ricardo', 'Silva', 'ricardo@email.com'],
    ['Renato', 'Arbex', 'renato@email.com']
]

with open('contatos.csv', 'w') as contatos:
    contato_csv = csv.writer(contatos)
    contato_csv.writerows(contatos_lista)


Isso funciona bem, mas felizmente há maneiras mais práticas de utilizarmos tabelas em Python. 

### O formato csv

Arquivos `.csv` (*comma-separated values*, ou seja, *valores separados por vírgula*) são arquivos que utilizados para guardar dados na forma de *tabela*. 

Sua sintaxe é simples e tem a seguinte forma:

```
nome,idade,cpf
matheus,21,00933
felipe,36,11234
jonas,42,10287
```

**Observação 1:** embora o nome mencione a *vírgula* e a maioria dos arquivos a utilize para separar os valores, delimitadores como ponto-e-vírgula (";"), tabulações ("\t") e espaços (" ") também são aceitos; o que importa é manter cada linha da tabela em uma linha diferente

**Observação 2:** todas as linhas **devem** ter o mesmo número de valores para que o arquivo seja válido

Em Python, a biblioteca `pandas` é comumente utilizada para manipulação de arquivos `.csv`. No entanto, para os fins deste curso usaremos uma biblioteca mais simples, com o sugestivo nome de `csv`

### Escrevendo arquivos csv

Antes de começarmos a escrever precisamos abrir o arquivo que desejamos, assim como fizemos antes

Para escrever no arquivo, utilizaremos o método `csv.writer()`, que retorna um objeto do tipo `csv.writer`, uma classe feita para escrever arquivos `csv`

Assim, usaremos o método da seguinte maneira:
```
identificador = csv.writer(arquivo, delimiter='delimitador', lineterminator='terminador de linha')
```
sendo que `delimiter` e `linterminator` são, por padrão, `','` e `'\n'`, respectivamente

### Lendo arquivos csv

Lembrando de abrir o arquivo com o nome desejado, podemos usar o método `csv.reader()` para ler a tabela.

Semelhante ao método `writer`, o método retorna um objeto do tipo `csv.reader`, uma classe feita para ler arquivos `csv`

Sua sintaxe é idêntica à do método `writer`:
```
identificador = csv.writer(arquivo, delimiter='delimitador', lineterminator='fim da linha')
```

#### Imprimindo linhas de uma tabela

* iterando sobre a tabela

* iterando sobre os dados lidos pelo módulo csv

##### Imprimindo uma coluna de uma linha

#### Imprimindo colunas de uma tabela

**Aviso:** enquanto o módulo `csv` é útil para tarefas simples envolvendo tabelas, para a maioria das situações pode ser interessante utilizarmos a biblioteca `pandas`. Essa é uma das aplicações que é trivial usando `pandas`, mas um pouco mais "braçal" somente com o módulo `csv`

### Exercício 1: manipulação de arquivo csv

Crie um programa que lê um arquivo csv assumindo que a separação de valores é feita por tabulações (\t) e imprima suas linhas

### Exercício 2: manipulação de arquivo csv

Escreva uma função que receba dois parâmetros: um arquivo do tipo csv e o nome de uma coluna.
* caso a coluna não exista no arquivo csv, a função deve retornar `False`
* caso a coluna exista no arquivo csv, a função deve imprimir o conteúdo da coluna

ex.: se o arquivo csv contiver a seguinte tabela:
| Nome | Idade | CPF |
|------|-------|-----|
| Felipe | 25 | 009 |
| Ricardo | 49 | 145 |

* a função deve retornar `False` caso o usuário peça o conteúdo da coluna `RG`, por exemplo.
* caso o usuário peça o conteúdo da coluna `Nome`, a função deve imprimir o seguinte:

| Nome |
| -----|
| Felipe |
| Ricardo |