# Aula 6 - File IO
---

Uma das coisas mais úteis que temos quando vamos montar nossos scripts é o poder de ler e escrever em arquivos. Assim, podemos persistir informações e/ou ler para processamento. Vamos aprender como fazer isso utilizando Python!

Vamos utilizar a função `open()` do Python. Ela espera um nome de arquivo e o modo com que vamos abri-lo. Por enquanto, vamos usar `r` para leitura e `w` para escrita.

O algoritmo para criação de um arquivo python é:

    criar uma variável que receba o arquivo
    escrever alguma(s) string(s)
    fechar o arquivo

In [10]:
file_name = 'meu_arquivo.txt'
file = open(file_name, "w")

file.write('testando\n')

9

In [11]:
file.write('ola')

3

In [12]:
file.close() # Fechando o arquivo

Outra maneira de fazer isso é utilizando a palavra `with`. Nesse caso, o Python se encarrega de chamar a função `close()` ao final do uso do arquivo. Verifique como fica abaixo:

In [4]:
with open("meu_arquivo_2.txt", 'w') as f:
    # Nesse caso, f é nossa variável de arquivo
    f.write('Escrevendo no arquivo')
    f.write('Escrevendo no arquivoo')

Para realizar a leitura, basta alterar para o modo `r` e utilizar um loop `for` para iterar sobre todas as linhas do arquivo.

In [6]:
with open("meu_arquivo.txt", 'r') as f:
    for line in f:
        print(line)

Isso é uma linha

Isso é outra linha



---

## Arquivos CSV

Arquivos CSV (Comma-separated values) são úteis para lermos e salvarmos informações de maneira estruturada, como uma tabela. Eles são bastante utilizados para pré-processamento e criação de bancos para transferências.

O Python nos dá uma biblioteca `csv` para trabalhar com esse tipo de arquivo, facilitando a leitura e a escrita. Basta usarmos o comand `import csv`.

In [13]:
import csv

with open('cadastros.csv', mode='w') as cadastro_file:
    cadastro_writer = csv.writer(cadastro_file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
    cadastro_writer.writerow(['Name', 'Class', 'Birthday'])
    cadastro_writer.writerow(['Guilherme Rey', 'Jedi', '22/10/1988'])
    cadastro_writer.writerow(['Mestre Yoda', 'Jedi Master', '21/09/2540'])

Uma explicação sobre o parâmetro `quotechar`:

The quotechar optional parameter tells the writer which character to use to quote fields when writing. Whether quoting is used or not, however, is determined by the quoting optional parameter:

- If quoting is set to csv.QUOTE_MINIMAL, then .writerow() will quote fields only if they contain the delimiter or the quotechar. This is the default case.
- If quoting is set to csv.QUOTE_ALL, then .writerow() will quote all fields.
- If quoting is set to csv.QUOTE_NONNUMERIC, then .writerow() will quote all fields containing text data and convert all numeric fields to the float data type.
- If quoting is set to csv.QUOTE_NONE, then .writerow() will escape delimiters instead of quoting them. In this case, you also must provide a value for the escapechar optional parameter.


In [17]:
with open('cadastros.csv') as csv_file:
    csv_reader = csv.reader(csv_file, delimiter=',')
    for row in csv_reader:
        print(row)

['Name', 'Class', 'Birthday']
['Guilherme Rey', 'Jedi', '22/10/1988']
['Mestre Yoda', 'Jedi Master', '21/09/2540']


In [15]:
''' Como podemos imprimir cada valor de cada linha em linhas separadas, pulando a primeira linha?'
    Guilherme Rey
    Jedi
    22/10/1988
    Mestre Yoda
    Jedi Master
    21/09/2540
'''
pass

---

## Exercícios - Parte 1

Nos próximos exercícios usaremos o arquivo `hp1_2.txt`.
1. Quantas vezes a palavra `harry` aparece? *dica: é possível usar a função `count()` da String*
2. Em quantas linhas a palavra `harry` aparece?
3. Considerando os personagens `Hagrid`, `Hermione`, `Harry`, `Rony`, `Draco` e `Snape`, conte quantas vezes cada um é citado no livro e escreva isso num csv, no formato:

    `Personagem,Citacoes
     Hagrid,10
     Hermione,12
     Harry,23
     Rony,30
     Draco,50
     Snape,10`


4. Faça uma função que receba um novo nome para `harry` e troque todas as ocorrências encontradas por um novo nome,r ecebido por parâmetro. Sua função deverá ser usada da seguinte maneira:
    `novo_livro = troca_harry('mickey')`
    
5. Faça a função acima ser genérica, ou seja, receber um nome de um personagem e um novo nome para a troca. A função devolve o livro com os nomes trocados. Exemplo: `novo_livro = reescreve_livro('Hermione', 'Mafalda')`

In [62]:
def quantosharry():
    total = 0
    linhas = 0
    with open('hp1_2.txt', mode='r') as livro:
        for linha in livro:
            total += linha.count('Harry')
            if linha.count('Harry') > 0:
                linhas += 1
    print ('Palavra Harry aparece {} vezes no livro, em {} linhas.'.format(total, linhas))
    
    
quantosharry()

magos = ['Hagrid','Hermione', 'Harry', 'Ron', 'Draco', 'Snape']
import csv
def personagens(listagem):
    with open('hp1_2.txt') as livro:
        with open('personagens.csv',mode='w') as csvpersonagens:
            personagens_writer = csv.writer(csvpersonagens)
            for personagem in listagem:
                total = 0
                livro.seek(0)
                for linha in livro:
                    total += linha.count(personagem)
                personagens_writer.writerow([personagem , total])
                print (personagem, total)
                   
    

personagens(magos)        



Palavra Harry aparece 1326 vezes no livro, em 1294 linhas.
Hagrid 370
Hermione 270
Harry 1326
Ron 454
Draco 11
Snape 172


In [70]:
def troca_nome(personagem , nome):
    with open('hp1_2.txt') as livro:
        novo_livro = ''
        for linha in livro:
            novo_livro += linha.replace(personagem, nome)
        return novo_livro
    
novo_livro = troca_nome('Dursley','Cardoso')
print (novo_livro)
            
            


Harry Potter and the Sorcerer's Stone

CHAPTER ONE

THE BOY WHO LIVED

Mr. and Mrs. Cardoso, of number four, Privet Drive, were proud to say
that they were perfectly normal, thank you very much. They were the last
people you'd expect to be involved in anything strange or mysterious,
because they just didn't hold with such nonsense.

Mr. Cardoso was the director of a firm called Grunnings, which made
drills. He was a big, beefy man with hardly any neck, although he did
have a very large mustache. Mrs. Cardoso was thin and blonde and had
nearly twice the usual amount of neck, which came in very useful as she
spent so much of her time craning over garden fences, spying on the
neighbors. The Cardosos had a small son called Dudley and in their
opinion there was no finer boy anywhere.

The Cardosos had everything they wanted, but they also had a secret, and
their greatest fear was that somebody would discover it. They didn't
think they could bear it if anyone found out about the Potters. M

## Exercícios - Parte 2

Nos próximos exercícios usaremos o arquivo `movies.csv`.

1. Quantos filmes estão neste banco?
2. Quantos filmes do gênero comédia existem?
3. Quantas animações existem? Quantas dessas são musicais?
4. Considere os anos `1990`, `1991`, `1992`, `1993`, `1994` e `1995`. Leia o arquivo csv e escreva um novo contendo o número de filmes por ano, em cada linha. Por ex:

    `ano,filmes
    1990,10
    1991,40
    1992,30
    1993,50
    1994,10
    1995,50`