# Aula 6 - File IO
---

Uma das coisas mais úteis que temos quando vamos montar nossos scripts é o poder de ler e escrever em arquivos. Assim, podemos persistir informações e/ou ler para processamento. Vamos aprender como fazer isso utilizando Python!

Vamos utilizar a função `open()` do Python. Ela espera um nome de arquivo e o modo com que vamos abri-lo. Por enquanto, vamos usar `r` para leitura e `w` para escrita.

O algoritmo para criação de um arquivo python é:

    criar uma variável que receba o arquivo
    escrever alguma(s) string(s)
    fechar o arquivo

In [11]:
file_name = 'meu_arquivo.txt'
file = open(file_name, "w")

file.write('Isso é uma linha\n')

17

In [12]:
# Escreva mais uma linha em file aqui!

In [13]:
file.close() # Fechando o arquivo

Outra maneira de fazer isso é utilizando a palavra `with`. Nesse caso, o Python se encarrega de chamar a função `close()` ao final do uso do arquivo. Verifique como fica abaixo:

In [4]:
with open("meu_arquivo_2.txt", 'w') as f:
    # Nesse caso, f é nossa variável de arquivo
    f.write('Escrevendo no arquivo')
    f.write('Escrevendo no arquivoo')

Para realizar a leitura, basta alterar para o modo `r` e utilizar um loop `for` para iterar sobre todas as linhas do arquivo.

In [6]:
with open("meu_arquivo.txt", 'r') as f:
    for line in f:
        print(line)

Isso é uma linha

Isso é outra linha



---

## Arquivos CSV

Arquivos CSV (Comma-separated values) são úteis para lermos e salvarmos informações de maneira estruturada, como uma tabela. Eles são bastante utilizados para pré-processamento e criação de bancos para transferências.

O Python nos dá uma biblioteca `csv` para trabalhar com esse tipo de arquivo, facilitando a leitura e a escrita. Basta usarmos o comand `import csv`.

In [9]:
import csv

with open('cadastros.csv', mode='w') as cadastro_file:
    cadastro_writer = csv.writer(cadastro_file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
    cadastro_writer.writerow(['Name', 'Class', 'Birthday'])
    cadastro_writer.writerow(['Guilherme Rey', 'Jedi', '22/10/1988'])
    cadastro_writer.writerow(['Mestre Yoda', 'Jedi Master', '21/09/2540'])

Uma explicação sobre o parâmetro `quotechar`:

The quotechar optional parameter tells the writer which character to use to quote fields when writing. Whether quoting is used or not, however, is determined by the quoting optional parameter:

- If quoting is set to csv.QUOTE_MINIMAL, then .writerow() will quote fields only if they contain the delimiter or the quotechar. This is the default case.
- If quoting is set to csv.QUOTE_ALL, then .writerow() will quote all fields.
- If quoting is set to csv.QUOTE_NONNUMERIC, then .writerow() will quote all fields containing text data and convert all numeric fields to the float data type.
- If quoting is set to csv.QUOTE_NONE, then .writerow() will escape delimiters instead of quoting them. In this case, you also must provide a value for the escapechar optional parameter.


In [17]:
with open('cadastros.csv') as csv_file:
    csv_reader = csv.reader(csv_file, delimiter=',')
    for row in csv_reader:
        print(row)

['Name', 'Class', 'Birthday']
['Guilherme Rey', 'Jedi', '22/10/1988']
['Mestre Yoda', 'Jedi Master', '21/09/2540']


In [15]:
''' Como podemos imprimir cada valor de cada linha em linhas separadas, pulando a primeira linha?'
    Guilherme Rey
    Jedi
    22/10/1988
    Mestre Yoda
    Jedi Master
    21/09/2540
'''
pass

---

## Exercícios - Parte 1

Nos próximos exercícios usaremos o arquivo `hp1_2.txt`.
1. Quantas vezes a palavra `harry` aparece? *dica: é possível usar a função `count()` da String*
2. Em quantas linhas a palavra `harry` aparece?
3. Considerando os personagens `Hagrid`, `Hermione`, `Harry`, `Rony`, `Draco` e `Snape`, conte quantas vezes cada um é citado no livro e escreva isso num csv, no formato:

    `Personagem,Citacoes
     Hagrid,10
     Hermione,12
     Harry,23
     Rony,30
     Draco,50
     Snape,10`


4. Faça uma função que receba um novo nome para `harry` e troque todas as ocorrências encontradas por um novo nome,r ecebido por parâmetro. Sua função deverá ser usada da seguinte maneira:
    `novo_livro = troca_harry('mickey')`
    
5. Faça a função acima ser genérica, ou seja, receber um nome de um personagem e um novo nome para a troca. A função devolve o livro com os nomes trocados. Exemplo: `novo_livro = reescreve_livro('Hermione', 'Mafalda')`

## Exercícios - Parte 2

Nos próximos exercícios usaremos o arquivo `movies.csv`.

1. Quantos filmes estão neste banco?
2. Quantos filmes do gênero comédia existem?
3. Quantas animações existem? Quantas dessas são musicais?
4. Considere os anos `1990`, `1991`, `1992`, `1993`, `1994` e `1995`. Leia o arquivo csv e escreva um novo contendo o número de filmes por ano, em cada linha. Por ex:

    `ano,filmes
    1990,10
    1991,40
    1992,30
    1993,50
    1994,10
    1995,50`

In [3]:
import csv

new_genres = []
with open('movies.csv', encoding = 'utf-8') as movies:
    movie_reader = csv.DictReader(movies)
    for linha in movie_reader:
        new_genres = (linha['genres'].split('|'))
        del linha['genres']
        linha['genres'] = new_genres
        print(linha['genres'])
        
    
    


['Adventure', 'Animation', 'Children', 'Comedy', 'Fantasy']
['Adventure', 'Children', 'Fantasy']
['Comedy', 'Romance']
['Comedy', 'Drama', 'Romance']
['Comedy']
['Action', 'Crime', 'Thriller']
['Comedy', 'Romance']
['Adventure', 'Children']
['Action']
['Action', 'Adventure', 'Thriller']
['Comedy', 'Drama', 'Romance']
['Comedy', 'Horror']
['Adventure', 'Animation', 'Children']
['Drama']
['Action', 'Adventure', 'Romance']
['Crime', 'Drama']
['Drama', 'Romance']
['Comedy']
['Comedy']
['Action', 'Comedy', 'Crime', 'Drama', 'Thriller']
['Comedy', 'Crime', 'Thriller']
['Crime', 'Drama', 'Horror', 'Mystery', 'Thriller']
['Action', 'Crime', 'Thriller']
['Drama', 'Sci-Fi']
['Drama', 'Romance']
['Drama']
['Children', 'Drama']
['Drama', 'Romance']
['Adventure', 'Drama', 'Fantasy', 'Mystery', 'Sci-Fi']
['Crime', 'Drama']
['Drama']
['Mystery', 'Sci-Fi', 'Thriller']
['Children', 'Drama']
['Drama', 'Romance']
['Crime', 'Drama']
['Documentary', 'IMAX']
['Children', 'Comedy']
['Comedy', 'Romance']
['Dr

['Comedy', 'Musical']
['Action', 'Drama', 'War']
['Drama', 'Thriller']
['Drama', 'Thriller']
['Action', 'Drama', 'War']
['Comedy', 'Drama']
['Drama', 'Mystery']
['Drama']
['Adventure', 'Comedy', 'Sci-Fi']
['Comedy', 'Drama']
['Comedy', 'Romance']
['Western']
['Drama', 'Horror']
['Comedy']
['Documentary']
['Drama']
['Comedy', 'Drama', 'Romance']
['Fantasy', 'Horror', 'Mystery', 'Romance']
['Action', 'Adventure', 'Thriller']
['Drama']
['Children', 'Comedy', 'Fantasy', 'Musical']
['Comedy', 'Fantasy', 'Romance']
['Comedy', 'Fantasy']
['Drama']
['Drama']
['Drama', 'War']
['Drama', 'Western']
['Drama', 'Romance']
['Drama']
['Comedy']
['Comedy', 'Drama', 'Romance']
['Drama']
['Comedy', 'Drama', 'Romance']
['Drama']
['Drama', 'Thriller']
['Crime', 'Romance', 'Thriller']
['Drama', 'Romance']
['Action', 'Comedy', 'Crime', 'Thriller']
['Drama', 'Mystery']
['Drama', 'Romance']
['Action', 'Drama']
['Comedy', 'Drama', 'Fantasy', 'Romance']
['Drama']
['Drama']
['Drama']
['Drama']
['Action', 'Fantasy

['Drama', 'Thriller']
['Drama']
['Drama']
['Drama', 'Romance']
['Action', 'Adventure', 'Drama', 'Sci-Fi']
['Drama']
['Comedy', 'Drama']
['Comedy', 'Romance']
['Comedy', 'Horror', 'Sci-Fi']
['Comedy', 'Crime']
['Comedy', 'Crime']
['Action', 'Adventure']
['Horror', 'Romance']
['Comedy', 'Drama', 'Fantasy']
['Drama']
['Drama']
['Documentary']
['Drama', 'Sci-Fi']
['Documentary']
['Drama']
['Drama', 'Romance']
['Action', 'Comedy', 'Crime', 'Fantasy']
['Comedy', 'Fantasy', 'Mystery']
['Horror', 'Thriller']
['Horror', 'Mystery', 'Thriller']
['Drama']
['Horror', 'Thriller']
['Comedy', 'Crime', 'Drama']
['Action', 'Adventure', 'Crime', 'Thriller']
['Comedy', 'Drama', 'Romance']
['Comedy', 'Drama', 'Romance']
['Animation', 'Drama', 'Romance']
['Comedy']
['Action', 'Adventure', 'Drama']
['Action', 'Romance']
['Action']
['Comedy', 'Crime', 'Drama']
['Adventure', 'Musical']
['Drama']
['Action', 'Comedy', 'Drama']
['Horror', 'Sci-Fi', 'Thriller']
['Comedy', 'Musical', 'Romance']
['Drama']
['Comedy',

['Documentary']
['Drama', 'Mystery', 'Thriller']
['Comedy', 'Drama']
['Drama']
['Action', 'Drama']
['Comedy', 'Drama', 'Fantasy', 'Mystery']
['Drama', 'Mystery', 'Thriller']
['Drama', 'War']
['Action', 'Horror', 'Thriller']
['Drama']
['Action', 'Children', 'Fantasy']
['Comedy', 'Romance']
['Drama']
['Drama']
['Crime', 'Drama']
['Action', 'Horror', 'Thriller']
['Drama']
['Comedy', 'Drama']
['Adventure', 'Children', 'Fantasy']
['Comedy', 'Fantasy', 'Horror']
['Comedy']
['Documentary']
['Comedy', 'Drama', 'Romance']
['Documentary']
['Documentary']
['Documentary']
['Comedy', 'Drama', 'Romance']
['Action', 'Crime', 'Drama', 'Thriller']
['Adventure', 'Comedy']
['Comedy', 'Drama', 'Romance']
['Drama', 'Horror', 'Thriller']
['Comedy', 'Romance']
['Comedy', 'Drama']
['Documentary']
['Animation', 'Children', 'Drama']
['Romance']
['Drama']
['Comedy', 'Romance']
['Comedy', 'Musical']
['Action', 'Fantasy', 'Thriller']
['Drama', 'Thriller']
['Comedy', 'Romance']
['Drama', 'Mystery', 'Thriller']
['Co

['Crime', 'Drama', 'Thriller']
['Horror', 'Thriller']
['Drama', 'Romance']
['Drama']
['Drama', 'Fantasy', 'Musical', 'Mystery', 'Sci-Fi']
['Drama', 'Musical']
['Action', 'Crime', 'Drama', 'Thriller']
['Thriller']
['Documentary']
['Drama', 'Romance']
['Adventure', 'Documentary', 'Drama']
['Documentary']
['Horror', 'Thriller']
['Animation', 'Children', 'Comedy']
['Documentary']
['Drama']
['Drama', 'Thriller']
['Comedy', 'Crime']
['Comedy', 'Drama']
['Documentary']
['Documentary']
['Action', 'Drama', 'Thriller']
['Drama', 'Horror', 'Thriller']
['Documentary']
['Documentary']
['Action', 'Crime', 'Mystery', 'Thriller']
['Documentary']
['Drama', 'Sci-Fi', 'IMAX']
['Action', 'Adventure', 'Comedy', 'Documentary', 'Fantasy']
['Documentary']
['Drama', 'War']
['Action', 'Comedy']
['Comedy', 'Drama']
['Crime', 'Drama', 'Thriller']
['Documentary']
['Drama']
['Drama']
['Animation', 'Comedy']
['Comedy', 'Drama']
['Drama']
['Drama']
['Adventure', 'Drama', 'IMAX']
['Crime', 'Drama', 'Horror', 'Thriller