<h1>Aula 09 - Arquivos</h1>

Até o momento, lidamos somente com **Programas Transitórios**, ou seja, programas que executam o que tem que executar e não salvam nenhuma informação. Nesta aula, aprenderemos a lidar com **Programas Persistentes**, ou seja, programas que salvam suas informações. Para isso, teremos que aprender a lidar com Arquivos.

<h2>Leitura e Escrita de Arquivos</h2>

Vamos iniciar com um caso de leitura de arquivos. Para isso, vamos utilizar um repositório de palavras que são consideradas legítimas no Scramble ou nas palavras-cruzadas dos jornais estadunidenses. Você pode baixá-la no link: https://github.com/AllenDowney/ThinkPython2/blob/master/code/words.txt

Agora, vamos para nossas primeiras linhas de código para fazer leitura e escrita de Arquivos:

In [1]:
open?

[1;31mSignature:[0m
[0mopen[0m[1;33m([0m[1;33m
[0m    [0mfile[0m[1;33m,[0m[1;33m
[0m    [0mmode[0m[1;33m=[0m[1;34m'r'[0m[1;33m,[0m[1;33m
[0m    [0mbuffering[0m[1;33m=[0m[1;33m-[0m[1;36m1[0m[1;33m,[0m[1;33m
[0m    [0mencoding[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0merrors[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mnewline[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mclosefd[0m[1;33m=[0m[1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mopener[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[1;31mDocstring:[0m
Open file and return a stream.  Raise OSError upon failure.

file is either a text or byte string giving the name (and the path
if the file isn't in the current working directory) of the file to
be opened or an integer file descriptor of the file to be
wrapped. (If a file descriptor is given, it is closed when the
returned I/O object is closed

In [2]:
fin = open('words_source.txt','r')
fin

<_io.TextIOWrapper name='words_source.txt' mode='r' encoding='cp1252'>

In [3]:
#Se quisermos ler a primeira linha do arquivo, usamos o comando:
line = fin.readline()
line

'aa\n'

In [4]:
#O objeto do arquivo grava a posição da última leitura, então se chamarmos de novo a função, veja o que acontece:
line2 = fin.readline()
line2

'aah\n'

In [5]:
#Para ler todas as linhas de uma vez, utilizamos:
lines = fin.readlines()
lines

#Obs. Se executarmos esta célula novamente, como já lemos tudo o que havia para ser lido no objeto de arquivo, 
#a lista ficará vazia.

['aahed\n',
 'aahing\n',
 'aahs\n',
 'aal\n',
 'aalii\n',
 'aaliis\n',
 'aals\n',
 'aardvark\n',
 'aardvarks\n',
 'aardwolf\n',
 'aardwolves\n',
 'aas\n',
 'aasvogel\n',
 'aasvogels\n',
 'aba\n',
 'abaca\n',
 'abacas\n',
 'abaci\n',
 'aback\n',
 'abacus\n',
 'abacuses\n',
 'abaft\n',
 'abaka\n',
 'abakas\n',
 'abalone\n',
 'abalones\n',
 'abamp\n',
 'abampere\n',
 'abamperes\n',
 'abamps\n',
 'abandon\n',
 'abandoned\n',
 'abandoning\n',
 'abandonment\n',
 'abandonments\n',
 'abandons\n',
 'abas\n',
 'abase\n',
 'abased\n',
 'abasedly\n',
 'abasement\n',
 'abasements\n',
 'abaser\n',
 'abasers\n',
 'abases\n',
 'abash\n',
 'abashed\n',
 'abashes\n',
 'abashing\n',
 'abasing\n',
 'abatable\n',
 'abate\n',
 'abated\n',
 'abatement\n',
 'abatements\n',
 'abater\n',
 'abaters\n',
 'abates\n',
 'abating\n',
 'abatis\n',
 'abatises\n',
 'abator\n',
 'abators\n',
 'abattis\n',
 'abattises\n',
 'abattoir\n',
 'abattoirs\n',
 'abaxial\n',
 'abaxile\n',
 'abbacies\n',
 'abbacy\n',
 'abbatial\n',

In [6]:
#Fechando o arquivo das palavras
fin.close()

#Para a escrita de um arquivo novo, vamos usar a letra 'w' (write) ao invés de 'r' ('read')
fout = open("words_out.txt",'w')
fout.write(str(lines[:10]))
fout.close()

<h3>Exercícios Iniciais</h3>

1. Escreva um programa que leia todas as palavras de "words.txt "e armazene em um arquivo chamado "big_words.txt" somente aquelas palavras que possuam mais de 18 caracteres.

2. A vogal "e" é a mais frequente no Inglês. Faça uma função que receba como entrada uma palavra e retorne True se tal palavra não contiver "e". Use essa função para calcular a porcentagem das palavras do arquivo "words.txt" que não contém a letra "e".

<h2>Operador de Formatação</h2>

O argumento de **write()** deve ser sempre uma string. Então, caso queiramos escrever valores numéricos em nosso arquivo, devemos sempre convertê-los em string. Exemplo:

In [7]:
fout = open("words_out.txt",'a')
x = 52
fout.write(str(x))
fout.close()

Lembra-se que utilizávamos o operador de formatação ('%') para fazermos strings complexas, ou o o método .format()? Pois é, utilizaremos muito isso na leitura e escrita de arquivos.

In [8]:
camelos = 10
anos = 3.5

fout = open("words_out.txt",'a')
frase = "\nEm %.1f anos, eu observei %d camelos" %(anos,camelos)
fout.write(frase)
fout.close()

Para escrevermos múltiplas linhas de uma lista, utilizamos o comando writeLines():

In [18]:
arquivo = open("texto.txt", "w")

frases = list()
frases.append("Aula do André \n")
frases.append("Python \n")
frases.append("Arquivos \n")
frases.append("Bibliotecas Interessantes \n")

arquivo.writelines(frases)
arquivo.close()

<h3>Nomes de Arquivos e Caminhos</h3>

Organizamos arquivos em diretórios ou pastas. Quase tudo que executamos em Python utiliza como referência o **diretório atual** ou **diretório-padrão** em que o programa está sendo processado. Para descobrir o diretório atual, usamos a biblioteca OS (de Operational System):

In [10]:
import os
#current working directory
cwd = os.getcwd()
cwd

'C:\\Users\\Pichau\\OneDrive\\Documentos\\Aulas\\Programação'

Existem dois tipos de caminhos que podemos utilizar para navegar nos diretórios. O primeiro é o **caminho relativo**, ou seja, a partir do meu diretório atual, quais são os caminhos que eu tenho que percorrer para chegar ao diretório desejado. O segundo é o **caminho absoluto**, ou seja, a partir do diretório raiz da minha máquina (C:/, root, etc.) qual o caminho que eu devo fazer para chegar à pasta desejada.

In [11]:
#acessando o arquivo "words" a partir do caminho relativo

words = open("words.txt",'r')
words.close()

#imprimindo o diretório absoluto de words
print(os.path.abspath("words.txt"))

C:\Users\Pichau\OneDrive\Documentos\Aulas\Programação\words.txt


In [12]:
#Listando os arquivos e pastas em um diretório
os.listdir()

#Veja que, no geral, arquivos possuem extensão, enquanto pastas não.

['.ipynb_checkpoints',
 'Aula 01 - André.docx',
 'Aula 01 - André.pdf',
 'Aula 02 - André.docx',
 'Aula 02 - André.pdf',
 'Aula 03 - André.docx',
 'Aula 03 - André.pdf',
 'Aula 04 - André.docx',
 'Aula 04 - André.pdf',
 'Aula 05 - André.docx',
 'Aula 05 - André.pdf',
 'Aula 06 - André.docx',
 'Aula 06 - André.pdf',
 'Aula 07 - André.pdf',
 'Aula_08_André.ipynb',
 'Aula_09-André.ipynb',
 'Ementa_Python.docx',
 'Ementa_Python.pdf',
 'Exercicios-Aula01.zip',
 'Exercicios-Aula02.zip',
 'Exercicios-Aula03.zip',
 'Forca.zip',
 'Listas.ipynb',
 'PLNBasico-Andre.zip',
 'PrimeirosPassoscomTurtle.zip',
 'Projeto-Aula02.zip',
 'Solucao_Roman_to_Int.txt',
 'SubwayBR.zip',
 'texto.txt',
 'Turtle_Basics.ipynb',
 'words.txt',
 'words_out.txt',
 'words_source.txt']

<h3>Captura de Exceções</h3>

<h3>Exercícios de Fixação</h3>

1. Adapte o seu programa da forca das aulas anteriores para, ao invés de pedir para o P1 digitar a palavra secreta utilizando .getpass(), sortear uma palavra secreta de um arquivo com uma lista de palavras.