<a href="https://colab.research.google.com/github/lucsferreiraalonso/labPraticasIntegradas/blob/main/Aula_8_Arquivos_2024.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Aula 8 - Arquivos

## 1. Introdução a arquivos

Apesar de avaliarmos a importância das estruturas de programação e das estruturas de dados na elaboração dos programas, ainda não analisamos um aspecto crucial:

### Qual a função de um programa de computador?
### Qual a matéria prima que um software deve processar?

Resp:  --> **INFORMAÇÃO** <--

... E Não somente informação, mas sim a informação em um formato passível de processamento computacional, ou seja, os dados de um programa.


## 1.1 Tipos de informação

Quando estamos exexutando um programa, a informação  manipulada pode ser de dois tipos:

- **“Volátil”**, **“não durável”**: Os dados estão armazenados em variáveis e estruturas de dados dispostas em memória principal e serão perdidos assim que o programa é finalizado.

- **“Não volátil”**, **“durável”**, **“permanente”**: Os dados serão salvos em memória secundária e a informação sobreviverá ao fim da execução de um programa, ou seja, os dados serão armazenados permanentemente em **ARQUIVOS**.

## 1.2 O conceito de arquivo

Um arquivo é uma abstração lógica oferecida pelo sistema operacional em que dados são organizados e estruturados em memória permanente (secundária) de forma a ser possível seu acesso e manipulação de modo eficiente. de modo prático, um arquivo é um conjunto de áreas no disco onde gravamos (escrevemos) e de onde lemos dados.

## 1.3 Tipos de arquivos

Geralmente **arquivos sequenciais** (ou seja, lidos como sequências de bits) podem ser de dois tipos:

- **Arquivos de texto:** Estruturado caractere a caractere. Pode ser um arquivo de texto simples ou de texto com marcação (XML, JSON, HTML, DOCX).
- **Arquivos binários:** Estruturados como sequências de Bytes (BIN, EXE, LAME, JPEG, etc).

Uma breve análise sobre: https://www.akitaonrails.com/2021/01/20/akitando-91-qual-a-real-diferenca-entre-arquivos-binario-e-texto

### 1.3.1 Arquivos *plaintext*

Arquivos de texto (*plaintext*) são uma sequência estruturada de linhas, que contém em cada linha uma sequência de caracteres, sem informações sobre formatação.

Cada linha do arquivo é separada por um caracter “\n” (*newline*) e geralmente para as codificações mais simples (como o ASCII, latin-1 e UTF-8, por exemplo), cada caractere ocupa um byte do arquivo.

Na aula de hoje, aprenderemos a ler, escrever e processar informações oriundas de arquivos no formato mais simples, o de *plaintext* (texto plano) e no formato de linguagem de marcação ***JSON***.

## 2. Operações sob arquivos de texto em Python

## 2.1 Abertura e fechamento de arquivo

Para criar ou acessar um arquivo existente primeiro é necessário abrir o arquivo.

Para isso usamos o comando:

````python
var = open("caminho_arquivo",<op>)
````

onde:

- **var** é a variável para um objeto do tipo ````<file>```` que apontará para o arquivo e o manipulará em memória principal.

- **“caminho_arquivo”** é o caminho de acesso ao arquivo seguido de seu nome
  - caminho relativo, caso o arquivo esteja no mesmo diretório de trabalho do *script*
  - ou caminho absoluto, caso contrário

- <**op**> : indica que operação será realizada sobre o arquivo.
  - 'r' --> leitura;
  - 'w' --> escrita;
  - 'a' -> append;
  - '+' -> atualização (leitura e escrita);
  - 'x' -> criação exclusiva

E quanto ao fechamento?

Para fechar um manipulador de arquivo, basta utilizar o método ````.close()````

````python
var.close()
````


### 2.1.1 Abertura com gerenciamento de contexto

Um problema recorrente ao se abrir arquivos é esquecer-se de fechá-los. Para garantir o fechamento do arquivo e os possíveis problemas decorrentes de não fechá-lo (travas de recursos) uma opção é utilizar o gerenciamente de contexto com o comando ````with````.

Desta forma, ao se encerrar o contexto, o arquivo é fechado automaticamente.

sintaxe:

````python
with open("caminho_arquivo",<op>) as var:
  #operações sobre o arquivo
````
exemplo:

In [None]:
%%file poema.txt
E agora, José?
A festa acabou,
a luz apagou,
o povo sumiu,
a noite esfriou,
e agora, José?
e agora, você?
você que é sem nome,
que zomba dos outros,
você que faz versos,
que ama, protesta?
e agora, José?

Está sem mulher,
está sem discurso,
está sem carinho,
já não pode beber,
já não pode fumar,
cuspir já não pode,
a noite esfriou,
o dia não veio,
o bonde não veio,
o riso não veio,
não veio a utopia
e tudo acabou
e tudo fugiu
e tudo mofou,
e agora, José?

E agora, José?
Sua doce palavra,
seu instante de febre,
sua gula e jejum,
sua biblioteca,
sua lavra de ouro,
seu terno de vidro,
sua incoerência,
seu ódio — e agora?

Com a chave na mão
quer abrir a porta,
não existe porta;
quer morrer no mar,
mas o mar secou;
quer ir para Minas,
Minas não há mais.
José, e agora?

Se você gritasse,
se você gemesse,
se você tocasse
a valsa vienense,
se você dormisse,
se você cansasse,
se você morresse...
Mas você não morre,
você é duro, José!

Sozinho no escuro
qual bicho-do-mato,
sem teogonia,
sem parede nua
para se encostar,
sem cavalo preto
que fuja a galope,
você marcha, José!
José, para onde?

Writing poema.txt


In [None]:
try:
  poema = open("poema.txt","r")
  #operações sobre o arquivo
  poema.close()
except:
  print("Problema com leitura do arquivo!")


#ou abertura com gerência de contexto

try:
  with open("poema.txt","r") as poema:
    #operações sobre o arquivo
    pass #não faz nada
    #operações sobre o arquivo
  #quando sair do with, já fecha automaticamente
except:
  print("Problema com leitura do arquivo!")



### ***Observações:***

- Se não for declarado nenhum caminho e apenas o nome do arquivo, ele será buscado apenas no diretório em que o programa está.

 - Se o arquivo for novo e a operação for de escrita, ele será criado, mas todo o caminho deve existir primeiro. Portanto, deve-se criar os diretórios antes

 - Existem diversas possibilidades de gerar erros durante o acesso, como o caso do arquivo não existir, de tentar-se criar um segundo arquivo com o nome já existente, ou não haver permissão para acessar o arquivo. Nestes casos, indica-se sempre tratar possíveis excessões com cláusulas ````try-except````.



Após abrir o arquivo, podemos realizar duas operações:

- Ler o arquivo, caso a opção na operação foi ‘r’
- Escrever no arquivo, caso a opção de operação foi ‘w ou a’

Vamos analisar cada uma das operações a seguir.

## 2.2 Leitura de arquivo

Após abrir o arquivo, existem três principais opções de métodos para leitura de seu conteúdo:

- ````.read()````: Retorna o arquivo todo em uma string
- ````.readlines()````: Retorna o arquivo em uma lista de strings, onde cada item é uma linha do arquivo
- ````.readLine()````: Lê uma linha por vez, ou seja, retorna uma linha e deixa o manipulador do arquivo apontado para a primeira posição da linha seguinte.

Observe os exemplos a seguir:


In [None]:
#Nao se esqueça de fazer o upload do arquivo poema.txt

#Opção 1: Todo em uma string
try:
  with open("poema.txt") as poema:
    todo_em_uma_string = poema.read()
    print(todo_em_uma_string)
except:
  print("Erro de leitura")


E agora, José?
A festa acabou,
a luz apagou,
o povo sumiu,
a noite esfriou,
e agora, José?
e agora, você?
você que é sem nome,
que zomba dos outros,
você que faz versos,
que ama, protesta?
e agora, José?

Está sem mulher,
está sem discurso,
está sem carinho,
já não pode beber,
já não pode fumar,
cuspir já não pode,
a noite esfriou,
o dia não veio,
o bonde não veio,
o riso não veio,
não veio a utopia
e tudo acabou
e tudo fugiu
e tudo mofou,
e agora, José?

E agora, José?
Sua doce palavra,
seu instante de febre,
sua gula e jejum,
sua biblioteca,
sua lavra de ouro,
seu terno de vidro,
sua incoerência,
seu ódio — e agora?

Com a chave na mão
quer abrir a porta,
não existe porta;
quer morrer no mar,
mas o mar secou;
quer ir para Minas,
Minas não há mais.
José, e agora?

Se você gritasse,
se você gemesse,
se você tocasse
a valsa vienense,
se você dormisse,
se você cansasse,
se você morresse...
Mas você não morre,
você é duro, José!

Sozinho no escuro
qual bicho-do-mato,
sem teogonia,
sem par

In [None]:
#Opção 2: Lista de linhas

try:
  with open("poema.txt") as poema:
    linhas = poema.readlines()
    print(linhas)
except:
  print("Erro de leitura")

['E agora, José?\n', 'A festa acabou,\n', 'a luz apagou,\n', 'o povo sumiu,\n', 'a noite esfriou,\n', 'e agora, José?\n', 'e agora, você?\n', 'você que é sem nome,\n', 'que zomba dos outros,\n', 'você que faz versos,\n', 'que ama, protesta?\n', 'e agora, José?\n', '\n', 'Está sem mulher,\n', 'está sem discurso,\n', 'está sem carinho,\n', 'já não pode beber,\n', 'já não pode fumar,\n', 'cuspir já não pode,\n', 'a noite esfriou,\n', 'o dia não veio,\n', 'o bonde não veio,\n', 'o riso não veio,\n', 'não veio a utopia\n', 'e tudo acabou\n', 'e tudo fugiu\n', 'e tudo mofou,\n', 'e agora, José?\n', '\n', 'E agora, José?\n', 'Sua doce palavra,\n', 'seu instante de febre,\n', 'sua gula e jejum,\n', 'sua biblioteca,\n', 'sua lavra de ouro,\n', 'seu terno de vidro,\n', 'sua incoerência,\n', 'seu ódio — e agora?\n', '\n', 'Com a chave na mão\n', 'quer abrir a porta,\n', 'não existe porta;\n', 'quer morrer no mar,\n', 'mas o mar secou;\n', 'quer ir para Minas,\n', 'Minas não há mais.\n', 'José, e 

In [None]:
#Opção 3: Lendo linha a linha
try:
  with open("poema.txt") as poema:
    linha = poema.readline()
    while(linha):
      print(linha,end="")
      linha = poema.readline()
except:
  print("Erro de leitura")

E agora, José?
A festa acabou,
a luz apagou,
o povo sumiu,
a noite esfriou,
e agora, José?
e agora, você?
você que é sem nome,
que zomba dos outros,
você que faz versos,
que ama, protesta?
e agora, José?

Está sem mulher,
está sem discurso,
está sem carinho,
já não pode beber,
já não pode fumar,
cuspir já não pode,
a noite esfriou,
o dia não veio,
o bonde não veio,
o riso não veio,
não veio a utopia
e tudo acabou
e tudo fugiu
e tudo mofou,
e agora, José?

E agora, José?
Sua doce palavra,
seu instante de febre,
sua gula e jejum,
sua biblioteca,
sua lavra de ouro,
seu terno de vidro,
sua incoerência,
seu ódio — e agora?

Com a chave na mão
quer abrir a porta,
não existe porta;
quer morrer no mar,
mas o mar secou;
quer ir para Minas,
Minas não há mais.
José, e agora?

Se você gritasse,
se você gemesse,
se você tocasse
a valsa vienense,
se você dormisse,
se você cansasse,
se você morresse...
Mas você não morre,
você é duro, José!

Sozinho no escuro
qual bicho-do-mato,
sem teogonia,
sem par

## 2.3 Escrita de Arquivo

Quanto a escrita, podemos usar os seguintes métodos:

- ````.write(<str>)````: Escreve o conteúdo da string passada como parâmetro no arquivo

- ````.writelines(<list>)````: Escreve o conteúdo das strings contidas na lista de strings passadas como parâmetro no arquivo

Seguem exemplos:

- criar um arquivo auxiliar com o número de palavras de cada  do poema

In [None]:
#Opção 1: Usando write
try:
  with open("poema.txt") as poema:
    linhas = poema.readlines()
except:
  print("Erro de leitura")

#carreguei o conteúdo do arquivo pra lista de linhas
#criar um arquivo auxiliar com o número de palavras de cada linha

try:
  with open("caracteres_por_linha.txt","w") as escrever:
    for lin in linhas:
      escrever.write(str(len(lin.split()))+"\n")
except:
  print("Erro no arquivo!")

In [None]:
#Opção 2: Usando .writelines
try:
  with open("poema.txt") as poema:
    linhas = poema.readlines()
except:
  print("Erro de leitura")

#carreguei o conteúdo do arquivo pra lista de linhas
#criar um arquivo auxiliar com o número de palavras de cada linha

try:
  with open("caracteres_por_linha.txt","w") as escrever:
    num_palavras = []
    for lin in linhas:
      num_palavras.append(str(len(lin.split()))+"\n")
    escrever.writelines(num_palavras)
except:
  print("Erro no arquivo!")


### Importante lembrar!

- Toda leitura de um arquivo de texto é recebida como string, assim como um input(). Para manipular outros tipos de dados, deve-se converter o tipo!

- Da mesma forma, os métodos de escrita em arquivo salvam a informação como cadeias de caracteres (strings). Deve-se converter (str()) para depois escrever.

## 2.4. Deslocando-se no arquivo

Uma dupla de métodos importantes para saber alterar a posição em que sua variável aponta no arquivo são os métodos ````.tell()```` e ````.seek()````:

- ````.tell()````: Informa em que byte do arquivo a variável está apontando

- ````.seek(<pos>)````: Desloca a posição que a variável de arquivo está apontando para a posição passada pelo valor do parâmetro *pos*

# 3. Arquivos JSON

JSON - *JavaScript Object Notation* - é um formato de troca de dados de dados entre aplicações, assim como XML. Atualmente é considerado melhor e mais amplamente utilizado que o XML. (https://www.w3schools.com/js/js_json_xml.asp)

- Referência ao formato JSON:
  - https://www.json.org/json-pt.html

-Módulo JSON da Biblioteca Padrão Python
   - https://docs.python.org/3/library/json.html

Observando o formato do serializável JSON podemos observar que a construção é extremamente semelhante às listas e dicionários do python.

## 3.1 Lendo e escrevendo strings e arquivos JSON

Para utilizar os métodos leitura e escrita de JSON devemos importar o módulo ````json````

````python
import json
````

Após isso, as rotinas de codificação e decodificação ficam por conta de 4 métodos:

- Geração do “serializável” JSON:
  - ````.dump()````: gerar o arquivo .json a partir dos objetos
  - ````.dumps()````: gerar a string json a partir dos objetos
- Parsing de JSON para o objeto:
  - ````.load()````: gera os objetos a partir do arquivo json
  - ````.loads()````: gera os objetos a partir da string json

### 3.1.1. O método ````.dump()````

Usado para serializar os objetos em arquivos. Geralmente listas, dicionários ou listas de dicionários.



In [None]:
import json
ticket = {}
ticket["data"] = "12/11/2024"
ticket["hora"] = "19:20"
ticket["evento"] = "Aula de LPI"
ticket["local"] = "Faculdade Barretos"
ticket["duração"] = 2

with open("arquivo.json","w") as esc:
  json.dump(ticket,esc,indent = 4, ensure_ascii = False,sort_keys = True)



### 3.1.2 O método ````.load()````

Usado para fazer o *parsing* do conteúdo do arquivo JSON e retornar os objetos correspondentes:

In [None]:
import json

with open("arquivo.json","r") as ler:
  obj = json.load(ler)

print(obj)



{'data': '17/10/2023', 'duração': 2, 'evento': 'Aula de LPI', 'hora': '19:20', 'local': 'Faculdade Barretos'}


# Desafio de programação:

Escreva um programa que leia o arquivo "poema.txt" e salve um arquivo json "analise.json" para guarde um dicionário que possui como chave cada letra do alfabeto, seguida de uma lista com todas as palavras do poema iniciadas por essa letra. sem repetições.

In [None]:
#escrever e executar aqui!

# Exercícios de Fixação

1. Escreva um programa que leia um conjunto de valores  de um arquivo e calcule a soma e média destes valores

2. Mais além, escreva um programa que leia um conjunto de valores em cada linha do arquivo e escreva um segundo arquivo com a soma desses valores em cada linha

3. Escreva um programa que escreva um arquivo “valor.csv” com duas listas x = [1, 2, 3, ... , 1000] e y = x^2+2x+6. com um valor de x e um de y em cada linha separado por vírgulas. *Desafio:* Plote um gráfico usando pandas e alguma biblioteca de visualização, como matplotlib

4. Escreva um programa que leia um texto de um arquivo e informe:
  - número total de linhas
  - número total de palavras
  - número total de espaços
  - número total de caracteres

5. Escreva um programa que leia de um arquivo, para cada linha, duas notas do aluno, e escreva em tela, para cada aluno, “aprovado” se a média das notas foi maior que 7, ou “nos vemos no exame” se a média foi menor que 7.





In [None]:
#exec 1

In [None]:
#exec 2

In [None]:
#exec 3

In [None]:
#exec 4

In [None]:
#exec 5

***
AVISO: Esse material foi produzido por Prof. Me. Diogo Tavares da Silva e é de sua inteira responsabilidade e propriedade intelectual. Caso queira utilizar ou adaptar em suas aulas, por favor, não deixe de dar os créditos.