<img src='op2-u02.png'/>
<h2><font color='#7F0000'>OP2-07-Arquivos (Parte 2)</font></h2>

## Uso de with

In [None]:
# O comando with oferece algumas facilidades para o uso de arquivos:
#-- fechamento automático do arquivo, mesmo na ocorrência de exceções; e 
#-- agrupamento do conjunto de comandos que processam o arquivo.

In [None]:
nome_arquivo = 'arquivos/pessoas.txt'
# abertura e utilização do arquivo
with open(nome_arquivo, 'r') as f:
    # leitura do arquivo
    conteudo = f.read();
    tamanho = f.tell();
# o arquivo é fechado automaticamente    

In [None]:
print(f'Arquivo: {nome_arquivo} ({tamanho} bytes)')
print(30*'-')
print(conteudo)
print(30*'-')

## Arquivos CSV (comma separated values)

In [None]:
# Arquivos CSV são popularmente utilizados para transferir conjuntos organizados
# de dados entre aplicações diferentes, dentre as quais planilhas eletrônicas e
# bancos de dados. 

### Escrita de CSV

In [None]:
# Exemplo do uso de with na escrita de um arquivo CSV
with open('arquivos/tabela.csv', 'wt') as f:
    # gravação do cabeçalho (opcional) do arquivo CSV
    f.write('#;angulo;seno;cosseno\n')
    i = 1
    for e in range(0, 51, 5):
        a = math.pi * e / 100
        # os valores de cada registro (linha) são separados por ;
        f.write(f'{i};{a:.3f};{math.sin(a):.6f};{math.cos(a):.6f}\n')
        i += 1

In [None]:
# magic command para exibir conteúdo do arquivo gerado
%more arquivos/tabela.csv

In [None]:
# %load arquivos/tabela.csv
#;angulo;seno;cosseno
1;0.000;0.000000;1.000000
2;0.157;0.156434;0.987688
3;0.314;0.309017;0.951057
4;0.471;0.453990;0.891007
5;0.628;0.587785;0.809017
6;0.785;0.707107;0.707107
7;0.942;0.809017;0.587785
8;1.100;0.891007;0.453990
9;1.257;0.951057;0.309017
10;1.414;0.987688;0.156434
11;1.571;1.000000;0.000000


### Leitura de CSV

In [None]:
# A leitura de um arquivo CSV usa os mesmos princípios da leitura de arquivos de texto.
nome_arquivo = 'arquivos/tabela.csv'
with open(nome_arquivo, 'rt') as f:
    # leitura do arquivo
    conteudo = f.read();
# o arquivo é fechado automaticamente

# função split permite dividir conteúdo em uma lista de linhas (registros)
lista = conteudo.split();
print(lista)

In [None]:
# extração do cabeçalho e divisão em campos com split(separador)
cabecalho = lista[0].split(';')
print('Cabeçalho:\n\t', cabecalho)
# fatiamento para obtenção das linhas 1 e 2
registro = lista[1:3]
print('Registros 1 e 2:\n\t', registro)

In [None]:
# cada registro, ou seja, tanto o cabeçalho como cada linha,
# podem ser dividido em campos com split(separador)  
for r in registro:
    print('Registro:', r)
    campos = r.split(';') # separador é o ;
    for c in range(len(cabecalho)):
        print(f'\t{cabecalho[c]} : {campos[c]}') 

In [None]:
from csv import reader

In [None]:
# Lê arquivo csv como um lista de listas
with open(nome_arquivo, 'r') as file_reader:
    # Usa o file handler para criar um leitor CSV
    csv_reader = reader(file_reader, delimiter=';')
    print(csv_reader)
    # Usa o reader para obter uma lista of listas
    lista_de_registros = list(csv_reader)
# Arquivo é fechado, mantendo lista de registros
print(lista_de_registros)

In [None]:
# Laço permite processar campos individualmente
for registro in lista_de_registros:
    campos = list(registro)
    print(campos)

## Arquivos binários

In [None]:
# Um arquivo binário é uma sequência arbitrária de bytes, ou seja,
# contém um ou mais bytes que podem descrever uma imagem, um som,
# um vídeo, uma planilha eletrônica ou qualquer outro tipo de dados,
# incluindo texto. Para que possam ser tratados adequadamente, devem
# seguir uma organização específica, tal como PNG, WAV, MP4, XLS, que
# define seu formato.

In [None]:
nome_arquivo = 'arquivos/red.png'
i = 0
with open(nome_arquivo, 'rb') as f:
    byte = f.read(1)
    while byte:
        i += 1
        #
        print(f'{byte.hex().upper():2s}', end=' ')
        if i == 16:
            print()
            i = 0
        byte = f.read(1)

In [None]:
import struct
i = 0
with open(nome_arquivo, 'rb') as f:
    signature = f.read(8)
    if signature.hex() == '89504e470d0a1a0a':
        print('PNG')
        f.read(8) # descarta chunck type (IHDR)
        data = f.read(8)
        w, h = struct.unpack('>LL', data)
        print(f'width x height = {int(w)} x {int(h)}')
    else:
        print('Arquivo não contém imagem PNG.')

In [None]:
from IPython.display import Image
Image(filename=nome_arquivo) 

### FIM
### <a href="http://github.com/pjandl/opy2">Oficina Python Intermediário</a>