<img src='op2-u02.png'/>
<h2><font color='#7F0000'>OP2-07-Arquivos (Parte 2)</font></h2>

<table width='100%'>
    <tbody>
        <tr>
            <td width='33%' style='text-align: left; background-color: #DDDDDD; vertical-align: top;'>Notebook Anterior<br><a href="OP2-06-Arquivos-parte-1.ipynb">OP2-06-Arquivos-parte-1</a></td>
            <td width='34%' style='text-align: left; background-color: #DDDDDD; vertical-align: top;'>&nbsp;<br/>
            </td>
            <td width='33%'style='text-align: left; background-color: #DDDDDD; vertical-align: top;'>Próximo Notebook<br/><a href="OP2-08-Banco-de-Dados.ipynb">OP2-08-Banco-de-Dados</a></td>
        </tr>
    </tbody>
</table>

## Uso de with

<p>O comando <tt>with</tt> oferece algumas facilidades para o uso de arquivos:</p>
<ul>
    <li>fechamento automático do arquivo, mesmo na ocorrência de exceções; e</li>
    <li>agrupamento do conjunto de comandos que processam o arquivo.</li>
</ul>

In [None]:
nome_arquivo = 'arquivos/pessoas.txt'
# abertura e utilização do arquivo
with open(nome_arquivo, 'r') as f:
    # leitura do arquivo
    conteudo = f.read();
    tamanho = f.tell();
# o arquivo é fechado automaticamente

In [None]:
print(f'Arquivo: {nome_arquivo} ({tamanho} bytes)')
print(30*'-')
print(conteudo)
print(30*'-')

## Arquivos CSV (comma separated values)

<p>Arquivos CSV são popularmente utilizados para transferir conjuntos organizados de dados entre aplicações diferentes, dentre as quais planilhas eletrônicas e bancos de dados.</p>
<p>Os arquivos CSV são, de fato, arquivos de texto, onde cada linha representa um <i>registro</i> de dados. Em cada linha, os valores (que podem ser números, strings ou datas) são separados por uma vírgula (padrão), tabulação ou ponto-e-vírgula.</p>
<p>Usualmente as linhas contém a mesma quantidade de valores (<i>colunas</i>). Opcionalmente, a primeira linha de um arquivo CSV pode conter rótulos para cada <i>coluna</i>, definindo um cabeçalho.</p>

### Escrita de CSV

<p>Criar (ou gerar) um arquivo CSV é como escrever em um arquivo de texto comum, ou seja, emprega as mesmas funções para sua abertura, escrita e fechamento.</p>

In [None]:
import math
# Exemplo do uso de with na escrita de um arquivo CSV
with open('arquivos/tabela.csv', 'wt') as f:
    # gravação do cabeçalho (opcional) do arquivo CSV
    f.write('#;angulo;seno;cosseno\n')
    i = 1
    for e in range(0, 51, 5):
        a = math.pi * e / 100
        # os valores de cada registro (linha) são separados por ;
        f.write(f'{i};{a:.3f};{math.sin(a):.6f};{math.cos(a):.6f}\n')
        i += 1

In [None]:
# magic command para exibir conteúdo do arquivo gerado
%more arquivos/tabela.csv

In [None]:
# %load arquivos/tabela.csv
#;angulo;seno;cosseno
1;0.000;0.000000;1.000000
2;0.157;0.156434;0.987688
3;0.314;0.309017;0.951057
4;0.471;0.453990;0.891007
5;0.628;0.587785;0.809017
6;0.785;0.707107;0.707107
7;0.942;0.809017;0.587785
8;1.100;0.891007;0.453990
9;1.257;0.951057;0.309017
10;1.414;0.987688;0.156434
11;1.571;1.000000;0.000000


### Leitura de CSV

<p>Ler dados de um arquivo CSV é semelhante à leitura de um arquivo de texto comum, ou seja, emprega as mesmas funções para sua abertura, leitura e fechamento.</p>

In [1]:
# Leitura de arquivo CSV é como leitura de arquivo de texto.
nome_arquivo = 'arquivos/tabela.csv'
with open(nome_arquivo, 'rt') as f:
    # leitura do arquivo
    conteudo = f.read();
# o arquivo é fechado automaticamente

In [3]:
# Conteúdo do arquivo recuperado como string única
print(conteudo)

#;angulo;seno;cosseno
1;0.000;0.000000;1.000000
2;0.157;0.156434;0.987688
3;0.314;0.309017;0.951057
4;0.471;0.453990;0.891007
5;0.628;0.587785;0.809017
6;0.785;0.707107;0.707107
7;0.942;0.809017;0.587785
8;1.100;0.891007;0.453990
9;1.257;0.951057;0.309017
10;1.414;0.987688;0.156434
11;1.571;1.000000;0.000000



<p>A função <tt>split()</tt>, da classe <tt>str></tt> (que representa as strings no Python), permite dividir uma string em múltiplas partes, considerando um caractere como separador das partes (o <i>default</i> é o espaço em branco).</p>
<p>Quando a string contém quebras de linha, a função <tt>split</tt> divide, convenientemente, seu conteúdo em uma lista de linhas (tal como registros).</p>

In [4]:
# Função split divide string em uma lista de linhas (registros)
lista = conteudo.split();
print(lista)

['#;angulo;seno;cosseno', '1;0.000;0.000000;1.000000', '2;0.157;0.156434;0.987688', '3;0.314;0.309017;0.951057', '4;0.471;0.453990;0.891007', '5;0.628;0.587785;0.809017', '6;0.785;0.707107;0.707107', '7;0.942;0.809017;0.587785', '8;1.100;0.891007;0.453990', '9;1.257;0.951057;0.309017', '10;1.414;0.987688;0.156434', '11;1.571;1.000000;0.000000']


In [None]:
# extração do cabeçalho e divisão em campos com split(separador)
cabecalho = lista[0].split(';')
print('Cabeçalho:\n\t', cabecalho)

In [None]:
# fatiamento para obtenção das linhas 1 e 2
registro = lista[1:3]
print('Registros 1 e 2:\n\t', registro)

In [None]:
# cada registro, ou seja, tanto o cabeçalho como cada linha,
# podem ser dividido em campos com split(separador)  
for r in registro:
    print('Registro:', r)
    campos = r.split(';') # separador é o ;
    for c in range(len(cabecalho)):
        print(f'\t{cabecalho[c]} : {campos[c]}') 

<h3>Pacote csv</h3>
<p>O pacote <tt>csv</tt> oferece um conjunto de facilidades para leitura, tratamento e escrita de arquivos do tipo <i>comma separated values</i>.</p>

In [None]:
# Importação do pacote csv
from csv import reader

In [None]:
# Lê arquivo csv como um lista de listas
with open(nome_arquivo, 'r') as file_reader:
    # Usa o file handler para criar um leitor CSV
    csv_reader = reader(file_reader, delimiter=';')
    print(csv_reader)
    # Usa o reader para obter uma lista of listas
    lista_de_registros = list(csv_reader)
# Arquivo é fechado, mantendo lista de registros
print(lista_de_registros)

In [None]:
# Laço permite processar campos individualmente
for registro in lista_de_registros:
    campos = list(registro)
    print(campos)

## Arquivos binários

<p>Um arquivo binário é uma sequência arbitrária de bytes, ou seja, contém um ou mais bytes que podem descrever uma imagem, um som, um vídeo, uma planilha eletrônica ou qualquer outro tipo de dados, incluindo texto.</p>
<p>Para que possam ser tratados adequadamente, devem seguir uma organização particular, tal como PNG, WAV, MP4, XLS, que são padrões
que definem formatos com propósitos específicos.</p>

In [None]:
nome_arquivo = 'arquivos/red.png'
i = 0
with open(nome_arquivo, 'rb') as f:
    byte = f.read(1)
    while byte:
        i += 1
        #
        print(f'{byte.hex().upper():2s}', end=' ')
        if i == 16:
            print()
            i = 0
        byte = f.read(1)

In [None]:
import struct
i = 0
with open(nome_arquivo, 'rb') as f:
    signature = f.read(8)
    if signature.hex() == '89504e470d0a1a0a':
        print('PNG')
        f.read(8) # descarta chunck type (IHDR)
        data = f.read(8)
        w, h = struct.unpack('>LL', data)
        print(f'width x height = {int(w)} x {int(h)}')
    else:
        print('Arquivo não contém imagem PNG.')

In [None]:
from IPython.display import Image
Image(filename=nome_arquivo) 

### FIM
### <a href="http://github.com/pjandl/opy2">Oficina Python Intermediário</a>