# Lendo arquivos binários em Python

## Método 1: Python Puro

_Exemplo_:
```python
    with open(file='foo', mode='rb') as f:
        
        # Lendo os 4 primeiros bytes do arquivo binario 'foo'
        x = f.read(4)
        
        # Convertendo o array de bytes 'x' em um inteiro sem sinal, formato Big Endian
        x = int.from_bytes(bytes=x, order='big', signed=False)
```
***

Uma breve explicação dos parâmatros dos métodos utilizados acima é apresentada a seguir.

***
    f = open(file, mode)
        argumentos:
           - file: Path do arquivo a ser lido
           - mode: Como o stream do arquivo será aberto 
                   Ex: 'rb' significa: 'read' + 'binary'
        retorna: stream de arquivo  
***    
    a = int.from_bytes(bytes, byteorder, signed)
        argumentos:
           - bytes: Array de bytes
           - byteorder: Ordem como o inteiro será lido ('litte' ou 'big')
           - signed: Se o array de bytes passado está em complemento de 2 ou não.
        retorna: inteiro  
***


Para um entendimento melhor sobre esse métodos, acesse a documentação deles no API do Python ([1], [2]).


[1]: https://docs.python.org/3/tutorial/inputoutput.html
[2]: https://docs.python.org/3/library/stdtypes.html

In [1]:
with open(file='train-images', mode='rb') as f:
    
    # Lendo os primeiros 4 bytes
    magic_number = f.read(4) 
    print(f' >> Observe que o que foi lido é um array de bytes:\n')
    print(f'    magic_number:       {magic_number}')
    print(f'    len(magic_number):  {len(magic_number)}')
    print(f'    type(magic_number): {type(magic_number)}\n\n')
    
    # Convertendo o array lido em formato inteiro sem sinal, em Big Endian
    magic_number = int.from_bytes(magic_number, byteorder='big', signed='False')
    print(f' >> Observe que "magic_num" agora é um inteiro:\n')
    print(f'    magic_number:       {magic_number}')
    print(f'    type(magic_number): {type(magic_number)}\n\n')

    # Lendo os próximos 4 bytes, e convertendo em inteiro
    num_imgs = f.read(4)
    num_imgs = int.from_bytes(num_imgs, byteorder='big', signed=False)
    print(f' >> num_images: {num_imgs}')

 >> Observe que o que foi lido é um array de bytes:

    magic_number:       b'\x00\x00\x08\x03'
    len(magic_number):  4
    type(magic_number): <class 'bytes'>


 >> Observe que "magic_num" agora é um inteiro:

    magic_number:       2051
    type(magic_number): <class 'int'>


 >> num_images: 60000


## Método 2: Numpy

_Exemplo_:
```python
    import numpy as np
    
    # Carrega 1 elemento tipo inteiro com sinal de 32 bits (int32) em little endian do arquivo binario foo
    x = np.fromfile(file='foo', dtype='<i', count=1, offset=0)
    
    # Carrega 10 elementos tipo inteiro sem sinal de 8 bits (uint8) em big endian do arquivo binario foo, saltando 100 bytes no arquivo
    y = np.fromfile(file='foo', dtype='>B', count=10, offset=100)
```
***

Ordem dos bytes e formatação:

| Simbolo   | Endianness |
| :-------: | :--------: | 
| '>'       | big        |
| '<'       | little     |
| '='       | nativo do SO |


| Simbolo   | Tipo | Bytes |
| :-------: | :--------: | :---: |
| 'b'       | signed char (int8) | 1 |
| 'B'       | unsigned char (uint8) | 1 |
| 'i'       | signed int (int32) | 4 |
| 'I'       | unsigned int (uint32) | 4 |
| 'f'       | float | 4 |
| 'd'       | double (float64) | 8 |

*** 


In [2]:
import numpy as np

# Lendo os primeiros 4 bytes
magic_number = np.fromfile(file='train-images', dtype='>I', count=1, offset=0)
print(f'magic_number:       {magic_number}')
print(f'type(magic_number): {type(magic_number)}\n\n')

# Lendo os 4 bytes seguintes
num_imgs = np.fromfile(file='train-images', dtype='>I', count=1, offset=4)
print(f'num_imgs:       {num_imgs}')
print(f'type(num_imgs): {type(num_imgs)}\n\n')

magic_number:       [2051]
type(magic_number): <class 'numpy.ndarray'>


num_imgs:       [60000]
type(num_imgs): <class 'numpy.ndarray'>


