# Início

#### Para usar o pacote ixf parse, primeiro configuramos um ambiente virtual python e sem seguida instalamos o pacote:

In [1]:
pip install db2ixf

Collecting db2ixf
  Downloading db2ixf-0.16.1-py3-none-any.whl.metadata (11 kB)
Collecting ebcdic (from db2ixf)
  Downloading ebcdic-1.1.1-py2.py3-none-any.whl.metadata (8.9 kB)
Collecting pyarrow (from db2ixf)
  Downloading pyarrow-15.0.2-cp311-cp311-win_amd64.whl.metadata (3.1 kB)
Collecting deltalake (from db2ixf)
  Downloading deltalake-0.16.1-cp38-abi3-win_amd64.whl.metadata (5.1 kB)
Collecting chardet (from db2ixf)
  Downloading chardet-5.2.0-py3-none-any.whl.metadata (3.4 kB)
Collecting typer[all] (from db2ixf)
  Downloading typer-0.9.0-py3-none-any.whl.metadata (14 kB)
Collecting pyarrow-hotfix (from deltalake->db2ixf)
  Downloading pyarrow_hotfix-0.6-py3-none-any.whl.metadata (3.6 kB)
Collecting numpy<2,>=1.16.6 (from pyarrow->db2ixf)
  Downloading numpy-1.26.4-cp311-cp311-win_amd64.whl.metadata (61 kB)
     ---------------------------------------- 0.0/61.0 kB ? eta -:--:--
     ------ --------------------------------- 10.2/61.0 kB ? eta -:--:--
     ------------------- ------

#### Podemos analisar um arquivo .ixf fornecendo um objeto semelhante a um arquivo ou um caminho para o arquivo.

In [None]:
#coding=utf-8
from pathlib import Path
from db2ixf import IXFParser

path = Path('path/to/IXF/file.arquivo.ixf')
with open(path, mode='rb') as f:
    parser = IXFParser(f)
    rows = parser.get_row()
    for row in rows:
        print(row)

with open(path, mode='rb') as f:
    parser = IXFParser(f)
    rows = parser.get_all_rows() # carga na memória
    for row in rows:
        print(row)

#### Acima inicializamos o IXFParser com um objeto semelhante a um arquivo f e o método get_row é usado para recuperar as linhas analisadas como uma lista de dicionários. 

#### get_row é um gerador python que ajuda quando lidamos com arquivos grandes. get_all_rows carregará todas as linhas na memória como uma lista python.

### Converter para JSON

In [None]:
# coding=utf-8
from pathlib import Path
from db2ixf.ixf import IXFParser

path = Path('Path/to/IXF/FILE/arquivo.ixf')
with open(path, mode='rb') as f:
    parser = IXFParser(f)
    output_path = Path('Path/To/Output/arquivoSaida.json')
    with open(output_path, mode='w', encoding='utf-8') as output_file:
        parser.to_json(output_file)

### Converter para CSV

In [None]:
# coding=utf-8
import pathlib
from db2ixf.ixf import IXFParser

path = pathlib.Path('Path/to/IXF/FILE/arquivo.ixf')
with open(path, mode='rb') as f:
    parser = IXFParser(f)
    output_path = pathlib.Path('Path/To/Output/arquivoSaida.csv')
    with open(output_path, mode='w', encoding='utf-8') as output_file:
        parser.to_csv(output_file, sep='#')

### Converter para PARQUET

In [None]:
# coding=utf-8
from pathlib import Path
from db2ixf.ixf import IXFParser

path = Path('Path/to/IXF/FILE/arquivo.ixf')
with open(path, mode='rb') as f:
    parser = IXFParser(f)
    output_path = Path('Path/To/Output/arquivoSaida.parquet')
    with open(output_path, mode='wb') as output_file:
        parser.to_parquet(output_file)

#### O pacote IXFParser oferece flexibilidade de opções de entrada e saída, permitindo analisar e processar facilmente arquivos .ixf.

### Atenção:

#### Arquivo ixf completamente corrompido: geralmente é um problema de extração.
#### Arquivo ixf parcialmente corrompido, contém algumas linhas corrompidas que o analisador falha.
#### O analisador calcula a taxa de linhas corrompidas e depois a compara com uma taxa aceita de linhas corrompidas que definimos na variável de ambiente DB2IXF_ACCEPTED_CORRUPTION_RATE(int = 1)%.
#### Se a taxa de linhas corrompidas for maior que a taxa aceita, o analisador gera uma exceção.