# EXERCÍCIO

Utilizando o arquivo **anv.csv** como base de dados, faça a leitura e processamento do arquivo **csv** e crie os arquivos conforme descritos abaixo. Além disso, crie as funções conforme descrito abaixo.

Utilize os códigos prontos do exemplo dado na **Aula 4**. Refatore o que for necessário para satisfazer as necessidades técnicas para que as funções funcionem corretamente.

Deve ser criado um módulo chamado `cds_read_file.py`, que irá manter a função `read_file()`; Um módulo chamado `cds_write_file.py`, que irá manter as funções `save_json()` e `save_csv()`; Um módulo chamado `cds_helpers.py`, que irá manter a função `select_damage_level()`. Os módulos gerados devem estar dentro de um diretório chamado `exemplo\helper_pkg`.

Caso você ache necessário, criei mais funções além das descritas acima. A única regra é que a função criada esteja dentro de um dos módulos.

Utilize a função `try .. except` para contonar possíveis erros na criação dos arquivos `csv` e `json`, tornando assim a sua aplicação mais robusta a erros.

Através do Jupyter, utilize os Módulos produzidos para ler e gerar os arquivos solicitados.

**Extra:** [How to Create Python Packages](https://towardsdatascience.com/how-to-package-your-python-code-df5a7739ab2e), [Making a Python Package](https://python-packaging-tutorial.readthedocs.io/en/latest/setup_py.html) e [How to Create and Upload Your First Python Package to PyPI](https://www.freecodecamp.org/news/how-to-create-and-upload-your-first-python-package-to-pypi/)

## Arquivo 1

O primeiro arquivo deve ter seu conteúdo em formato JSON, com o nome `statistics.json`, e deve possuir as as estatísticas: 
* fase de operação
* número de total de ocorrências
* percentual de quanto essa fase representa dentro de todos os dados


Exemplo de como deve estar o arquivo:
```json
[
  {
    "fase_operacao": "APROXIMAÇÃO FINAL", 
    "ocorrencias": 234,
    "percentual": "4,51%"
  },
  {
    "fase_operacao": "INDETERMINADA", 
    "ocorrencias": 180,
    "percentual": "2,43%"
  },
  {
    "fase_operacao": "MANOBRA", 
    "ocorrencias": 80,
    "percentual": "0,95%"
  }
]
```

## Arquivo 2

O segundo arquivo deve ter o formato `csv` e o nome `levels.csv` contendo as seguintes informações:
* operation -> aeronave_operador_categoria
* type -> aeronave_tipo_veiculo
* manufacturer -> aeronave_fabricante
* engine_type aeronave_motor_tipo
* engines -> aeronave_motor_quantidade
* year_manufacturing -> aeronave_ano_fabricacao
* seating -> aeronave_assentos
* fatalities -> total_fatalidades

Essas informações deve ser `filtradas conforme o dano da aeronave`. O dano deve ser selecionado pelo usuário utilizando a função `select_damage_level()`.

## Funções

### Função `read_file()`:

1. A função deve ser responsável por fazer a leitura de um arquivo e devolver uma lista com os dados em estrutura de dicionário; (Observe exemplo abaixo)
2. A função deve utilizar o módulo `csv` para a leitura do arquivo;
3. A função deve ter uma assinatura que permita o usuário dela possa informar qual o `encoding` será utilizado, qual o `delimiter` será utilizado e qual o `quotechar` será utilizado. Além do caminho do arquivo que será lido;
4. Os valores padrão para os parâmetros são:
    - `delimiter = ','`
    - `quotechar=''`
    - `encoding = 'utf-8'`
5. Essa função deve estar escrita em um módulo chamado `cds_read_file.py`;


```python
# Exemplo do Retorno da Função read_file()
[
    {'codigo_ocorrencia': '201106142171203', ..., 'aeronave_dia_extracao': '2018-07-09'},
    {'codigo_ocorrencia': '200804256669287', ..., 'aeronave_dia_extracao': '2018-07-09'},
    ...
    {'codigo_ocorrencia': '200811166771745', ..., 'aeronave_dia_extracao': '2018-07-09'}
]
```

### Função `save_json()`:

1. A função deve ser responsável por escrever o conteúdo e salvar o arquivo no local informado;
2. A função deve retornar um `print()` em tela com o texto `Arquivo Criado com Sucesso` caso a escrita tenha sido feita com sucesso. Caso tenha havido alguma falha na escrita do arquivo, deve retornar um `print()` em tela com o texto `Erro ao criar o arquivo: `, e junto a essa frase, exibir os erros ocorridos;
3. O conteúdo de saída do arquivo deve seguir as diretrizes do `Arquivo 1` na seção acima;
4. A função deve ter uma assinatura que permita o usuário informar qual o `nome` do arquivo que será gerado, como também o `caminho de diretórios` em que o arquivo será salvo. Além dos dados que serão utilizados para a criação do arquivo.
5. Os valores padrão para os parâmetros são:
    - `filename = 'statistics'`
    - `path = 'json_out'`
6. Essa função deve estrar escrita no módulo chamdo `cds_write_files.py`;
7. A função deverá utilizar o pacote `json` do Python para fazer a escrita do arquivo;
8. A função deve ser capaz de criar o `diretório` caso ele não exista; (**OPCIONAL**)

### Função `save_csv()`:

1. A função deve ser responsável por escrever o conteúdo e salvar o arquivo no local informado;
2. A função deve retornar um `print()` em tela com o texto `Arquivo Criado com Sucesso` caso a escrita tenha sido feita com sucesso. Caso tenha havido alguma falha na escrita do arquivo, deve retornar um `print()` em tela com o texto `Erro ao criar o arquivo: `, e junto a essa frase, exibir os erros ocorridos;
3. O conteúdo de saída do arquivo deve seguir as diretrizes do `Arquivo 2` na seção acima;
4. A função deve ter uma assinatura que permita o usuário informar qual a opção (`op`) selecionada, qual o `nome` do arquivo que será gerado, como também o `caminho de diretórios` em que o arquivo será salvo. Além dos dados que serão utilizados para a criação do arquivo.
5. Os valores padrão para os parâmetros são:
    - `op = 0`
    - `filename = 'levels'`
    - `path = 'csv_out'`
6. Essa função deve estrar escrita no módulo chamdo `cds_write_files.py`;
7. O cabeçalho do arquivo `csv` que será gerado deve ser fixo e deve estar dentro da função;
8. A função deverá utilizar o módulo `csv` para fazer a escrita do arquivo;
9. A função deve ser capaz de criar o `diretório` caso ele não exista; (**OPCIONAL**)

### Função `select_damage_level()`:

1. A função deve ser capaz ler os dados gerados pela função `read_file()` para gerar todas as categorias de danos nas aeronaves;
2. O conteúdo de retorno deve ser a categoria escolhida (texto);
3. A função deve imprimir para o usuário o texto conforme exemplo abaixo;
4. A função deve ser capaz de escrever as categorias de forma dinâmica. Ou seja, caso seja inserido um novo dado com uma nova categoria, a função deve ser capaz de tratar isso;
5. Essa função deve estrar escrita no módulo chamdo `helpers.py`;

```python
'Selecione a categoria de dano desejada através dos seus respectivos códigos.'
'0 = SUBSTANCIAL; 1 = NENHUM; 2 = LEVE; 3 = INDETERMINADO; 4 = DESTRUÍDA; '
```

## Resolução

A saída dos módulos deve seguir o seguinte fluxo:

In [1]:
# Imports dos Módulos com apelidos (aliases)
from exemplo.helper_pkg.cds_read_file import read_file as rf
from exemplo.helper_pkg.cds_write_file import save_json as sj
from exemplo.helper_pkg.cds_write_file import save_csv as sc

In [27]:
# Definição do caminho do arquivo de entrada
file_path = 'csv/anv.csv'

In [30]:
# Leitura e pré-processamento dos dados
records = rf(file_path, delimiter = '~')
# records[0]


In [31]:
# Criação do arquivo JSON
sj(records)


Arquivo Criado com sucesso


In [32]:
# Criação do arquivo CSV
sc(records)

Selecione a categoria de dano desejada através dos seus respectivos códigos.
0 = SUBSTANCIAL; 1 = NENHUM; 2 = LEVE; 3 = INDETERMINADO; 4 = DESTRUÍDA; 
4
Arquivo Criado com sucesso


### Módulo `cds_read_file`

In [19]:
import csv
# Resolução
# Função que irá processar o Arquivo

def read_file(file_path, delimiter = ',', quotechar='"', encoding = 'utf-8'):
    
    # Estruturas que serão utilizadas para produzir as respostas
    retorno = []
    
    # Abre e processa o arquivo
    with open(file_path, 'r', encoding=encoding) as f:
        reader = csv.DictReader(f, delimiter=delimiter, quotechar=quotechar)
        
        # Itera pelas linhas do arquivo para 
        for row in reader:
            retorno.append(row)
            
            
    return retorno

In [20]:
file_path = 'csv/anv.csv'

In [24]:
records = read_file(file_path, delimiter='~')

### Módulo `cds_write_file`

In [25]:
# Resolução
import csv
import json
import sys
import os

# Função que irá criar o arquivo JSON

filename = 'statistics'
path = 'json_out'
def save_json(records, file_name = 'statistics', path = 'json_out'):
    
    # Lista que será escrita dentro do arquivo JSON
    array_of_incidents = []
    
    # Pega a quantidade total de dados
    count = len(records)
    
    # Dicionário criado para conter a estrutura
    # desejada para o arquivo JSON
    map_of_incidents = {}

    # Itera sobre os registros
    for record in records:

        # Recupera o conteúdo da Fase de Operação
        key = record['aeronave_fase_operacao']

        # Verifica se a fase de operação separada
        # ja está inserida dentro do conteúdo do 
        # arquivo. Se ainda não estiver, insere o 
        # registro com a contagem iniciando em 1, 
        # se já estiver, aumenta a contagem em 1 
        if key in map_of_incidents:
            map_of_incidents[key] += 1 # Se existir, incrementa mais mais um acidente
        else:
            map_of_incidents[key] = 1
    
    # Itera sobre o dicionário com os dados
    for key, value in map_of_incidents.items():
        # Cria o conteúdo que será escrito no arquivo
        array_of_incidents.append(
            {
                "fase_operacao": key,
                "ocorrencias": value,
                "percentual":  '{:.2%}'.format(value / count)
            }
        )
    
    # Cria o arquivo com os dados ajustados
    try:
        # Cria o arquivo no caminho/diretório escolhido
        # A biblioteca 'os' serve para conseguirmos criar
        # tanto o arquivo quanto o diretório, caso ambos não
        # existam
        # Essa linha faz com que não ocorram erros na criação do arquivo
        # os.makedirs(os.path.dirname(f'{path}/{file_name}.json'), exist_ok=True)
    
        with open(f'{path}/{file_name}.json', 'w', encoding='utf-8') as outfile:
            json.dump(array_of_incidents, outfile, ensure_ascii=False, indent=4)
        
        print('Arquivo Criado com sucesso')
    except:
        print(F'ERRO AO CRIAR O ARQUIVO: {sys.exc_info()[0]} - {sys.exc_info()[1]}')


# Função que irá criar o arquivo CSV
def save_csv(records, op = 0, file_name = 'levels', path='csv_out'):
    
    # Lista que irá guardar os dados
    list_of_incidents = []
    
    damage_level = choose_damage_level(records)
    
    # Cabeçalho do arquivo CSV
    header = [
        'operation',
        'type',
        'manufacturer',
        'engine_type',
        'engines',
        'year_manufacturing',
        'seating',
        'fatalities'
    ]
    
    # Itera sobre os registros
    for row in records:
        
        # Verifica se 
        if row['aeronave_nivel_dano'] == damage_level:
            # Adiciona as linhas selecionadas
            list_of_incidents.append(
                [
                    row['aeronave_operador_categoria'],
                    row['aeronave_tipo_veiculo'],
                    row['aeronave_fabricante'],
                    row['aeronave_motor_tipo'],
                    row['aeronave_motor_quantidade'],
                    row['aeronave_ano_fabricacao'],
                    row['aeronave_assentos'],
                    row['total_fatalidades']
                ]
            )

    
    # Cria o arquivo com os dados ajustados
    try:
        os.makedirs(os.path.dirname(f'{path}/{file_name}.csv'), exist_ok=True)
        
        with open(f'{path}/{file_name}.csv', 'w', encoding='utf8', newline='') as outfile:
            w = csv.writer(outfile)
            w.writerow(header)
            w.writerows(list_of_incidents)
        
        print('Arquivo Criado com sucesso')
    except:
        print(F'ERRO AO CRIAR O ARQUIVO: {sys.exc_info()[0]} - {sys.exc_info()[1]}')    

### Módulo `cds_helpers`

In [16]:
# Resolução
# Função responsável por criar a lista
# Com todos os níveis de dano
def select_damage_level(records):
    
    # Variável responsável por guardar os níveis de
    # danos das aeronaves
    uniques = {}

    # Variável responsável por manter o valor da opção 
    # que será utilizada pelo usuário para selecionar
    # o nível de dano da aeronave
    option = 0

    # Percorre a lista com os dados para criar o dicionario
    # que conterá as opções:
    # {'SUBSTANCIAL': 0, ..., 'DESTRUÍDA': 4}
    for record in records:
        if record['aeronave_nivel_dano'] not in uniques.keys():
            uniques[record['aeronave_nivel_dano']] = option
            option += 1
    
    return uniques


# Função responsável por exibir as opções possíveis que
# o usuário poderá selecionar
def choose_damage_level(records):
    
    # Cria o dicionário com todas as opções de dano
    damage_levels = select_damage_level(records)
    
    # Inicia a string que será exibida ao usuário
    string = f'Selecione a categoria de dano desejada através dos seus respectivos códigos.\n'
            
    # Percorre o dicionário com os valores do 
    # dicionário e cria a string que será
    # exibida ao usuário
    for key, value in damage_levels.items():
        string += f'{value} = {key}; '

    # Finaliza a string
    string += f'\n'
    
    # Recupera o dano escolhido pelo usuário    
    op = int(input(string))
    
    # Devolve a string com o Dano selecionado
    return list(damage_levels.keys()) [ list(damage_levels.values()).index(op) ]