# Exemplo 1

## Problema

Considere um arquivo de entrada no formato CSV (comma separated values) com informações relativas a acidentes na aviação civil brasileira nos últimos 10 anos (arquivo anv.csv)

As informações estão separadas pelo caracter separador ~ e entre “” (aspas) conforme o exemplo abaixo:

```javascript
"201106142171203"~"PPGXE"~"AEROCLUBE"~"AVIÃO"~"NEIVA INDUSTRIA AERONAUTICA"~"56- C"~"PAUL"~"PISTÃO"~"MONOMOTOR"~"660"~"LEVE"~"2"~"1962"~"BRASIL"~"BRASIL"~"PRI"~" INSTRUÇÃO"~"SDPW"~"SDPW"~"INDETERMINADA"~"UNKNOWN"~"VOO DE INSTRUÇÃO"~"SUBSTANCIAL"~"0"~"2018-07-09“

"201707111402595"~"PPNCG"~"OPERADOR PARTICULAR"~"AVIÃO"~"PIPER AIRCRAFT"~"PA-46- 350P"~"PA46"~"TURBOÉLICE"~"MONOMOTOR"~"1950"~"LEVE"~"6"~"1990"~"NULL"~"BRASIL"~" TPP"~"PARTICULAR"~"SBBR"~"SBGR"~"POUSO"~"LANDING"~"VOO PRIVADO"~"NENHUM"~"0"~"2018-07-09"'''
```

O arquivo é composto das seguintes colunas:
1. codigo_ocorrencia
2. aeronave_matricula
3. aeronave_operador_categoria 
4. aeronave_tipo_veiculo
5. aeronave_fabricante
6. aeronave_modelo
7. aeronave_tipo_icao
8. aeronave_motor_tipo
9. aeronave_motor_quantidade 
10. aeronave_pmd 
11. aeronave_pmd_categoria 
12. aeronave_assentos 
13. aeronave_ano_fabricacao
14. aeronave_pais_fabricante 
15. aeronave_pais_registro 
16. aeronave_registro_categoria 
17. aeronave_registro_segmento 
18. aeronave_voo_origem 
19. aeronave_voo_destino 
20. aeronave_fase_operacao 
21. aeronave_fase_operacao_icao 
22. aeronave_tipo_operacao 
23. aeronave_nivel_dano 
24. total_fatalidades
25. aeronave_dia_extracao

Crie uma função que efetue a leitura do arquivo, sem a utilização de bibliotecas externas, e processe o arquivo produzindo dois novos arquivos.

**OBS:** Efetuar apenas uma leitura do arquivo de entrada

### Arquivo 1

O primeiro arquivo deve ter seu conteúdo em formato JSON, com o nome statistics.json, e deve possuir as as estatísticas: 
* fase de operação
* número de total de ocorrências
* percentual de quanto essa fase representa dentro de todos os dados


Exemplo de como deve estar o arquivo:
```json
[
  {
    "fase_operacao": "APROXIMAÇÃO FINAL", 
    "ocorrencias": 234,
    "percentual": "4,51%"
  },
  {
    "fase_operacao": "INDETERMINADA", 
    "ocorrencias": 180,
    "percentual": "2,43%"
  },
  {
    "fase_operacao": "MANOBRA", 
    "ocorrencias": 80,
    "percentual": "0,95%"
  }
]
```

### Arquivo 2

Crie um arquivo de saida (formato CSV) com nome ***levels.csv*** contendo as seguintes informações:
* operation -> aeronave_operador_categoria
* type -> aeronave_tipo_veiculo
* manufacturer -> aeronave_fabricante
* engine_type aeronave_motor_tipo
* engines -> aeronave_motor_quantidade
* year_manufacturing -> aeronave_ano_fabricacao
* seating -> aeronave_assentos
* fatalities -> total_fatalidades

Considerando apenas acidentes cujo nível de dano da aeronave tenha sido LEVE ou NENHUM (coluna aeronave_nivel_dano) e que o número de fatalidades (total_fatalidades) tenha sido superior à 0 (zero)

## Análise

Vamos receber um arquivo de entrada (.csv), nesse arquivo os dados estão separados por ~ e o conteúdo está entre aspas

O arquivo possuí 25 colunas

Executar somente uma leitura do arquivo

Criar dois relatórios de saída:
1. Um arquivo .json, que conterá fase de operação, número de total de ocorrências dessa fase de operação e percentual de quanto essa fase representa dentro do conjunto de dados
2. Um arquivo .csv que deve conter as seguintes informações, para acidentes com fatalidades e com nenhum dano ou dano leve:
    * operation -> aeronave_operador_categoria
    * type -> aeronave_tipo_veiculo
    * manufacturer -> aeronave_fabricante
    * engine_type aeronave_motor_tipo
    * engines -> aeronave_motor_quantidade
    * year_manufacturing -> aeronave_ano_fabricacao
    * seating -> aeronave_assentos
    * fatalities -> total_fatalidades

## Implicações / Proposições / Afirmações

* Receberemos um arquivo csv, que o delimitador está com o símbolo de til ~, e está entre aspas
* O arquivo possuí 10 anos de informações a respeito dos acidentes de aereo no Brasil
* O arquivo tem 25 colunas
* Devemos criar uma função para a leitura do arquivo
* Devemos ler o arquivo uma única vez
* Devemos criar dois arquivos de relatório:
    - 1 arquivo .json, com o nome de statistics.json
    - 1 arquivo .csv, com o nome levels.csv
* O arquivo statistics.json deve conter as estatísticas das fases de operação, a contagem da fase de operação e o quanto essa fase representa no conjunto de dados
* O arquivo level.csv deve conter as seguintes informações:
    - operation -> aeronave_operador_categoria
    - type -> aeronave_tipo_veiculo
    - manufacturer -> aeronave_fabricante
    - engine_type aeronave_motor_tipo
    - engines -> aeronave_motor_quantidade
    - year_manufacturing -> aeronave_ano_fabricacao
    - seating -> aeronave_assentos
    - fatalities -> total_fatalidades
* O arquivo levels.csv deve ser preenchido somente com os dados dos acidentes onde o dano tenha sido leve ou nenhum e que tenha fatalidades

## Resolução e Resposta

In [16]:
# Resolução aqui
import csv


def read_file(filepath):
    
    json_file = {}
    
    contador = 0
    
    
    with open(filepath, 'r', encoding='UTF-8') as file:
        reader = csv.reader(file, delimiter='~')

        next(reader)

        for line in reader:

            value = line[19]

            contador += 1

            if value in json_file:
                json_file[value] += 1
            else:
                json_file[value] = 1
                
    

    print(json_file)

{'INDETERMINADA': 71, 'MANOBRA': 161, 'APROXIMAÇÃO FINAL': 234, 'CORRIDA APÓS POUSO': 602, 'CRUZEIRO': 660, 'DECOLAGEM': 795, 'ARREMETIDA NO SOLO': 42, 'TÁXI': 439, 'DESCIDA': 192, 'OUTRA FASE': 101, 'SUBIDA': 359, 'POUSO': 914, 'CIRCUITO DE TRÁFEGO': 125, 'PAIRADO': 20, 'ESPECIALIZADA': 173, 'PARTIDA DO MOTOR': 30, 'RETA FINAL': 16, 'ARREMETIDA NO AR': 25, 'OPERAÇÃO DE SOLO': 46, 'ESTACIONAMENTO': 72, 'NAVEGAÇÃO A BAIXA ALTURA': 60, 'CHEQUE DE MOTOR OU ROTOR': 13, 'SAÍDA IFR': 7, 'DECOLAGEM VERTICAL': 8, 'PUSHBACK': 6, 'ESPERA': 4, 'PROCEDIMENTO DE APROXIMAÇÃO IFR': 7, 'DESCIDA DESCONTROLADA': 2, 'EMPREGO MILITAR': 1, 'DESCIDA DE EMERGÊNCIA': 2, '***': 1}
