# 1) Exportar arquivo XLSX (formato proprietário do Excel) para CSV
## Como?
![Exportação](https://cdn.ablebits.com/_img-blog/excel-csv/save-excel-csv.png)

## CSV?

CSV = "Comma-separated values" -> "Valores separados por vírgula"
![O que é um arquivo CSV?](https://peltiertech.com/images/2017-02/csv-data-1.png)

# 2) Let's code!

## 2.1) Instalar módulos

### O que são módulos?
Módulos são como "caixas de ferramentas". Dentro de cada módulo há vários métodos úteis para nosso programa.

### Como instalar?

In [1]:
!pip3 install xlsxwriter pandas

Collecting xlsxwriter
  Downloading https://files.pythonhosted.org/packages/82/50/780122e4790328c195475d6e49a07fb69593508355dfee98bfb22686d9e8/XlsxWriter-1.2.1-py2.py3-none-any.whl (140kB)
[K    100% |████████████████████████████████| 143kB 781kB/s ta 0:00:01
[?25hCollecting pandas
  Downloading https://files.pythonhosted.org/packages/73/9b/52e228545d14f14bb2a1622e225f38463c8726645165e1cb7dde95bfe6d4/pandas-0.25.1-cp36-cp36m-manylinux1_x86_64.whl (10.5MB)
[K    100% |████████████████████████████████| 10.5MB 121kB/s ta 0:00:01
[?25hCollecting numpy>=1.13.3 (from pandas)
  Downloading https://files.pythonhosted.org/packages/e5/e6/c3fdc53aed9fa19d6ff3abf97dfad768ae3afce1b7431f7500000816bda5/numpy-1.17.2-cp36-cp36m-manylinux1_x86_64.whl (20.4MB)
[K    100% |████████████████████████████████| 20.4MB 62kB/s eta 0:00:011   48% |███████████████▍                | 9.8MB 1.3MB/s eta 0:00:09    72% |███████████████████████▎        | 14.8MB 1.5MB/s eta 0:00:04
[?25hCollecting python-dateutil>=

## 2.2) Importar os módulos instalados

In [5]:
import pandas as pd
import xlsxwriter as excel_writer
from classificacao import sindromes_diagnosticos

## 2.3) Ler os dados

In [7]:
with open("arquivo_fonte.csv", "r") as arquivo:
    dados = pd.read_csv(arquivo)
dados

Unnamed: 0,Registro,Nome,Sexo,Idade,Diagnóstico Prévio,Conduta
0,0,PACIENTE 0,F,35,"PRÉ-EXCITAÇÃO VENTRICULAR,PROLAPSO MITRAL,ALZH...",AME
1,1,PACIENTE 1,M,37,"DPOC,PRÉ-EXCITAÇÃO VENTRICULAR,TROCA DE VALVA ...",AME
2,2,PACIENTE 2,F,51,"AVALIAÇÃO CARDIOLÓGICA,OUTRAS DOENÇAS",AME
3,3,PACIENTE 3,F,21,"CIA,BAV PRIMEIRO GRAU,FIBROMIALGIA,IAM",AME/EXAMES
4,4,PACIENTE 4,F,64,"PROLAPSO MITRAL,EPILEPSIA,DEPRESSÃO",AME/EXAMES
...,...,...,...,...,...,...
595,595,PACIENTE 595,M,30,"DOENÇA DE CHAGAS,DIABETES MELLITUS,LES,CIRROSE",AME
596,596,PACIENTE 596,M,55,"VALVOPATIA,FIBROMIALGIA,DOENÇA RENAL CRÔNICA,E...",UBS
597,597,PACIENTE 597,F,27,"CIA,CARDIOPATIA INFÂNCIA,INSUFICIÊNCIA CARDÍAC...",AME
598,598,PACIENTE 598,M,50,"MIGRÂNEA,SÍNDROME DE WOLF PARKISON WHITE",AME


## 2.4) Analisar os dados

In [15]:
todas_estruturas_analise = []

for pair in sindromes_diagnosticos:
    for diagnostico in pair["DIAGNOSTICOS"]:
        novo = {
            "SINDROME": pair["SINDROME"],
            "DIAGNOSTICO": diagnostico,
            "QTDE DIAGNOSTICO": 0,
            "UBS": 0,
            "AME": 0,
            "AME/EXAMES": 0
        }
        
        todas_estruturas_analise.append(novo)

data_analise = pd.DataFrame(todas_estruturas_analise)


Unnamed: 0,SINDROME,DIAGNOSTICO,QTDE DIAGNOSTICO,UBS,AME,AME/EXAMES
0,ARRITMIAS CARDÍACAS,MARCAPASSO,0,0,0,0
1,ARRITMIAS CARDÍACAS,BRE,0,0,0,0
2,ARRITMIAS CARDÍACAS,BAV PRIMEIRO GRAU,0,0,0,0
3,ARRITMIAS CARDÍACAS,ARRITMIA,0,0,0,0
4,ARRITMIAS CARDÍACAS,TAQUICARDIA,0,0,0,0
5,ARRITMIAS CARDÍACAS,EXTRASSÍSTOLE VENTRICULAR,0,0,0,0
6,ARRITMIAS CARDÍACAS,PRÉ-EXCITAÇÃO VENTRICULAR,0,0,0,0
7,ARRITMIAS CARDÍACAS,FA,0,0,0,0
8,ARRITMIAS CARDÍACAS,SÍNDROME DE WOLF PARKISON WHITE,0,0,0,0
9,AVALIAÇÃO CARDIOLÓGICA,AVALIAÇÃO CARDIOLÓGICA,0,0,0,0


In [17]:
for identificador, linha in data_analise.iterrows():
    diagnostico_da_linha = linha["DIAGNOSTICO"]
    
    match = dados[dados["Diagnóstico Prévio"].str.contains(diagnostico_da_linha)]
    
    data_analise.at[identificador, "QTDE DIAGNOSTICO"] = match.shape[0]
    data_analise.at[identificador, "UBS"] = match[match["Conduta"] == "UBS"].shape[0]
    data_analise.at[identificador, "AME"] = match[match["Conduta"] == "AME"].shape[0]
    data_analise.at[identificador, "AME/EXAMES"] = match[match["Conduta"] == "AME/EXAME"].shape[0]

## 2.5) Escrever os resultados da análise em uma planilha do Excel
![Planilha de Excel](https://www.excel-easy.com/basics/images/worksheets/sheet1.png)

In [18]:
planilha = excel_writer.Workbook("Analise.xlsx")

for sindrome in data_analise["SINDROME"].unique().tolist():
    data_sindrome = data_analise[data_analise["SINDROME"] == sindrome]
    total_sindrome = data_sindrome["QTDE DIAGNOSTICO"].sum()
    
    sheet = planilha.add_worksheet(sindrome)
    
    sheet.merge_range("A1:E1", sindrome)
    
    total_ubs = data_sindrome["UBS"].sum()
    sheet.write("B2", "UBS")
    sheet.write("B3", total_ubs)
    sheet.write("B4", float(total_ubs)/float(total_sindrome))
    
    total_ame = data_sindrome["AME"].sum()
    sheet.write("C2", "AME")
    sheet.write("C3", total_ame)
    sheet.write("C4", float(total_ame)/float(total_sindrome))
    
    total_exames = data_sindrome["AME/EXAMES"].sum()
    sheet.write("D2", "UBS")
    sheet.write("D3", total_exames)
    sheet.write("D4", float(total_exames)/float(total_sindrome))
    
    linha_ref = 5
    for diagnostico in data_sindrome["DIAGNOSTICO"].unique().tolist():
        data_diagnostico = data_sindrome[data_sindrome["DIAGNOSTICO"] == diagnostico]
        
        sheet.write("A" + str(linha_ref), diagnostico)
        sheet.write("B" + str(linha_ref), data_diagnostico["UBS"])
        sheet.write("C" + str(linha_ref), data_diagnostico["AME"])
        sheet.write("D" + str(linha_ref), data_diagnostico["AME/EXAMES"])
        
        total_diagnostico = data_diagnostico["UBS"] + data_diagnostico["AME"] + data_diagnostico["AME/EXAMES"]
        
        sheet.write("E" + str(linha_ref), total_diagnostico)
        sheet.write("F" + str(linha_ref), float(total_diagnostico)/float(total_sindrome))
        
        linha_ref += 1

planilha.close()

# Quanto tempo demorou pra escrever todo esse código?
30 minutos, contando o tempo pra pensar.

# Quanto tempo o código demorou para ser executado?
> Tempo de análise: 0.3374950885772705 segundos

> Tempo de escrita de planilha: 0.5129516124725342 segundos