# Lab book: qualidade de laboratórios de citopatologia

Taize Branco dos Santos

In [1]:
%matplotlib inline
import pandas as pd
import analysis

## 1. Leitura dos dados e cálculo dos índices de qualidade

+ Fonte: http://tabnet.datasus.gov.br/cgi/dhdat.exe?SISCAN/cito_colo_atendbr.def
+ Estados: Rio Grande do Sul (RS), Santa Catarina (SC) e Paraná (PR)
+ Período: 2015 a 2019

**Índices:**
+ Índice de positividade (`ind_pos`)
+ Percentual de ASC entre exames satisfatórios (`per_asc_sat`)
+ Percentual de ASC entre exames alterados (`per_asc_alt`)
+ Razão ASC/(LSIL + HSIL) (`raz_asc_sil`)
+ Percentual de HSIL entre exames satisfatórios (`per_hsil`)
+ Percentual de exames insatisfatórios (`per_ins`)

**Filtro:**
+ Seja $x_a$ o número de exames realizados pelo laboratório $x$ no ano $a$.
+ Os dados do laboratório $x$ em um determinado ano $a$ são contabilizados somente se $x_a \ge m$.
+ Parâmetro: $m = 1500$.
+ Exemplo: se um laboratório fez $1000$ exames em 2015 e $2200$ exames em 2016, seus dados não serão contabilizados no ano de 2015, mas serão contabilizados em 2016.

In [2]:
dados = analysis.leituraDados(['rs', 'sc', 'pr'], [2015, 2016, 2017, 2018, 2019])

In [5]:
print('No período de 2015 a 2019:')
analysis.printLabsExames(dados)

No período de 2015 a 2019:
	- Total de laboratórios: 187 (RS: 63; SC: 62; PR: 62)
	- Esses laboratórios fizeram um total de 7546672 exames (RS: 2013903; SC: 2139073; PR: 3393696)


In [7]:
dados = analysis.filtraDados(dados, 1500)

In [8]:
print('Após a filtragem:')
analysis.printLabsExames(dados)

Após a filtragem:
	- Total de laboratórios: 162 (RS: 56; SC: 50; PR: 56)
	- Esses laboratórios fizeram um total de 7486712 exames (RS: 1993835; SC: 2110398; PR: 3382479)


## 2. Estatística descritiva básica

Mostrando estatísticas básicas sobre o conjunto de dados.

In [None]:
pd.options.display.float_format = "{:.1f}".format
dados[['ex_total', 'ex_sat', 'ex_ins', 'asc_total', 'sil_total', 'ind_pos', 'per_asc_sat',
       'per_asc_alt', 'raz_asc_sil', 'per_hsil', 'per_ins', 'estado']].describe()

## 3. Laboratórios

Mostrando a quantidade de laboratórios por estado em cada ano.

In [None]:
pd.options.display.float_format = "{:.0f}".format
analysis.quantidadeLaboratorios(dados)

## 4. Exames realizados

Mostrando a quantidade de exames realizados por estado em cada ano.

In [None]:
pd.options.display.float_format = "{:.0f}".format
analysis.quantidadeExames(dados)

## 5. Indicadores de qualidade

Mostrando a mediana de cada indicador de qualidade por estado em cada ano.

In [None]:
pd.options.display.float_format = "{:.1f}".format
analysis.tabelaIndicadores(dados, 'median')

## 6. Análise

### 6.1. Indicadores ao longo do tempo

Mostrando a evolução dos estados segundo os indicadores de qualidade no período analisado.

In [None]:
analysis.plotIndicadores(dados, 'median')

### 6.2. Correlação entre indicadores

Mostrando o índice de positividade *versus* o percentual de ASC entre exames alterados (**todo o período**).

In [None]:
analysis.plotCorrelacao(dados, 'ind_pos', 'per_asc_alt', [2, 3, 10], [60])

Mostrando o índice de positividade *versus* o percentual de ASC entre exames alterados (**ano de 2017**).

In [None]:
analysis.plotCorrelacao(dados[dados['ano'] == '2017'], 'ind_pos', 'per_asc_alt', [2, 3, 10], [60])