In [1]:
############## Importar os módulos necessários para o Notebook:
import matplotlib.pyplot as plt
import pandas.io.sql as psql
from ipywidgets import interact  ##-- Interactors
import ipywidgets as widgets     #---
from sqlalchemy import create_engine, text

############## Conectar com um servidor SQL ###################### --> Postgres
%load_ext sql

# Connection format: %sql dialect+driver://username:password@host:port/database
engine = create_engine('postgresql://postgres:pgadmin@localhost/fapcov2103')
%sql postgresql://postgres:pgadmin@localhost/fapcov2103
%config SqlMagic.displaylimit=None

%sql SET Search_Path To D2; 

In [5]:
%%sql
select * from examlabs limit 2

id_paciente,id_atendimento,dt_coleta,de_origem,de_exame,de_analito,de_resultado,cd_unidade,cd_valorreferencia,de_hospital,de_resultnum,de_resultadocorr
DFF252C84D4AFBC754A45C0152435715,6EC6CDFBC0C8C71634463249FA439B81,2020-10-16,UTI,hemograma,neutrófilos (%),790,,,HSL,79.0,790
144BBEB46DB9D292843D50A4B5B9CFE0,D073DC83098193A392D5EF65F04BFABE,2020-07-28,UTI,tgo,ast (tgo),25,U/L,Até 32,HSL,25.0,25


## Pré-Processamento dos Dados

Materialização e Visão dos Exames (Pivoteamento)

In [6]:
%%sql
-- Despreza view materializada eventualmente criada
DROP MATERIALIZED VIEW IF EXISTS d2.view_colesterol_pivot CASCADE;

-- Criação da view materializada do exercício
CREATE MATERIALIZED VIEW d2.view_colesterol_pivot AS
SELECT
    id_atendimento,
    id_paciente,
    dt_coleta,
    de_hospital,

    -- LDL: Encontrado como 'ldl colesterol' (excluímos 'vldl')
    MAX(CASE
        WHEN de_analito ILIKE '%ldl%'
             AND de_analito NOT ILIKE '%vldl%'
        THEN de_resultnum END) AS val_ldl,

    -- HDL: encontrado como 'hdl-colesterol' (excluímos 'não-hdl')
    MAX(CASE
        WHEN de_analito ILIKE '%hdl%'
             AND de_analito NOT ILIKE '%não%hdl%'
             AND de_analito NOT ILIKE '%nao%hdl%'
        THEN de_resultnum END) AS val_hdl,

    -- VLDL: encontrado como 'vldl-colesterol'
    MAX(CASE
        WHEN de_analito ILIKE '%vldl%'
        THEN de_resultnum END) AS val_vldl,

    -- Não HDL: Encontrado como 'colesterol não-hdl, soro'
    MAX(CASE
        WHEN de_analito ILIKE '%não%hdl%'
             OR de_analito ILIKE '%nao%hdl%'
        THEN de_resultnum END) AS val_nao_hdl,

    -- Total: Encontrado como 'colesterol total' (exigimos '%colesterol total%')
    MAX(CASE
        WHEN de_analito ILIKE '%colesterol total%'
        THEN de_resultnum END) AS val_total

FROM d2.examlabs
-- Filtro otimizado para linhas relevantes antes do pivot
WHERE
    de_analito ILIKE '%colesterol%'
    OR de_analito ILIKE '%ldl%'
    OR de_analito ILIKE '%hdl%'
    OR de_analito ILIKE '%vldl%'
GROUP BY id_atendimento, id_paciente, dt_coleta, de_hospital;

-- Recriação do índice para ajudar nas buscas
CREATE INDEX idx_view_colesterol ON d2.view_colesterol_pivot(id_atendimento);

In [7]:
%%sql
SELECT * FROM view_colesterol_pivot limit 10;

id_atendimento,id_paciente,dt_coleta,de_hospital,val_ldl,val_hdl,val_vldl,val_nao_hdl,val_total
F53AE0CB2B0303BA651BAD79826F485E,6ADB8777DF2FF074B6C0D6FF199253D8,2020-11-24,HSL,102.0,75.0,29.0,131.0,206.0
2763EBBD359A77B02DDB812D96303438,A33FEAD5BC95E540D33D544A3317F7A6,2020-07-29,HSL,103.0,42.0,,,168.0
26E6FBC0B77485D4E520676012D95B1D,8445CC198063CBA2FAC67192094C0F54,2020-10-10,HSL,114.0,50.0,,,192.0
9CB72B5B5BF215DDBBCC924DC19B3F4F,E3D7C45E6FAC2DB67727E0C5260D74F2,2020-11-07,HSL,96.0,58.0,11.0,107.0,165.0
AEE10D1D2962EC2B7F7F9CD2AA5E76EE,266B8868D10DCB6D665B42C71D2282CC,2020-10-31,HSL,170.0,18.0,,,264.0
43BA837CB99F6CD1F7FFA51E48AC0FFA,C103F8BE6DD2E343EF2F3EE66C22F742,2020-11-07,HSL,120.0,51.0,11.0,131.0,182.0
F97C5A04BA5A4226EF9048236E39B81E,EA1E5BE3B0BC4F01DA3DBBD704FB1179,2020-09-21,HSL,,58.0,,,179.0
B972D067E14809E474281F4907D9EE32,322F62469C5E3C7DC3E58F5A4D1EA399,2020-12-15,HSL,77.0,46.0,19.0,96.0,142.0
7F0F1E5AC2743F5F3FD66D7B345E7E9C,8B529A34361525D285DF1358FD960787,2020-10-30,HSL,78.0,41.0,18.0,96.0,137.0
2A96C2F4E43DF70075F0250A2B41CA5E,19976D4349E3502F691CF896666E41AB,2020-07-24,HSL,,62.0,,107.0,169.0


## Criação da Tabela de Referência

In [None]:
%%sql
DROP TABLE IF EXISTS d2.ref_colesterol_limites;

CREATE TABLE d2.ref_colesterol_limites (
    tipo_referencia text,
    limite_ldl float8,
    limite_hdl float8,
    limite_vldl float8,
    limite_nao_hdl float8,
    limite_total float8
);

-- Inserindo os valores de referência da SBC
-- LDL<130, HDL>=40, VLDL<30, Não HDL<160, Total<190
INSERT INTO d2.ref_colesterol_limites
VALUES ('SBC_2024', 130, 40, 30, 160, 190);

In [9]:
%%sql
select * from d2.ref_colesterol_limites

tipo_referencia,limite_ldl,limite_hdl,limite_vldl,limite_nao_hdl,limite_total
SBC_2024,130.0,40.0,30.0,160.0,190.0


## Classificação

In [10]:
%%sql
CREATE OR REPLACE VIEW d2.view_colesterol_classificado AS
SELECT
    p.*,
    CASE
        -- Verifica se ALGUM analito viola a regra (regra de exclusão)
        WHEN (p.val_ldl >= r.limite_ldl) THEN 'FORA'
        WHEN (p.val_hdl <  r.limite_hdl) THEN 'FORA'
        WHEN (p.val_vldl >= r.limite_vldl) THEN 'FORA'
        WHEN (p.val_nao_hdl >= r.limite_nao_hdl) THEN 'FORA'
        WHEN (p.val_total >= r.limite_total) THEN 'FORA'
        -- Se passou por tudo e tem valores, está dentro
        ELSE 'DENTRO'
    END AS status_referencia
FROM d2.view_colesterol_pivot p
CROSS JOIN d2.ref_colesterol_limites r
WHERE r.tipo_referencia = 'SBC_2024'
  -- Garante que pelo menos um valor de colesterol existe para classificar
  AND COALESCE(val_ldl, val_hdl, val_vldl, val_nao_hdl, val_total) IS NOT NULL;

In [14]:
%%sql 
SELECT id_paciente, status_referencia FROM view_colesterol_classificado limit 10;

id_paciente,status_referencia
6ADB8777DF2FF074B6C0D6FF199253D8,FORA
A33FEAD5BC95E540D33D544A3317F7A6,DENTRO
8445CC198063CBA2FAC67192094C0F54,FORA
E3D7C45E6FAC2DB67727E0C5260D74F2,DENTRO
266B8868D10DCB6D665B42C71D2282CC,FORA
C103F8BE6DD2E343EF2F3EE66C22F742,DENTRO
EA1E5BE3B0BC4F01DA3DBBD704FB1179,DENTRO
322F62469C5E3C7DC3E58F5A4D1EA399,DENTRO
8B529A34361525D285DF1358FD960787,DENTRO
19976D4349E3502F691CF896666E41AB,DENTRO


## Contagem por Classe

Essa parte é referente ao item abaixo do exercício:

A) Contabilize quantos exames estão com ao menos um analito fora do seu
correspondente valor de referência e quantos estão com todos os analitos
dentro dos valores de referência;

In [16]:
%%sql
SELECT
    status_referencia,
    COUNT(*) as qtd_exames
FROM d2.view_colesterol_classificado
GROUP BY status_referencia;

status_referencia,qtd_exames
FORA,1064
DENTRO,949


## Amostragem Estratificada

Essa parte é referente ao item abaixo do exercício:

B) Gere uma amostragem que contenha 25% dos exames fora e 10% dos
exames dentro dos valores de referência.

In [17]:
%%sql
SELECT *
FROM (
    -- Amostra 10% dos que estão DENTRO
    SELECT
        id_atendimento,
        'Amostra DENTRO (10%)' as origem_amostra,
        val_total, val_ldl, val_hdl -- colunas de interesse
    FROM d2.view_colesterol_classificado
    WHERE status_referencia = 'DENTRO'
    AND random() < 0.10
) dentro

UNION ALL

SELECT *
FROM (
    -- Amostra 25% dos que estão FORA
    SELECT
        id_atendimento,
        'Amostra FORA (25%)' as origem_amostra,
        val_total, val_ldl, val_hdl
    FROM d2.view_colesterol_classificado
    WHERE status_referencia = 'FORA'
    AND random() < 0.25
) fora;

id_atendimento,origem_amostra,val_total,val_ldl,val_hdl
4199313AE56C5201AAE89A7B78623A96,Amostra DENTRO (10%),130.0,64.0,40.0
0C13007154A0120FE17B6D04DECFB8DD,Amostra DENTRO (10%),177.0,102.0,56.0
D662092DC9B6F4EF68919C0589FD66F4,Amostra DENTRO (10%),133.0,66.0,50.0
214A8EBF0CD993EF240A519255A39038,Amostra DENTRO (10%),181.0,91.0,68.0
55404CBCAF2CEE26E392BADEC2B60B5E,Amostra DENTRO (10%),182.0,115.0,42.0
78AB6B0A7D9049B245448B3A74974ED4,Amostra DENTRO (10%),158.0,,51.0
26D950D011B5EA7E1BE606DB8BC71713,Amostra DENTRO (10%),147.0,90.0,40.0
1A119F0CDC76890B531E549358920E3D,Amostra DENTRO (10%),171.0,91.0,64.0
9B5CCDC1FFBBD1A114259B6318A6AE70,Amostra DENTRO (10%),115.0,54.0,47.0
3A65B72DBCFA6F25E5705088FC108FFD,Amostra DENTRO (10%),165.0,75.0,76.0
