# Aplicações práticas

# 2.6 Exercício 6: Qualidade de um teste

## A. Enunciado 

Com base numa amostra aleatória de 100 pacientes, pretende-se analisar a qualidade do teste de diagnóstico (1 positivo, 2 negativo) em relação ao teste de referência (1 positivo, 2 negativo) que constam do ficheiro "cap02_exerc6_qualidade do teste.sav ", da tabela de contingência 1 e organizados em um dicionário em Python.

# Resolução em Python

## Carregando Bibliotecas

In [1]:
import pandas as pd  # Fornece DataFrames e Series para manipulação de dados em Python, facilitando operações como leitura, escrita, e manipulação de estruturas de dados tabulares.

## Funções Personalizadas

In [2]:
import sys

# Adicionar o caminho do diretório ao sys.path
sys.path.append(r"C:\Users\ricar\OneDrive\Área de Trabalho\Livro\Cap_02\socialdataanalysis")

from association import gerar_tabela_contingencia
from association import complementar_tabela_contingencia_com_analise_estatistica

## Dados Fornecidos

In [3]:
# Dicionário com dados categorizados representando grupos e suas frequências
dados = {
    'Teste_diagnóstico': [1, 1, 2, 2],
    'Teste_referência': [1, 2, 1, 2],
    'Freq': [44, 8, 6, 42]
}

# Criando o DataFrame a partir do dicionário
dados = pd.DataFrame(dados)

# Convertendo as colunas para inteiros, se necessário
dados = dados.astype(int)

# Visualizando o dataframe
display(dados)

Unnamed: 0,Teste_diagnóstico,Teste_referência,Freq
0,1,1,44
1,1,2,8
2,2,1,6
3,2,2,42


## Tabela 1: Tabela de Contingência

In [4]:
# Obter automaticamente os nomes dos grupos e da coluna de frequência
grupos = dados.columns[:-1].tolist()  # Todos exceto a última coluna
categorias = {
    grupos[0]: ['1. Positivo', '2. Negativo',],
    grupos[1]: ['1. Positivo', '2. Negativo'],
}

tabela_contingencia = gerar_tabela_contingencia(dados, grupos, categorias)

display(tabela_contingencia)

Teste_referência,1. Positivo,2. Negativo
Teste_diagnóstico,Unnamed: 1_level_1,Unnamed: 2_level_1
1. Positivo,44,8
2. Negativo,6,42


## Tabela de Contingência com Cálculos

In [5]:
# Função própria complementar_tabela_contingencia_com_analise_estatistica
combined_df = complementar_tabela_contingencia_com_analise_estatistica(tabela_contingencia)

# Visualizando resultado
display(combined_df)

Unnamed: 0_level_0,Teste_referência,1. Positivo,2. Negativo,Total
Teste_diagnóstico,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
1. Positivo,Count,44.0,8.0,52.0
1. Positivo,Expected Count,26.0,26.0,52.0
1. Positivo,% within Teste_diagnóstico,84.6,15.4,100.0
1. Positivo,% within Teste_referência,88.0,16.0,52.0
1. Positivo,% of Total,44.0,8.0,52.0
1. Positivo,Standardized Residual,3.5,-3.5,
1. Positivo,Adjusted Residual,7.2,-7.2,
2. Negativo,Count,6.0,42.0,48.0
2. Negativo,Expected Count,24.0,24.0,48.0
2. Negativo,% within Teste_diagnóstico,12.5,87.5,100.0


<font color="blue">    
    
### 2.6.1. A qualidade do teste de diagnóstico
</font>

In [6]:
# Definindo os valores da tabela de contingência
tp = tabela_contingencia.iloc[0,0] # verdadeiros positivos
fp = tabela_contingencia.iloc[0,1] # falsos positivos
fn = tabela_contingencia.iloc[1,0] # falsos negativos
tn = tabela_contingencia.iloc[1,1] # verdadeiros negativos

<font color="blue">
    
#### a) Sensibilidade.
</font>

In [11]:
# Sensibilidade = TP / (TP + FN)
sensibilidade = tp / (tp + fn)

# Visualização
print(f"P[{grupos[0]} + | {grupos[1]} +] = {sensibilidade:.3f}")

P[Teste_diagnóstico + | Teste_referência +] = 0.880


<font color="blue">
    
#### b) Especificidade.
</font>

In [12]:
# Especificidade = TN / (TN + FP)
especificidade = tn / (tn + fp)

# Visualização
print(f"P[{grupos[0]} - | {grupos[1]} -] = {especificidade:.3f}")

P[Teste_diagnóstico - | Teste_referência -] = 0.840


<font color="blue">
    
#### c) Valores preditivos.
</font>

In [13]:
# Valor preditivo positivo = TP / (TP + FP)
vpp = tp / (tp + fp)

# Valor preditivo negativo = TN / (TN + FN)
vpn = tn / (tn + fn)

# Visualização
print(f"P[{grupos[0]} + | {grupos[1]} +] = {vpp:.3f}")
print(f"P[{grupos[0]} - {grupos[1]} -] = {vpn:.3f}")

P[Teste_diagnóstico + | Teste_referência +] = 0.846
P[Teste_diagnóstico - Teste_referência -] = 0.875


<font color="blue">
    
#### c) Classificações corretas.
</font>

In [14]:
# Classificações corretas = (TP + TN) / Total
classificacoes_corretas = (tp + tn) / (tp + tn + fp + fn)

# Visualização
print(f"P[classificações corretas] = {classificacoes_corretas:.3f}")

P[classificações corretas] = 0.860


<font color="blue">
    
#### c) Rácios da verosimilhança.
</font>

In [15]:
# Rácio da verosimilhança positiva = Sensibilidade / (1 - Especificidade)
rvp = sensibilidade / (1 - especificidade)

# Rácio da verosimilhança negativa = (1 - Sensibilidade) / Especificidade
rvn = (1 - sensibilidade) / especificidade

# Visualização
print(f"+LR = {rvp:.3f}")
print(f"-LR = {rvn:.3f}")

+LR = 5.500
-LR = 0.143
