# Aplicações práticas

# 2.12 Exercício 12: Exposição Bronquite Idade

## A. Enunciado 

Com base em uma amostra aleatória de 1378 pacientes coletados ao longo de três anos, busca-se determinar o número de casos de bronquite (1. Possui, 2. Não possui) em relação ao número de exposições ao tabagismo e a substâncias irritantes no ar (1. Elevadas, 2. Baixas), controlando o efeito da idade. O estudo é estratificado por faixas etárias, introduzidas como camadas no IBM-SPSS, com duas categorias: 1 = de 15 a 40 anos; 2 = mais de 40 anos. Os dados estão disponíveis na linha "Count" da Tabela 1 e no arquivo "cap02_exerc12_Exposição_Bronquite_Idade.sav" do IBM-SPSS e também estão organizados em um dicionário em Python. A tabela de contingência é do tipo 2 x 2 x 2, pois cada variável possui 2 categorias.



# Resolução em Python

## Carregando Bibliotecas

In [1]:
import pandas as pd  # Fornece DataFrames e Series para manipulação de dados em Python, facilitando operações como leitura, escrita, e manipulação de estruturas de dados tabulares.

## Funções Personalizadas

In [2]:
import sys

# Adicionar o caminho do diretório ao sys.path
sys.path.append(r"C:\Users\ricar\OneDrive\Área de Trabalho\Livro\Cap_02\socialdataanalysis")

from association import analisar_frequencias_esperadas
from association import gerar_tabela_contingencia
from association import avaliar_homogeneidade_odds_ratio
from association import calcular_odds_ratio_razao_risco_discrepancia
from association import complementar_e_filtrar_tabelas_contingencia
from association import complementar_tabela_contingencia_com_analise_estatistica
from association import avaliar_associacao_condicional

## Dados Fornecidos

In [3]:
# Dicionário com dados categorizados representando grupos e suas frequências
dados = {
    'Idade': [1, 1, 1, 1, 
              2, 2, 2, 2], # 1. 15 a 40 anos, 2. Acima de 40 anos
    'Exposição': [1, 1, 2, 2, 
                  1, 1, 2, 2], # 1. Elevada, 2. Baixa
    'Bronquite': [1, 2, 1, 2, 
                  1, 2, 1, 2], # 1. Possui, 2. Não possui
    'Freq': [85, 12, 32, 8, 
             768, 8, 450, 15]
}

# Criando o DataFrame a partir do dicionário
dados = pd.DataFrame(dados)

# Convertendo as colunas para inteiros, se necessário
dados = dados.astype(int)

# Visualizando o dataframe
display(dados)

Unnamed: 0,Idade,Exposição,Bronquite,Freq
0,1,1,1,85
1,1,1,2,12
2,1,2,1,32
3,1,2,2,8
4,2,1,1,768
5,2,1,2,8
6,2,2,1,450
7,2,2,2,15


## Tabela 1: Tabela de Contingência

In [4]:
# Obter automaticamente os nomes dos grupos e da coluna de frequência
grupos = dados.columns[:-1].tolist()  # Todos exceto a última coluna
categorias = {
    grupos[0]: ['1. 15 a 40 anos', '2. Acima de 40 anos'],
    grupos[1]: ['1. Elevada', '2. Baixa'],
    grupos[2]: ['1. Possui', '2. Não possui']
}

tabela_contingencia = gerar_tabela_contingencia(dados, grupos, categorias)

display(tabela_contingencia)

Unnamed: 0_level_0,Bronquite,1. Possui,2. Não possui
Idade,Exposição,Unnamed: 2_level_1,Unnamed: 3_level_1
1. 15 a 40 anos,1. Elevada,85,12
1. 15 a 40 anos,2. Baixa,32,8
2. Acima de 40 anos,1. Elevada,768,8
2. Acima de 40 anos,2. Baixa,450,15


## Tabela de Contingência com Cálculos

In [5]:
complementar_e_filtrar_tabelas_contingencia(tabela_contingencia, complementar_tabela_contingencia_com_analise_estatistica)

Unnamed: 0_level_0,Unnamed: 1_level_0,Bronquite,1. Possui,2. Não possui,Total
Idade,Exposição,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1. 15 a 40 anos,1. Elevada,Count,85.0,12.0,97.0
1. 15 a 40 anos,1. Elevada,Expected Count,82.8,14.2,97.0
1. 15 a 40 anos,1. Elevada,% within Exposição,87.6,12.4,100.0
1. 15 a 40 anos,2. Baixa,Count,32.0,8.0,40.0
1. 15 a 40 anos,2. Baixa,Expected Count,34.2,5.8,40.0
1. 15 a 40 anos,2. Baixa,% within Exposição,80.0,20.0,100.0
1. 15 a 40 anos,Total,Count,117.0,20.0,137.0
1. 15 a 40 anos,Total,Expected Count,117.0,20.0,137.0
1. 15 a 40 anos,Total,% within Exposição,85.4,14.6,100.0
2. Acima de 40 anos,1. Elevada,Count,768.0,8.0,776.0


<font color="blue">    
    
### 2.12.1. Pressupostos dos testes do Qui-Quadrado
</font>

<font color="blue">
    
#### a) Verificar a observância dos pressupostos dos testes do Qui-Quadrado.
</font>

In [6]:
analisar_frequencias_esperadas(tabela_contingencia)


Análise para: 1. 15 a 40 anos


Fo: Bronquite   1. Possui  2. Não possui
Exposição                           
1. Elevada         85             12
2. Baixa           32              8

Fe: Bronquite   1. Possui  2. Não possui
Exposição                           
1. Elevada       82.8           14.2
2. Baixa         34.2            5.8

 a. 0 células (0.00%) têm uma frequência esperada menor que 5. A frequência esperada mínima é 5.84.
----------------------------------------------------------------------------------------------------

Análise para: 2. Acima de 40 anos


Fo: Bronquite   1. Possui  2. Não possui
Exposição                           
1. Elevada        768              8
2. Baixa          450             15

Fe: Bronquite   1. Possui  2. Não possui
Exposição                           
1. Elevada      761.6           14.4
2. Baixa        456.4            8.6

 a. 0 células (0.00%) têm uma frequência esperada menor que 5. A frequência esperada mínima é 8.62.
-----------------

<font color="blue">    
    
### 2.12.2. Efeito interativo e hipóteses
</fonte>

<font color="blue">
    
#### b) Conhecer se existe homogeneidade, ie, um comportamento semelhante da exposição segundo a bronquite para qualquer idade.
</font>

In [7]:
complementar_e_filtrar_tabelas_contingencia(tabela_contingencia, calcular_odds_ratio_razao_risco_discrepancia)

Unnamed: 0_level_0,Unnamed: 1_level_0,Value,95% CI Lower,95% CI Upper
Idade,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
1. 15 a 40 anos,Odds Ratio for Exposição (1. Elevada / 2. Baixa),1.771,0.663,4.731
1. 15 a 40 anos,RR (ou RP) for Bronquite = 1. Possui,1.095,0.922,1.301
1. 15 a 40 anos,RR (ou RP) for Bronquite = 2. Não possui,0.619,0.274,1.398
1. 15 a 40 anos,N. of Valid Cases,137.0,,
2. Acima de 40 anos,Odds Ratio for Exposição (1. Elevada / 2. Baixa),3.2,1.346,7.607
2. Acima de 40 anos,RR (ou RP) for Bronquite = 1. Possui,1.023,1.004,1.041
2. Acima de 40 anos,RR (ou RP) for Bronquite = 2. Não possui,0.32,0.137,0.748
2. Acima de 40 anos,N. of Valid Cases,1241.0,,
Total,Odds Ratio for Exposição (1. Elevada / 2. Baixa),2.035,1.106,3.744
Total,RR (ou RP) for Bronquite = 1. Possui,1.024,1.002,1.046


In [8]:
avaliar_homogeneidade_odds_ratio(tabela_contingencia)            


Teste de Breslow-Day:
Chi-Squared: 0.7894
Asymp. Sig. (2-sided): 0.3743

Teste de Tarone:
Chi-Squared: 0.7887
Asymp. Sig. (2-sided): 0.3745


<font color="blue">    
    
### 2.12.3. Significância da associação e hipóteses
</fonte>

<font color="blue">
    
#### c) Havendo homogeneidade, analisar a significância da associação, usando o teste da independência condicional. 
</font>

In [9]:
avaliar_associacao_condicional(tabela_contingencia, calcular_significancia=True, calcular_ic=False)


Teste de Mantel-Haenszel com correção de continuidade:
Qui-Quadrado: 7.309
Significância Assintótica (bilateral): 0.007


<font color="blue">  

### 2.12.4. Intensidade da associação e hipóteses
</fonte>

<font color="blue">
    
#### d) Analisar a intensidade da associação através da estimativa do Mantel-Haenszel Common Odds ratio.
</font>

In [10]:
avaliar_associacao_condicional(tabela_contingencia, calcular_significancia=False, calcular_ic=True)


Razão de Chances Comum Estimada (Mantel-Haenszel):
Estimativa: 2.498
Intervalo de Confiança (95%): [1.316, 4.740]
