# Aplicações práticas

# 2.9 Exercício 9: Votos Atitudes

## A. Enunciado 

Num estudo feito por Reynolds (1977) para saber se existe evidência de associação entre as atitudes (1 Liberal, 2 Moderada, 3 Conservadora) dos eleitores face ao papel do governo na garantia de empregos e os respetivos votos nos partidos (1 Democratas, 2 Independentes, 3 Republicanos), obtiveram-se os dados resultantes de uma amostra aleatória de 1133 inquiridos, que constam da tabela 1, do ficheiro "cap02-exer9_Votos Atitudes.sav" do IBM-SPSS e organizados em um dicionário em Python.. Ambas as variáveis são nominais porque se definem apenas pelo nome. O estudo é transversal.

# Resolução em Python

## Carregando Bibliotecas

In [1]:
import pandas as pd  # Fornece DataFrames e Series para manipulação de dados em Python, facilitando operações como leitura, escrita, e manipulação de estruturas de dados tabulares.
from statsmodels.stats.contingency_tables import Table  # Analisa tabelas de contingência para estudo de variáveis categóricas, útil em testes de hipóteses e análises de associação entre variáveis.

## Funções Personalizadas

In [1]:
!pip install socialdataanalysis
!pip install --upgrade socialdataanalysis
from socialdataanalysis import analisar_independencia_variaveis_tabela_contingencia
from socialdataanalysis import gerar_tabela_contingencia
from socialdataanalysis import complementar_tabela_contingencia_com_analise_estatistica
from socialdataanalysis import calcular_odds_ratio_razao_risco_discrepancia
from socialdataanalysis import decompor_tabela_contingencia

## Dados Fornecidos

In [3]:
# Dicionário com dados categorizados representando grupos e suas frequências
dados = {
    'Voto': [1, 1, 1, 2, 2, 2, 3, 3, 3],
    'Observado': [1, 2, 3, 1, 2, 3, 1, 2, 3],
    'Freq': [312, 34, 115, 159, 24, 110, 210, 32, 137]
}

# Criando o DataFrame a partir do dicionário
dados = pd.DataFrame(dados)

# Convertendo as colunas para inteiros, se necessário
dados = dados.astype(int)

# Visualizando o dataframe
display(dados)

Unnamed: 0,Voto,Observado,Freq
0,1,1,312
1,1,2,34
2,1,3,115
3,2,1,159
4,2,2,24
5,2,3,110
6,3,1,210
7,3,2,32
8,3,3,137


## Tabela 1: Tabela de Contingência

In [4]:
# Obter automaticamente os nomes dos grupos e da coluna de frequência
grupos = dados.columns[:-1].tolist()  # Todos exceto a última coluna
categorias = {
    grupos[0]: ['1. Democratas', '2. Independentes', '3. Republicanos',],
    grupos[1]: ['1. Liberal', '2. Moderada', '3. Conservadora'],
}

tabela_contingencia = gerar_tabela_contingencia(dados, grupos, categorias)

display(tabela_contingencia)

Observado,1. Liberal,2. Moderada,3. Conservadora
Voto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1. Democratas,312,34,115
2. Independentes,159,24,110
3. Republicanos,210,32,137


## Tabela de Contingência com Cálculos

In [5]:
# Função personalizada complementar_tabela_contingencia_com_analise_estatistica
combined_df = complementar_tabela_contingencia_com_analise_estatistica(tabela_contingencia)

# Visualizando resultado
display(combined_df)

Unnamed: 0_level_0,Observado,1. Liberal,2. Moderada,3. Conservadora,Total
Voto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1. Democratas,Count,312.0,34.0,115.0,461.0
1. Democratas,Expected Count,277.1,36.6,147.3,461.0
1. Democratas,% within Voto,67.7,7.4,24.9,100.0
1. Democratas,% within Observado,45.8,37.8,31.8,40.7
1. Democratas,% of Total,27.5,3.0,10.2,40.7
1. Democratas,Standardized Residual,2.1,-0.4,-2.7,
1. Democratas,Adjusted Residual,4.3,-0.6,-4.2,
2. Independentes,Count,159.0,24.0,110.0,293.0
2. Independentes,Expected Count,176.1,23.3,93.6,293.0
2. Independentes,% within Voto,54.3,8.2,37.5,100.0


<font color="blue">    
    
### 2.9.1. Teste do rácio da verosimilhança e hipoteses
</font>

<font color="blue">
    
#### a) Pretende-se analisar a associação entre as variáveis, usando o teste do rácio da verosimilhança G², por a tabela ser i x j ≠ 2 x 2.
</font>

In [6]:
analisar_independencia_variaveis_tabela_contingencia(tabela_contingencia, 
                                                     mostrar_pearson=True, 
                                                     mostrar_continuity=False, 
                                                     mostrar_likelihood=True, 
                                                     mostrar_fisher=False)

Unnamed: 0_level_0,Value,df,Asymp. Sig. (2-sided)
Test,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Pearson Chi-Square,19.82,4.0,0.001
Likelihood Ratio,20.08,4.0,0.0
N. of Valid Cases,1133.0,,


a. 0 cells (0.00%) have expected count less than 5. The minimum expected count is 23.27.


<font color="blue">    
    
### 2.9.2. Frequências esperadas
</font>

<font color="blue">
    
#### b) A frequência que se espera obter nos votos democratas com atitude liberal.
</font>

In [7]:
## FREQUÊNCIAS ESPERADAS ##

# Encapsulando a tabela para análises no statsmodels
tabela_analise = Table(tabela_contingencia)

# Calculando as frequências esperadas (fe)
frequencias_esperadas = tabela_analise.fittedvalues

# Exibindo as fe
display(frequencias_esperadas.round(1))

Observado,1. Liberal,2. Moderada,3. Conservadora
Voto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1. Democratas,277.1,36.6,147.3
2. Independentes,176.1,23.3,93.6
3. Republicanos,227.8,30.1,121.1


<font color="blue">
    
### 2.1.4. Resíduos ajustados estandardizados
</font>

<font color="blue">
    
#### c) Com base nos resíduos ajustados estandardizados saber se existem células com comportamentos significativamente diferentes do esperado.
</font>

In [8]:
## Calcula os Resíduos de Pearson (não ajustados)
residuos_nao_ajustados = tabela_analise.resid_pearson

# Calcula os Resíduos ajustados estandardizados
residuos_estandardizados = tabela_analise.standardized_resids

# Visualizando
display(residuos_estandardizados.round(1))

Observado,1. Liberal,2. Moderada,3. Conservadora
Voto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1. Democratas,4.3,-0.6,-4.2
2. Independentes,-2.4,0.2,2.4
3. Republicanos,-2.3,0.4,2.1


<font color="blue">
    
### 2.9.4. Decomposição do teste G2
</font>

<font color="blue">
    
#### d) Aprofundar a associação entre Voto e Atitudes
</font>

In [9]:
# Função personalizada complementar_tabela_contingencia_com_analise_estatistica  
subtabelas = decompor_tabela_contingencia(tabela_contingencia)

<IPython.core.display.Math object>

<IPython.core.display.Math object>

Unnamed: 0_level_0,Observado,1. Liberal,2. Moderada&3. Conservadora,Total
Voto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
1. Democratas,Count,312.0,149.0,461.0
1. Democratas,Expected Count,277.1,183.9,461.0
1. Democratas,% within Voto,67.7,32.3,100.0
1. Democratas,% within Observado,45.8,33.0,40.7
1. Democratas,% of Total,27.5,13.2,40.7
1. Democratas,Standardized Residual,2.1,-2.6,
1. Democratas,Adjusted Residual,4.3,-4.3,
2. Independentes&3. Republicanos,Count,369.0,303.0,672.0
2. Independentes&3. Republicanos,Expected Count,403.9,268.1,672.0
2. Independentes&3. Republicanos,% within Voto,54.9,45.1,100.0


<IPython.core.display.Math object>

Unnamed: 0_level_0,Observado,2. Moderada,3. Conservadora,Total
Voto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
1. Democratas,Count,34.0,115.0,149.0
1. Democratas,Expected Count,29.7,119.3,149.0
1. Democratas,% within Voto,22.8,77.2,100.0
1. Democratas,% within Observado,37.8,31.8,33.0
1. Democratas,% of Total,7.5,25.4,33.0
1. Democratas,Standardized Residual,0.8,-0.4,
1. Democratas,Adjusted Residual,1.1,-1.1,
2. Independentes&3. Republicanos,Count,56.0,247.0,303.0
2. Independentes&3. Republicanos,Expected Count,60.3,242.7,303.0
2. Independentes&3. Republicanos,% within Voto,18.5,81.5,100.0


<IPython.core.display.Math object>

Unnamed: 0_level_0,Observado,2. Moderada,3. Conservadora,Total
Voto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2. Independentes,Count,24.0,110.0,134.0
2. Independentes,Expected Count,24.8,109.2,134.0
2. Independentes,% within Voto,17.9,82.1,100.0
2. Independentes,% within Observado,42.9,44.5,44.2
2. Independentes,% of Total,7.9,36.3,44.2
2. Independentes,Standardized Residual,-0.2,0.1,
2. Independentes,Adjusted Residual,-0.2,0.2,
3. Republicanos,Count,32.0,137.0,169.0
3. Republicanos,Expected Count,31.2,137.8,169.0
3. Republicanos,% within Voto,18.9,81.1,100.0


<IPython.core.display.Math object>

Unnamed: 0_level_0,Observado,1. Liberal,2. Moderada&3. Conservadora,Total
Voto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2. Independentes,Count,159.0,134.0,293.0
2. Independentes,Expected Count,160.9,132.1,293.0
2. Independentes,% within Voto,54.3,45.7,100.0
2. Independentes,% within Observado,43.1,44.2,43.6
2. Independentes,% of Total,23.7,19.9,43.6
2. Independentes,Standardized Residual,-0.1,0.2,
2. Independentes,Adjusted Residual,-0.3,0.3,
3. Republicanos,Count,210.0,169.0,379.0
3. Republicanos,Expected Count,208.1,170.9,379.0
3. Republicanos,% within Voto,55.4,44.6,100.0


<font color="blue">
    
### 2.9.5. OR e RP
</font>

<font color="blue">
    
#### e) Medir a intensidade da associação usando OR e RP e analisar a sua discrepância para os dados da Tabela 3.
</font>

In [10]:
# Tabela 3
tabela3 = subtabelas[0]

# Função personalizada complementar_tabela_contingencia_com_analise_estatistica
calcular_odds_ratio_razao_risco_discrepancia(tabela3, print_results=True)

Unnamed: 0,Value,95% CI Lower,95% CI Upper
Odds Ratio for Voto (1. Democratas / 2. Independentes&3. Republicanos),1.719,1.343,2.202
RR (ou RP) for Observado = 1. Liberal,1.233,1.123,1.353
RR (ou RP) for Observado = 2. Moderada&3. Conservadora,0.717,0.613,0.838
N. of Valid Cases,1133.0,,


Discrepância = 0.395 e (θ * p21) = 0.944
