<a href="https://colab.research.google.com/github/JulioLino/ProjetoMestradoSaudePublica/blob/main/MestradoPorcentagemEstatisticoAcertosd.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Mestrado - Calculo de porcentagem de acerto


Importação, acesso ao drive e carga de arquivo

In [None]:
import pandas as pd
import os
from google.colab import drive
from scipy import stats # para teste t pareado

In [None]:
# Bloco 1: Montar o Google Drive
# Isso permitirá que o Google Colab acesse os arquivos do seu Google Drive.
print('Montando o Google Drive...')
drive.mount('/content/drive')
print('Google Drive montado com sucesso.')
print('-' * 50)

Montando o Google Drive...
Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Google Drive montado com sucesso.
--------------------------------------------------


In [None]:
# Bloco 2: Definir o caminho do arquivo e carregar os dados
# Altere o 'caminho_arquivo' para o local do seu arquivo, se necessário.
caminho_arquivo = '/content/drive/MyDrive/Colab Notebooks/Base_Dados/EtapaC_D/Questionario_2_4_MediaeNotas.csv'

try:
    # Carrega o arquivo CSV em um DataFrame do pandas
    df = pd.read_csv(caminho_arquivo)
    print('Arquivo carregado com sucesso!')
except FileNotFoundError:
    print(f'Erro: O arquivo não foi encontrado no caminho especificado: {caminho_arquivo}')
    exit() # Encerra o script se o arquivo não for encontrado
print('-' * 50)


Arquivo carregado com sucesso!
--------------------------------------------------


# Calculos estatisticos das porcentagens de acerto

In [None]:
# Bloco 3: Realizar os cálculos
# Identificando as colunas de notas para Q2 e Q4
q2_cols = [f'Q. {i} /0,67' for i in range(1, 16)]
q4_cols = [f'Q. {i} /0,67.1' for i in range(1, 16)]
num_questions = 15

# Calculando a porcentagem de acertos para cada aluno em Q2 e Q4
# A soma das colunas é dividida por 0.67 para obter o número de acertos
# O resultado é dividido pelo número de questões e multiplicado por 100 para a porcentagem
df['Porcentagem_Q2'] = (df[q2_cols].sum(axis=1) / 0.67) / num_questions * 100
df['Porcentagem_Q4'] = (df[q4_cols].sum(axis=1) / 0.67) / num_questions * 100

# Calculando a média, mediana, desvio padrão e variação das porcentagens
media_q2 = df['Porcentagem_Q2'].mean()
mediana_q2 = df['Porcentagem_Q2'].median()
desvio_padrao_q2 = df['Porcentagem_Q2'].std()
variancia_q2 = df['Porcentagem_Q2'].var()

media_q4 = df['Porcentagem_Q4'].mean()
mediana_q4 = df['Porcentagem_Q4'].median()
desvio_padrao_q4 = df['Porcentagem_Q4'].std()
variancia_q4 = df['Porcentagem_Q4'].var()

print('Cálculos concluídos!')
print('-' * 50)

Cálculos concluídos!
--------------------------------------------------


In [None]:
# Bloco 4: Exibir os resultados
print('Estatísticas das Porcentagens de Acerto:')
print('\n--- Q2 ---')
print(f'Média: {media_q2:.2f}%')
print(f'Mediana: {mediana_q2:.2f}%')
print(f'Desvio Padrão: {desvio_padrao_q2:.2f}')
print(f'Variação: {variancia_q2:.2f}')

print('\n--- Q4 ---')
print(f'Média: {media_q4:.2f}%')
print(f'Mediana: {mediana_q4:.2f}%')
print(f'Desvio Padrão: {desvio_padrao_q4:.2f}')
print(f'Variação: {variancia_q4:.2f}')
print('-' * 50)

Estatísticas das Porcentagens de Acerto:

--- Q2 ---
Média: 72.74%
Mediana: 66.67%
Desvio Padrão: 17.07
Variação: 291.36

--- Q4 ---
Média: 83.69%
Mediana: 86.67%
Desvio Padrão: 14.15
Variação: 200.27
--------------------------------------------------


In [None]:
# Bloco 5: Salvar os resultados em um arquivo Excel
# Criando um DataFrame com os resultados para salvar em Excel
resultados_df = pd.DataFrame({
    'Questionário': ['Q2', 'Q4'],
    'Média (%)': [media_q2, media_q4],
    'Mediana (%)': [mediana_q2, mediana_q4],
    'Desvio Padrão': [desvio_padrao_q2, desvio_padrao_q4],
    'Variação': [variancia_q2, variancia_q4]
})

# Obtendo o diretório do arquivo de origem
output_dir = os.path.dirname(caminho_arquivo)
output_file = os.path.join(output_dir, 'Estatisticas_Porcentagem_Q2_Q4.xlsx')

resultados_df.to_excel(output_file, index=False)
print(f'Resultados salvos com sucesso em: {output_file}')

Resultados salvos com sucesso em: /content/drive/MyDrive/Colab Notebooks/Base_Dados/EtapaC_D/Estatisticas_Porcentagem_Q2_Q4.xlsx


# Calculos de porcentagem de acerto por função

In [None]:
# =======================================================
# Bloco 3: Calcular as porcentagens de acerto
# =======================================================
# Define as colunas que contêm as notas das questões para Q2 e Q4.
q2_cols = [f'Q. {i} /0,67' for i in range(1, 16)]
q4_cols = [f'Q. {i} /0,67.1' for i in range(1, 16)]
num_questions = 15

# Calcula o número de acertos por aluno e converte para porcentagem.
df['Porcentagem_Q2'] = (df[q2_cols].sum(axis=1) / 0.67) / num_questions * 100
df['Porcentagem_Q4'] = (df[q4_cols].sum(axis=1) / 0.67) / num_questions * 100

print('Porcentagens de acerto calculadas para cada aluno.')
print('-' * 50)

Porcentagens de acerto calculadas para cada aluno.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 4: Agrupar e calcular as estatísticas por categoria
# =======================================================
# Agrupa o DataFrame pela coluna de função e calcula as estatísticas para Q2.
grouped_q2 = df.groupby('Você atua em qual função atualmente?')['Porcentagem_Q2'].agg(['mean', 'median', 'std', 'var']).round(2)

# Agrupa o DataFrame pela coluna de função e calcula as estatísticas para Q4.
grouped_q4 = df.groupby('Você atua em qual função atualmente?')['Porcentagem_Q4'].agg(['mean', 'median', 'std', 'var']).round(2)

# Renomeia as colunas para melhor visualização.
grouped_q2.columns = ['Média (%) Q2', 'Mediana (%) Q2', 'Desvio Padrão Q2', 'Variação Q2']
grouped_q4.columns = ['Média (%) Q4', 'Mediana (%) Q4', 'Desvio Padrão Q4', 'Variação Q4']

print('Estatísticas agrupadas por categoria calculadas.')
print('-' * 50)

Estatísticas agrupadas por categoria calculadas.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 5: Exibir os resultados
# =======================================================
# Exibe as tabelas de estatísticas para Q2 e Q4.
print('Estatísticas de porcentagem de acertos por Categoria (Q2):')
print(grouped_q2)

print('\nEstatísticas de porcentagem de acertos por Categoria (Q4):')
print(grouped_q4)
print('-' * 50)


Estatísticas de porcentagem de acertos por Categoria (Q2):
                                      Média (%) Q2  Mediana (%) Q2  \
Você atua em qual função atualmente?                                 
Enfermeiro(a)                                75.44           66.67   
Estudante de enfermagem                      73.33           73.33   
Estudante de medicina                        73.33           66.67   
Estudante de técnico de enfermagem           60.00           60.00   
Médico(a)                                    80.00           80.00   
Técnico(a) de enfermagem                     70.80           73.33   

                                      Desvio Padrão Q2  Variação Q2  
Você atua em qual função atualmente?                                 
Enfermeiro(a)                                    18.33       336.06  
Estudante de enfermagem                           0.00         0.00  
Estudante de medicina                            17.64       311.11  
Estudante de técnico de enferm

In [None]:
# =======================================================
# Bloco 6: Salvar os resultados em um arquivo Excel
# =======================================================
# Combina os resultados de Q2 e Q4 em um único DataFrame.
resultados_finais_df = pd.concat([grouped_q2, grouped_q4], axis=1)

# Define o caminho de saída para o novo arquivo Excel.
output_dir = os.path.dirname(caminho_arquivo)
output_file = os.path.join(output_dir, 'Estatisticas_Porcentagem_por_Categoria.xlsx')

# Salva o DataFrame de resultados em um arquivo Excel na mesma pasta.
resultados_finais_df.to_excel(output_file, index=True)

print(f'Resultados salvos com sucesso em: {output_file}')

Resultados salvos com sucesso em: /content/drive/MyDrive/Colab Notebooks/Base_Dados/EtapaC_D/Estatisticas_Porcentagem_por_Categoria.xlsx


# Calculos das porcentagens por Modulos

In [None]:
# =======================================================
# Bloco 3: Definir os módulos e realizar os cálculos
# =======================================================
# Define os módulos e as colunas de perguntas correspondentes para Q2 e Q4.
modules = {
    'Q2_Modulo_4': [f'Q. {i} /0,67' for i in range(1, 9)],
    'Q2_Modulo_5': [f'Q. {i} /0,67' for i in range(9, 14)],
    'Q2_Modulo_3': [f'Q. {i} /0,67' for i in range(13, 16)],
    'Q4_Modulo_4': [f'Q. {i} /0,67.1' for i in range(1, 9)],
    'Q4_Modulo_5': [f'Q. {i} /0,67.1' for i in range(9, 14)],
    'Q4_Modulo_3': [f'Q. {i} /0,67.1' for i in range(13, 16)]
}

# Define o número de questões em cada módulo.
module_sizes = {
    'Q2_Modulo_4': 8,
    'Q2_Modulo_5': 5,
    'Q2_Modulo_3': 3,
    'Q4_Modulo_4': 8,
    'Q4_Modulo_5': 5,
    'Q4_Modulo_3': 3
}

# DataFrame para armazenar os resultados finais
results_df = pd.DataFrame(columns=['Questionario', 'Modulo', 'Média (%)', 'Mediana (%)', 'Desvio Padrão', 'Variação'])

print('Iniciando o cálculo das estatísticas por módulo...')
for module_name, cols in modules.items():
    # Calcula a porcentagem de acertos para cada aluno no módulo atual
    df[f'Porcentagem_{module_name}'] = (df[cols].sum(axis=1) / 0.67) / module_sizes[module_name] * 100

    # Calcula as estatísticas (média, mediana, etc.) para o módulo
    mean_val = df[f'Porcentagem_{module_name}'].mean()
    median_val = df[f'Porcentagem_{module_name}'].median()
    std_val = df[f'Porcentagem_{module_name}'].std()
    var_val = df[f'Porcentagem_{module_name}'].var()

    # Adiciona uma nova linha ao DataFrame de resultados
    questionnaire, module_num = module_name.split('_', 1) # Split only on the first underscore
    new_row = pd.DataFrame([{
        'Questionario': questionnaire,
        'Modulo': module_num,
        'Média (%)': mean_val,
        'Mediana (%)': median_val,
        'Desvio Padrão': std_val,
        'Variação': var_val
    }])
    results_df = pd.concat([results_df, new_row], ignore_index=True)

# Formata os valores numéricos para melhor visualização
results_df[['Média (%)', 'Mediana (%)', 'Desvio Padrão', 'Variação']] = results_df[['Média (%)', 'Mediana (%)', 'Desvio Padrão', 'Variação']].round(2)

print('Cálculos por módulo concluídos.')
print('-' * 50)

Iniciando o cálculo das estatísticas por módulo...
Cálculos por módulo concluídos.
--------------------------------------------------


  results_df = pd.concat([results_df, new_row], ignore_index=True)


In [None]:
# =======================================================
# Bloco 4: Exibir os resultados e salvar em Excel
# =======================================================
# Exibe o DataFrame de resultados no console
print('Estatísticas por Módulo de Questões:')
print(results_df.to_string(index=False))

# Define o caminho de saída para o novo arquivo Excel
output_dir = os.path.dirname(caminho_arquivo)
output_file = os.path.join(output_dir, 'Estatisticas_Porcentagem_por_Modulo.xlsx')

# Salva o DataFrame de resultados em um arquivo Excel na mesma pasta
results_df.to_excel(output_file, index=False)

print(f'\nResultados salvos com sucesso em: {output_file}')

Estatísticas por Módulo de Questões:
Questionario   Modulo  Média (%)  Mediana (%)  Desvio Padrão  Variação
          Q2 Modulo_4      81.92        87.50          13.47    181.36
          Q2 Modulo_5      59.64        60.00          24.86    618.05
          Q2 Modulo_3      62.50        66.67          34.27   1174.24
          Q4 Modulo_4      91.29        87.50          10.09    101.82
          Q4 Modulo_5      71.79        80.00          25.23    636.75
          Q4 Modulo_3      77.98       100.00          28.62    819.26

Resultados salvos com sucesso em: /content/drive/MyDrive/Colab Notebooks/Base_Dados/EtapaC_D/Estatisticas_Porcentagem_por_Modulo.xlsx


# Teste T Pareado da porcentagem de acertos questionario 2_4

In [None]:
# =======================================================
# Bloco 3: Calcular as porcentagens de acerto
# =======================================================
# Define as colunas de notas para Q2 e Q4 e o número de questões.
q2_cols = [f'Q. {i} /0,67' for i in range(1, 16)]
q4_cols = [f'Q. {i} /0,67.1' for i in range(1, 16)]
num_questions = 15

# Calcula a porcentagem de acertos para cada aluno em Q2 e Q4.
df['Porcentagem_Q2'] = (df[q2_cols].sum(axis=1) / 0.67) / num_questions * 100
df['Porcentagem_Q4'] = (df[q4_cols].sum(axis=1) / 0.67) / num_questions * 100

print('Porcentagens de acerto calculadas para cada aluno.')
print('-' * 50)


Porcentagens de acerto calculadas para cada aluno.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 4: Executar o Teste T Pareado
# =======================================================
from scipy import stats

# O Teste T Pareado (ttest_rel) compara as médias de duas amostras relacionadas
# (neste caso, as notas dos mesmos alunos em Q2 e Q4) para determinar se a diferença é significativa.
t_statistic, p_value = stats.ttest_rel(df['Porcentagem_Q2'], df['Porcentagem_Q4'])

print('Teste T Pareado executado.')
print('-' * 50)

Teste T Pareado executado.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 5: Exibir e interpretar os resultados
# =======================================================
# Exibe a estatística T e o valor P
print("Resultados do Teste T Pareado:")
print(f"Estatística T: {t_statistic:.2f}")
print(f"Valor P: {p_value:.3f}")

# Define o nível de significância (comummente 0.05)
alpha = 0.05

# Interpretação do resultado com base no valor P
print("\nInterpretação:")
if p_value < alpha:
    print(f"O valor P ({p_value:.3f}) é menor que o nível de significância ({alpha}).")
    print("Conclusão: Há uma diferença estatisticamente significativa entre a porcentagem de acertos em Q2 e Q4.")
else:
    print(f"O valor P ({p_value:.3f}) é maior que o nível de significância ({alpha}).")
    print("Conclusão: Não há uma diferença estatisticamente significativa entre a porcentagem de acertos em Q2 e Q4.")

Resultados do Teste T Pareado:
Estatística T: -4.53
Valor P: 0.000

Interpretação:
O valor P (0.000) é menor que o nível de significância (0.05).
Conclusão: Há uma diferença estatisticamente significativa entre a porcentagem de acertos em Q2 e Q4.


# Teste T Pareado da porcentagem de acertos questionario 2_4 por função

In [None]:
# =======================================================
# Bloco 3: Calcular as porcentagens de acerto
# =======================================================
# Define as colunas de notas para Q2 e Q4 e o número de questões.
q2_cols = [f'Q. {i} /0,67' for i in range(1, 16)]
q4_cols = [f'Q. {i} /0,67.1' for i in range(1, 16)]
num_questions = 15

# Calcula o número de acertos (soma dos valores dividida por 0.67)
df['Acertos_Q2'] = df[q2_cols].sum(axis=1) / 0.67
df['Acertos_Q4'] = df[q4_cols].sum(axis=1) / 0.67

# Converte para porcentagem
df['Porcentagem_Q2'] = (df['Acertos_Q2'] / num_questions) * 100
df['Porcentagem_Q4'] = (df['Acertos_Q4'] / num_questions) * 100

print('Porcentagens de acerto calculadas.')
print('-' * 50)


Porcentagens de acerto calculadas.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 4: Executar o Teste T Pareado por Grupos
# =======================================================
# DataFrame para armazenar os resultados
# Define o nome da coluna de agrupamento (corrigido para garantir a definição)
coluna_grupo = 'Você atua em qual função atualmente?'
results = []
alpha = 0.05 # Nível de significância

# Define a coluna para agrupar
coluna_grupo = 'Você atua em qual função atualmente?'
grupos = df[coluna_grupo].unique()

print('Iniciando Teste T Pareado por Função...')

for group in grupos:
    # Filtra os dados para o grupo atual
    group_df = df[df[coluna_grupo] == group].copy()

    N = len(group_df)

    if N >= 2:
        # Tenta realizar o Teste T Pareado (requer pelo menos 2 observações)
        try:
            # Seleciona as colunas de porcentagem para o teste
            t_statistic, p_value = stats.ttest_rel(group_df['Porcentagem_Q2'], group_df['Porcentagem_Q4'])

            # Determina a conclusão
            if p_value < alpha:
                conclusion = "Diferença significativa"
            else:
                conclusion = "Sem diferença significativa"

            t_stat_str = f'{t_statistic:.2f}'
            p_value_str = f'{p_value:.3f}'

        except Exception:
            # Captura erros se houver NaN, ou falha no cálculo
            t_stat_str = 'Erro de cálculo'
            p_value_str = 'Erro de cálculo'
            conclusion = 'Erro de cálculo'
    else:
        # Caso o grupo tenha amostra insuficiente
        t_stat_str = 'Não aplicável'
        p_value_str = 'Não aplicável'
        conclusion = 'Amostra insuficiente (N<2)'

    # Armazena os resultados, calculando a média aqui para evitar problemas de N=1
    results.append({
        'Função': group,
        'N': N,
        'Média Q2 (%)': group_df['Porcentagem_Q2'].mean(),
        'Média Q4 (%)': group_df['Porcentagem_Q4'].mean(),
        'Estatística T': t_stat_str,
        'Valor P': p_value_str,
        'Conclusão (α=0.05)': conclusion
    })

results_df = pd.DataFrame(results)

print('Teste T Pareado por Função concluído.')
print('-' * 50)

Iniciando Teste T Pareado por Função...
Teste T Pareado por Função concluído.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 5: Exibir os resultados e salvar em Excel
# =======================================================
print('Resultados do Teste T Pareado por Função:')
# Exibe a tabela de resultados no console
print(results_df.to_string(index=False))

# Define o caminho de saída para o novo arquivo Excel
output_dir = os.path.dirname(caminho_arquivo)
output_file = os.path.join(output_dir, 'Teste_T_Pareado_por_Funcao.xlsx')

# Salva o DataFrame de resultados em um arquivo Excel na mesma pasta
results_df.to_excel(output_file, index=False)

print(f'\nResultados salvos com sucesso em: {output_file}')

Resultados do Teste T Pareado por Função:
                            Função  N  Média Q2 (%)  Média Q4 (%) Estatística T       Valor P          Conclusão (α=0.05)
          Técnico(a) de enfermagem 29     70.804598     83.678161         -3.47         0.002     Diferença significativa
                     Enfermeiro(a) 19     75.438596     82.105263         -1.76         0.095 Sem diferença significativa
             Estudante de medicina  3     73.333333     86.666667         -1.73         0.225 Sem diferença significativa
Estudante de técnico de enfermagem  1     60.000000     93.333333 Não aplicável Não aplicável  Amostra insuficiente (N<2)
                         Médico(a)  2     80.000000     90.000000         -0.60         0.656 Sem diferença significativa
           Estudante de enfermagem  2     73.333333     83.333333         -3.00         0.205 Sem diferença significativa

Resultados salvos com sucesso em: /content/drive/MyDrive/Colab Notebooks/Base_Dados/EtapaC_D/Teste_T_Pa

# Teste T Pareado da porcentagem de acertos questionario 2_4 por Módulos

In [None]:
# =======================================================
# Bloco 2: Definir módulos
# =======================================================

# Define os módulos, as colunas de perguntas e o número de questões.
modules_info = {
    'Módulo 4': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(1, 9)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(1, 9)],
        'size': 8
    },
    'Módulo 5': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(9, 14)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(9, 14)],
        'size': 5
    },
    'Módulo 3': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(13, 16)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(13, 16)],
        'size': 3
    }
}
acerto_valor = 0.67
print('Módulos definidos.')
print('-' * 50)


Módulos definidos.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 3: Executar o Teste T Pareado por Módulos
# =======================================================
# Lista para armazenar os resultados
results = []
alpha = 0.05 # Nível de significância

print('Iniciando Teste T Pareado por Módulo...')

for module_name, info in modules_info.items():

    # 1. Calcular a porcentagem de acertos para Q2 e Q4 no módulo

    # Calcula o número de acertos (soma dos valores dividida por 0.67)
    df[f'Acertos_Q2_{module_name}'] = df[info['cols_q2']].sum(axis=1) / acerto_valor
    df[f'Acertos_Q4_{module_name}'] = df[info['cols_q4']].sum(axis=1) / acerto_valor

    # Converte para porcentagem
    percent_q2 = (df[f'Acertos_Q2_{module_name}'] / info['size']) * 100
    percent_q4 = (df[f'Acertos_Q4_{module_name}'] / info['size']) * 100

    # 2. Realizar o Teste T Pareado
    t_statistic, p_value = stats.ttest_rel(percent_q2, percent_q4)

    # 3. Determinar a conclusão
    if p_value < alpha:
        conclusion = "Diferença significativa"
    else:
        conclusion = "Sem diferença significativa"

    # 4. Armazenar os resultados
    results.append({
        'Módulo': module_name,
        'N_Questoes': info['size'],
        'Média Q2 (%)': percent_q2.mean(),
        'Média Q4 (%)': percent_q4.mean(),
        'Estatística T': f'{t_statistic:.2f}',
        'Valor P': f'{p_value:.3f}',
        'Conclusão (α=0.05)': conclusion
    })

results_df = pd.DataFrame(results)

# Formata os valores numéricos para melhor visualização
cols_to_round = ['Média Q2 (%)', 'Média Q4 (%)']
results_df[cols_to_round] = results_df[cols_to_round].round(2)


print('Teste T Pareado por Módulo concluído.')
print('-' * 50)

Iniciando Teste T Pareado por Módulo...
Teste T Pareado por Módulo concluído.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 4: Exibir os resultados e salvar em Excel
# =======================================================
print('Resultados do Teste T Pareado por Módulo:')
# Exibe a tabela de resultados no console
print(results_df.to_string(index=False))

# Define o caminho de saída para o novo arquivo Excel
output_dir = os.path.dirname(caminho_arquivo)
output_file = os.path.join(output_dir, 'Teste_T_Pareado_por_Modulo.xlsx')

# Salva o DataFrame de resultados em um arquivo Excel na mesma pasta
results_df.to_excel(output_file, index=False)

print(f'\nResultados salvos com sucesso em: {output_file}')

Resultados do Teste T Pareado por Módulo:
  Módulo  N_Questoes  Média Q2 (%)  Média Q4 (%) Estatística T Valor P      Conclusão (α=0.05)
Módulo 4           8         81.92         91.29         -4.82   0.000 Diferença significativa
Módulo 5           5         59.64         71.79         -3.01   0.004 Diferença significativa
Módulo 3           3         62.50         77.98         -3.00   0.004 Diferença significativa

Resultados salvos com sucesso em: /content/drive/MyDrive/Colab Notebooks/Base_Dados/EtapaC_D/Teste_T_Pareado_por_Modulo.xlsx


# Teste T Pareado da porcentagem de acertos questionario 2_4 por Módulos é por função

In [None]:
# =======================================================
# Bloco 2: Definir variáveis
# =======================================================


coluna_grupo = 'Você atua em qual função atualmente?'

try:
    # Tenta carregar o arquivo em um DataFrame do pandas
    df = pd.read_csv(caminho_arquivo)
    print('Arquivo carregado com sucesso!')
except FileNotFoundError:
    print(f'Erro: O arquivo não foi encontrado no caminho especificado: {caminho_arquivo}')
    exit()

# Define os módulos, as colunas de perguntas e o número de questões.
modules_info = {
    'Módulo 4': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(1, 9)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(1, 9)],
        'size': 8
    },
    'Módulo 5': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(9, 14)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(9, 14)],
        'size': 5
    },
    'Módulo 3': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(13, 16)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(13, 16)],
        'size': 3
    }
}
acerto_valor = 0.67
alpha = 0.05
print('Variáveis e Módulos definidos.')
print('-' * 50)

Arquivo carregado com sucesso!
Variáveis e Módulos definidos.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 3: Executar o Teste T Pareado por Módulo e Função
# =======================================================
results = []
print('Iniciando Teste T Pareado por Módulo e Função...')

for module_name, info in modules_info.items():

    # 1. Calcular as porcentagens de acerto para o módulo atual (Q2 e Q4)
    percent_q2_col = (df[info['cols_q2']].sum(axis=1) / acerto_valor) / info['size'] * 100
    percent_q4_col = (df[info['cols_q4']].sum(axis=1) / acerto_valor) / info['size'] * 100

    # 2. Agrupar pela função e iterar sobre cada grupo
    grouped = df.groupby(coluna_grupo)

    for group_name, group_df in grouped:
        N = len(group_df)

        # Selecionar as porcentagens específicas do grupo
        group_q2 = percent_q2_col.loc[group_df.index]
        group_q4 = percent_q4_col.loc[group_df.index]

        t_stat_str = 'Não aplicável'
        p_value_str = 'Não aplicável'
        conclusion = 'Amostra insuficiente (N<2)'

        if N >= 2:
            try:
                # Realizar o Teste T Pareado
                t_statistic, p_value = stats.ttest_rel(group_q2, group_q4)

                # Determinar a conclusão
                if p_value < alpha:
                    conclusion = "Diferença significativa"
                else:
                    conclusion = "Sem diferença significativa"

                t_stat_str = f'{t_statistic:.2f}'
                p_value_str = f'{p_value:.3f}'

            except Exception:
                t_stat_str = 'Erro de cálculo'
                p_value_str = 'Erro de cálculo'
                conclusion = 'Erro de cálculo'

        # Armazenar os resultados
        results.append({
            'Módulo': module_name,
            'Função': group_name,
            'N': N,
            'Média Q2 (%)': group_q2.mean(),
            'Média Q4 (%)': group_q4.mean(),
            'Estatística T': t_stat_str,
            'Valor P': p_value_str,
            'Conclusão (α=0.05)': conclusion
        })

results_df = pd.DataFrame(results)

# Formatar as colunas de média para melhor visualização
cols_to_round = ['Média Q2 (%)', 'Média Q4 (%)']
results_df[cols_to_round] = results_df[cols_to_round].round(2)

print('Teste T Pareado por Módulo e Função concluído.')
print('-' * 50)


Iniciando Teste T Pareado por Módulo e Função...
Teste T Pareado por Módulo e Função concluído.
--------------------------------------------------


  return hypotest_fun_in(*args, **kwds)


In [None]:
# =======================================================
# Bloco 4: Exibir os resultados e salvar em Excel
# =======================================================
print('Resultados do Teste T Pareado por Módulo e Função:')
# Exibe a tabela de resultados no console
print(results_df.to_string(index=False))

# Define o caminho de saída para o novo arquivo Excel
output_dir = os.path.dirname(caminho_arquivo)
output_file = os.path.join(output_dir, 'Teste_T_Pareado_por_Modulo_e_Funcao.xlsx')

# Salva o DataFrame de resultados em um arquivo Excel na mesma pasta
results_df.to_excel(output_file, index=False)

print(f'\nResultados salvos com sucesso em: {output_file}')

Resultados do Teste T Pareado por Módulo e Função:
  Módulo                             Função  N  Média Q2 (%)  Média Q4 (%) Estatística T       Valor P          Conclusão (α=0.05)
Módulo 4                      Enfermeiro(a) 19         84.21         89.47         -2.04         0.057 Sem diferença significativa
Módulo 4            Estudante de enfermagem  2         81.25         93.75         -1.00         0.500 Sem diferença significativa
Módulo 4              Estudante de medicina  3         75.00         95.83         -2.50         0.130 Sem diferença significativa
Módulo 4 Estudante de técnico de enfermagem  1         75.00        100.00 Não aplicável Não aplicável  Amostra insuficiente (N<2)
Módulo 4                          Médico(a)  2         87.50        100.00          -inf         0.000     Diferença significativa
Módulo 4           Técnico(a) de enfermagem 29         81.03         90.95         -3.24         0.003     Diferença significativa
Módulo 5                      En

# Média e Desvio Padrão da porcentagem de acertos questionario 2_4 por Módulos é por função

In [None]:
# =======================================================
# Bloco 2: Definir módulos
# =======================================================
coluna_grupo = 'Você atua em qual função atualmente?'
# Define os módulos, as colunas de perguntas e o número de questões.
modules_info = {
    'Módulo 4': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(1, 9)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(1, 9)],
        'size': 8
    },
    'Módulo 5': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(9, 14)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(9, 14)],
        'size': 5
    },
    'Módulo 3': {
        'cols_q2': [f'Q. {i} /0,67' for i in range(13, 16)],
        'cols_q4': [f'Q. {i} /0,67.1' for i in range(13, 16)],
        'size': 3
    }
}
acerto_valor = 0.67
print('Variáveis e Módulos definidos.')
print('-' * 50)



Variáveis e Módulos definidos.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 3: Calcular Média e Desvio Padrão por Módulo e Função
# =======================================================
results = []
print('Iniciando o cálculo de Média e Desvio Padrão...')

for module_name, info in modules_info.items():

    # 1. Calcular as porcentagens de acerto para o módulo atual (Q2 e Q4)
    # Estas colunas temporárias são usadas para o cálculo do agrupamento
    df[f'Porcentagem_Q2_temp'] = (df[info['cols_q2']].sum(axis=1) / acerto_valor) / info['size'] * 100
    df[f'Porcentagem_Q4_temp'] = (df[info['cols_q4']].sum(axis=1) / acerto_valor) / info['size'] * 100

    # 2. Agrupar pela função e calcular as estatísticas
    grouped = df.groupby(coluna_grupo)

    for group_name, group_df in grouped:
        N = len(group_df)

        # Selecionar as porcentagens específicas do grupo
        group_q2 = group_df[f'Porcentagem_Q2_temp']
        group_q4 = group_df[f'Porcentagem_Q4_temp']

        # Calcular Média e Desvio Padrão
        mean_q2 = group_q2.mean()
        std_q2 = group_q2.std()
        mean_q4 = group_q4.mean()
        std_q4 = group_q4.std()

        # Armazenar os resultados
        results.append({
            'Módulo': module_name,
            'Função': group_name,
            'N': N,
            'Média Q2 (%)': mean_q2,
            'Desvio Padrão Q2': std_q2,
            'Média Q4 (%)': mean_q4,
            'Desvio Padrão Q4': std_q4
        })

results_df = pd.DataFrame(results)

# Formatar as colunas numéricas
results_df[['Média Q2 (%)', 'Desvio Padrão Q2', 'Média Q4 (%)', 'Desvio Padrão Q4']] = results_df[['Média Q2 (%)', 'Desvio Padrão Q2', 'Média Q4 (%)', 'Desvio Padrão Q4']].round(2)

print('Cálculos concluídos.')
print('-' * 50)


Iniciando o cálculo de Média e Desvio Padrão...
Cálculos concluídos.
--------------------------------------------------


In [None]:
# =======================================================
# Bloco 4: Exibir os resultados e salvar em Excel
# =======================================================
print('Resultados de Média e Desvio Padrão por Módulo e Função:')
# Exibe a tabela de resultados no console
print(results_df.to_string(index=False))

# Define o caminho de saída para o novo arquivo Excel
output_dir = os.path.dirname(caminho_arquivo)
output_file = os.path.join(output_dir, 'Media_DP_por_Modulo_e_Funcao.xlsx')

# Salva o DataFrame de resultados em um arquivo Excel na mesma pasta
results_df.to_excel(output_file, index=False)

print(f'\nResultados salvos com sucesso em: {output_file}')

Resultados de Média e Desvio Padrão por Módulo e Função:
  Módulo                             Função  N  Média Q2 (%)  Desvio Padrão Q2  Média Q4 (%)  Desvio Padrão Q4
Módulo 4                      Enfermeiro(a) 19         84.21             13.07         89.47              8.60
Módulo 4            Estudante de enfermagem  2         81.25              8.84         93.75              8.84
Módulo 4              Estudante de medicina  3         75.00             12.50         95.83              7.22
Módulo 4 Estudante de técnico de enfermagem  1         75.00               NaN        100.00               NaN
Módulo 4                          Médico(a)  2         87.50              0.00        100.00              0.00
Módulo 4           Técnico(a) de enfermagem 29         81.03             14.80         90.95             11.52
Módulo 5                      Enfermeiro(a) 19         64.21             26.31         70.53             28.57
Módulo 5            Estudante de enfermagem  2         