<a href="https://colab.research.google.com/github/idarlandias/Analise-de-Estatistica-Descritiva/blob/main/Experimentos_Estat%C3%ADsticos_e_Testes_de_Signific%C3%A2ncia.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [5]:
#@title Análise Estatística Detalhada: Comparação de Revistas
#@markdown Este notebook executa os cálculos necessários para verificar as quatro afirmativas
#@markdown sobre os dados de entretenimento das Revistas 1 e 2.

# Importar bibliotecas e carregar os dados
import pandas as pd
import numpy as np
from scipy import stats
from io import StringIO # Usado para ler o texto do CSV como se fosse um arquivo

# Dados do CSV
csv_data = """Revista 1,Revista 2
19,27
28,15
23,20
20,30
22,28
22,23
18,28
19,27
16,20
13,24
"""

# Carregar os dados em um DataFrame do pandas
df = pd.read_csv(StringIO(csv_data))
revista1 = df['Revista 1']
revista2 = df['Revista 2']

print("---- DADOS CARREGADOS ----")
print(df)
print("\n" + "="*60 + "\n")


# Analisar cada afirmativa
print("---- ANÁLISE DAS AFIRMATIVAS ----\n")

#-------------------------------------------------------------------------------
# Afirmativa 1: O erro padrão da média amostral da Revista 1 é maior do que o
# da Revista 2.
#-------------------------------------------------------------------------------
print("➡️ Afirmativa 1: Comparação do Erro Padrão da Média (SEM)")

# O SEM é o desvio padrão dividido pela raiz quadrada do tamanho da amostra.
sem1 = stats.sem(revista1)
sem2 = stats.sem(revista2)

print(f"   - Erro Padrão da Média (Revista 1): {sem1:.3f}")
print(f"   - Erro Padrão da Média (Revista 2): {sem2:.3f}")
print(f"   - Justificativa: O valor {sem1:.3f} (Revista 1) NÃO é maior que {sem2:.3f} (Revista 2).")
print(f"   - ✅ Resposta Correta: Falso\n")
print("-"*60)

#-------------------------------------------------------------------------------
# Afirmativa 2: Ao conduzir um teste para verificar se a média da Revista 1
# é MAIOR que a da Revista 2, estaremos conduzindo um teste de cauda superior.
#-------------------------------------------------------------------------------
print("➡️ Afirmativa 2: Tipo de Teste de Hipótese")
print("   - Esta é uma pergunta conceitual.")
print("   - A hipótese alternativa (Hₐ) que queremos testar é: μ₁ > μ₂.")
print("   - O sinal de 'maior que' (>) indica que estamos interessados apenas na cauda direita (superior) da distribuição.")
print(f"   - ✅ Resposta Correta: Verdadeiro\n")
print("-"*60)

#-------------------------------------------------------------------------------
# Afirmativa 3: Em média, os participantes se sentiram mais entretidos com a
# Revista 2, e essa diferença foi significativa com p < 0.05.
#-------------------------------------------------------------------------------
print("➡️ Afirmativa 3: Comparação de Médias e Significância Estatística")

media1 = np.mean(revista1)
media2 = np.mean(revista2)

print(f"   - Média Amostral (Revista 1): {media1:.1f}")
print(f"   - Média Amostral (Revista 2): {media2:.1f}")
print("   - A média da Revista 2 é de fato maior que a da Revista 1.")
print("\n   - Agora, vamos testar a significância (Hₐ: μ₂ > μ₁ ou μ₁ < μ₂):")

# Usamos ttest_ind com alternative='less' para testar se a média de revista1 é menor que a de revista2
t_stat, p_value = stats.ttest_ind(revista1, revista2, equal_var=True, alternative='less')

print(f"   - Valor-p do teste (unilateral): {p_value:.3f}")
print(f"   - Justificativa: Como o valor-p ({p_value:.3f}) é MAIOR que 0.05, a diferença não é estatisticamente significativa.")
print(f"   - ✅ Resposta Correta: Falso\n")
print("-"*60)

#-------------------------------------------------------------------------------
# Afirmativa 4: A margem de erro para o intervalo de confiança de 95% para a
# diferença das médias é de ± 4.158.
#-------------------------------------------------------------------------------
print("➡️ Afirmativa 4: Cálculo da Margem de Erro")

# Passos para calcular a margem de erro (ME)
n1, n2 = len(revista1), len(revista2)
s1, s2 = np.std(revista1, ddof=1), np.std(revista2, ddof=1)
df_total = n1 + n2 - 2

# a) Desvio padrão combinado (pooled standard deviation)
sp_num = (n1 - 1) * s1**2 + (n2 - 1) * s2**2
sp_den = df_total
sp = np.sqrt(sp_num / sp_den)
print(f"   - Desvio Padrão Combinado (Sp): {sp:.3f}")

# b) Erro padrão da diferença
se_diff = sp * np.sqrt(1/n1 + 1/n2)
print(f"   - Erro Padrão da Diferença (SE_diff): {se_diff:.3f}")

# c) Valor t-crítico
conf_level = 0.95
alpha = 1 - conf_level
t_critico = stats.t.ppf(1 - alpha/2, df=df_total)
print(f"   - Valor t-crítico (para {df_total} graus de liberdade e 95% de confiança): {t_critico:.3f}")

# d) Cálculo final da Margem de Erro
margem_erro = t_critico * se_diff
print(f"\n   - Cálculo: Margem de Erro = {t_critico:.3f} * {se_diff:.3f} = {margem_erro:.4f}")
print(f"   - Valor arredondado para 3 casas decimais: {np.round(margem_erro, 3)}")
print("   - Justificativa: O valor calculado (4.158) corresponde exatamente ao valor da afirmativa.")
print(f"   - ✅ Resposta Correta: Verdadeiro\n")

print("="*60)


---- DADOS CARREGADOS ----
   Revista 1  Revista 2
0         19         27
1         28         15
2         23         20
3         20         30
4         22         28
5         22         23
6         18         28
7         19         27
8         16         20
9         13         24


---- ANÁLISE DAS AFIRMATIVAS ----

➡️ Afirmativa 1: Comparação do Erro Padrão da Média (SEM)
   - Erro Padrão da Média (Revista 1): 1.300
   - Erro Padrão da Média (Revista 2): 1.489
   - Justificativa: O valor 1.300 (Revista 1) NÃO é maior que 1.489 (Revista 2).
   - ✅ Resposta Correta: Falso

------------------------------------------------------------
➡️ Afirmativa 2: Tipo de Teste de Hipótese
   - Esta é uma pergunta conceitual.
   - A hipótese alternativa (Hₐ) que queremos testar é: μ₁ > μ₂.
   - O sinal de 'maior que' (>) indica que estamos interessados apenas na cauda direita (superior) da distribuição.
   - ✅ Resposta Correta: Verdadeiro

----------------------------------------------------