In [3]:
import numpy as np
import pandas as pd

# Dados fictícios de tempo de reação (em segundos) de 20 indivíduos
df = pd.read_csv('C:\\01-FaculdadeSemestreAtual\\Modelos_Lineares\\Aulas\\anova.csv', sep=';')

In [5]:
df.head()

Unnamed: 0,Individuo,Tempo de reacao (ms),Genero (M/F),Idade (anos),Acuidade Visual (%)
0,1,96,M,20,90
1,2,92,F,20,100
2,3,106,M,20,80
3,4,100,F,20,90
4,5,98,F,25,100


In [6]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 5 columns):
 #   Column                Non-Null Count  Dtype 
---  ------                --------------  ----- 
 0   Individuo             20 non-null     int64 
 1   Tempo de reacao (ms)  20 non-null     int64 
 2   Genero (M/F)          20 non-null     object
 3   Idade (anos)          20 non-null     int64 
 4   Acuidade Visual (%)   20 non-null     int64 
dtypes: int64(4), object(1)
memory usage: 932.0+ bytes


In [9]:

# Definir as faixas etárias
faixa1 = df[df['Idade (anos)'] < 25]
faixa2 = df[(df['Idade (anos)'] >= 25) & (df['Idade (anos)'] <= 35)]
faixa3 = df[df['Idade (anos)'] > 35]

# Função para calcular média, desvio-padrão e SSE
def calcular_parametros(df):
    media = np.mean(df['Tempo de reacao (ms)'])
    desvio_padrao = np.std(df['Tempo de reacao (ms)'], ddof=1)
    sse = np.sum((df['Tempo de reacao (ms)'] - media) ** 2)
    return media, desvio_padrao, sse

# Calcular para cada faixa etária
media1, desvio1, sse1 = calcular_parametros(faixa1)
media2, desvio2, sse2 = calcular_parametros(faixa2)
media3, desvio3, sse3 = calcular_parametros(faixa3)

# Calcular o total
media_total = np.mean(df['Tempo de reacao (ms)'])
sse_total = np.sum((df['Tempo de reacao (ms)'] - media_total) ** 2)

# Construir a Tabela ANOVA
n_faixa1 = len(faixa1)
n_faixa2 = len(faixa2)
n_faixa3 = len(faixa3)
n_total = len(df)

# Variância entre grupos
sse_grupos = (n_faixa1 * (media1 - media_total) ** 2 +
              n_faixa2 * (media2 - media_total) ** 2 +
              n_faixa3 * (media3 - media_total) ** 2)

# Total SSE e SSE explicada
sse_explicada = sse_total - sse1 - sse2 - sse3

# Quadro Comparativo
print(f"Quadro Comparativo:")
print(f"{'Faixa Etária':<20} {'Média':<10} {'Desvio-Padrão':<15} {'SSE':<15}")
print(f"{'Menos de 25 anos':<20} {media1:<10.2f} {desvio1:<15.2f} {sse1:<15.2f}")
print(f"{'25 a 35 anos':<20} {media2:<10.2f} {desvio2:<15.2f} {sse2:<15.2f}")
print(f"{'Mais de 35 anos':<20} {media3:<10.2f} {desvio3:<15.2f} {sse3:<15.2f}")

# Tabela ANOVA
print(f"\nTabela ANOVA:")
print(f"{'Fonte de Variação':<20} {'Soma dos Quadrados':<20} {'Graus de Liberdade':<20} {'Quadrado Médio':<20} {'F-Valor':<20}")
print(f"{'Entre Grupos':<20} {sse_grupos:<20.2f} {3-1:<20} {sse_grupos / (3-1):<20.2f} {sse_grupos / (3-1) / (sse_total / (n_total-3)):<20.2f}")
print(f"{'Dentro dos Grupos':<20} {sse_total - sse_grupos:<20.2f} {n_total - 3:<20} {(sse_total - sse_grupos) / (n_total - 3):<20.2f}")
print(f"{'Total':<20} {sse_total:<20.2f} {n_total-1:<20}")

# Análise de Melhoria
print(f"\nAnálise de Melhoria:")
print(f"Soma dos Quadrados dos Erros (SSE) do modelo básico: {sse_total:.2f}")
print(f"Soma dos Quadrados dos Erros (SSE) com faixas etárias: {sse_explicada:.2f}")
print(f"Redução no SSE ao considerar faixas etárias: {sse_total - sse_explicada:.2f}")


Quadro Comparativo:
Faixa Etária         Média      Desvio-Padrão   SSE            
Menos de 25 anos     98.50      5.97            107.00         
25 a 35 anos         107.25     6.18            420.25         
Mais de 35 anos      117.25     6.85            140.75         

Tabela ANOVA:
Fonte de Variação    Soma dos Quadrados   Graus de Liberdade   Quadrado Médio       F-Valor             
Entre Grupos         705.00               2                    352.50               4.36                
Dentro dos Grupos    668.00               17                   39.29               
Total                1373.00              19                  

Análise de Melhoria:
Soma dos Quadrados dos Erros (SSE) do modelo básico: 1373.00
Soma dos Quadrados dos Erros (SSE) com faixas etárias: 705.00
Redução no SSE ao considerar faixas etárias: 668.00
