# **üìä Testes Param√©tricos: O que s√£o, quando usar e aplica√ß√µes pr√°ticas**

## **‚úÖ Introdu√ß√£o**

<p align="justify">
Os testes param√©tricos s√£o procedimentos estat√≠sticos utilizados para realizar infer√™ncias sobre os dados quando certas premissas s√£o atendidas ‚Äî principalmente a de que os dados seguem uma distribui√ß√£o normal e apresentam homogeneidade de vari√¢ncias.

<p align="justify">
S√£o considerados mais poderosos que os testes n√£o param√©tricos, pois aproveitam ao m√°ximo as informa√ß√µes contidas nos dados. Por isso, s√£o amplamente usados nas √°reas de sa√∫de, ci√™ncias sociais, engenharia e neg√≥cios para tomar decis√µes baseadas em evid√™ncias.

**üéØ Objetivo deste material:**

* Apresentar os principais testes param√©tricos;

* Explicar o que s√£o, quando utilizar e suas hip√≥teses;

* Demonstrar a aplica√ß√£o pr√°tica com exemplos reais utilizando Python.

**‚úÖ Categorias de Testes Param√©tricos Abordadas:**

1. Testes para compara√ß√£o de m√©dias

2. Testes para verifica√ß√£o de normalidade

3. Testes para vari√¢ncia e homogeneidade

## **‚úÖ 1. Testes para Compara√ß√£o de M√©dias**

Quando queremos comparar grupos para saber se h√° diferen√ßa significativa nas m√©dias, recorremos a esses testes.

### **üîπ Teste t de Student**

O cl√°ssico e mais conhecido dos testes param√©tricos, o teste t de Student permite comparar m√©dias de uma ou mais amostras.

Existem tr√™s varia√ß√µes importantes:

#### **‚û°Ô∏è Teste t para uma amostra**

**O que √©?**

√â um teste estat√≠stico que avalia se a m√©dia de uma amostra √© estatisticamente diferente de um valor conhecido ou te√≥rico. Ele ajuda a verificar se uma determinada caracter√≠stica medida em um grupo pode ser generalizada ou se ocorreu apenas por acaso.

**Quando usar?**

Quando quiser saber se a m√©dia de um grupo est√° diferente de um valor esperado.

**Exemplo:**

* Comparar o rendimento m√©dio de um time com a meta estipulada.
* Verificar se o colesterol m√©dio de uma popula√ß√£o est√° dentro ou fora do recomendado pela OMS.

**Hip√≥teses:**

* H‚ÇÄ: a m√©dia da amostra √© igual ao valor de refer√™ncia.
* H‚ÇÅ: a m√©dia da amostra √© diferente do valor de refer√™ncia.

In [None]:
# Exemplo Pr√°tico

## Carregando bibliotecas
import numpy as np
from scipy.stats import ttest_1samp

## Fixando semente e gerando dados
np.random.seed(0)
dados = np.random.normal(50, 10, 30)

## Aplicando o teste
stat, p = ttest_1samp(dados, popmean = 55)

## Exibindo o resultado
print(f'p-valor: {p:.4f}')

p-valor: 0.7781


**Conclus√£o:**

<p align="justify">
O Teste t para uma amostra resultou em um p-valor de 0.7781. Considerando um n√≠vel de signific√¢ncia de 0.05, como o p-valor obtido √© maior que esse limite, n√£o rejeitamos a hip√≥tese nula. Assim, n√£o h√° evid√™ncias suficientes para afirmar que a m√©dia da amostra difere do valor de refer√™ncia de 55. Portanto, com base nos dados analisados, a m√©dia pode ser considerada estatisticamente igual ao valor proposto.

#### **‚û°Ô∏è Teste t para duas amostras independentes**

**O que √©?**

√â um teste estat√≠stico que avalia se existe uma diferen√ßa significativa entre as m√©dias de dois grupos que n√£o possuem qualquer rela√ß√£o ou depend√™ncia entre si. Esse teste considera que as vari√¢ncias dos grupos podem ou n√£o ser iguais, conforme verificado previamente.

**Quando usar?**

Quando se deseja comparar o desempenho, comportamento ou caracter√≠sticas de dois grupos distintos e independentes. Por exemplo:

* Comparar a produtividade de duas equipes que atuam em setores diferentes.
* Verificar se homens e mulheres apresentam m√©dias diferentes de IMC (√çndice de Massa Corporal).

**Hip√≥teses:**

* H‚ÇÄ: as m√©dias s√£o iguais.
* H‚ÇÅ: as m√©dias s√£o diferentes.

In [None]:
# Exemplo Pr√°tico

## Carregando biblioteca
from scipy.stats import ttest_ind

## Gerando grupos de dados
grupo1 = np.random.normal(100, 15, 30)
grupo2 = np.random.normal(110, 15, 30)

## Aplicando o teste
stat, p = ttest_ind(grupo1, grupo2)

## Exibindo resultado
print(f'p-valor: {p:.4f}')

p-valor: 0.0013


**Conclus√£o:**

<p align="justify">
O Teste t para duas amostras independentes resultou em um p-valor de 0.0013. Considerando um n√≠vel de signific√¢ncia de 0.05, como o p-valor obtido √© menor que esse limite, rejeitamos a hip√≥tese nula. Assim, h√° evid√™ncias suficientes para afirmar que as m√©dias dos dois grupos s√£o significativamente diferentes. Portanto, com base nos dados analisados, podemos concluir que existe uma diferen√ßa estat√≠stica entre os grupos comparados.

#### **‚û°Ô∏è Teste t pareado (para amostras dependentes)**

**O que √©?**

√â um teste estat√≠stico que compara as m√©dias de duas medi√ß√µes relacionadas, verificando se houve diferen√ßa significativa entre elas. Muito usado em cen√°rios de "antes e depois", onde as mesmas unidades (pessoas, objetos ou sistemas) s√£o avaliadas em dois momentos ou condi√ß√µes.

**Quando usar?**

Quando se quer avaliar mudan√ßas causadas por uma interven√ß√£o ou tratamento sobre o mesmo grupo ou elemento. Exemplo:

* Avaliar o efeito de um treinamento no desempenho dos funcion√°rios comparando notas antes e depois.
* Testar a efic√°cia de um medicamento medindo a press√£o arterial antes e ap√≥s o uso.

**Hip√≥teses:**

* H‚ÇÄ: n√£o h√° diferen√ßa entre as m√©dias das duas medi√ß√µes (efeito nulo).
* H‚ÇÅ: h√° uma diferen√ßa significativa entre as m√©dias (efeito presente).



In [None]:
# Exemplo Pr√°tico

## Carregando biblioteca
from scipy.stats import ttest_rel

## Gerando dados
antes = np.random.normal(120, 10, 30)
depois = antes + np.random.normal(0, 5, 30)

## Aplicando teste
stat, p = ttest_rel(antes, depois)

## Imprimindo resultado
print(f'p-valor: {p:.4f}')

p-valor: 0.5739


**Conclus√£o:**

<p align="justify">
O Teste t pareado resultou em um p-valor de 0.5739. Considerando um n√≠vel de signific√¢ncia de 0.05, como o p-valor obtido √© maior que esse limite, n√£o rejeitamos a hip√≥tese nula. Assim, n√£o h√° evid√™ncias suficientes para afirmar que h√° uma diferen√ßa significativa entre as m√©dias das medi√ß√µes antes e depois. Portanto, com base nos dados analisados, podemos concluir que n√£o foi identificada uma diferen√ßa estatisticamente significativa entre as duas condi√ß√µes comparadas.

### **üîπ ANOVA (An√°lise de Vari√¢ncia)**

Quando se deseja comparar mais de dois grupos, o teste t n√£o √© mais suficiente. Para isso, usamos a ANOVA.

#### **‚û°Ô∏è ANOVA One-Way**

**O que √©?**

√â uma an√°lise estat√≠stica que verifica se existe diferen√ßa significativa entre as m√©dias de tr√™s ou mais grupos independentes. Ao inv√©s de realizar m√∫ltiplos testes t (o que aumentaria o risco de erro), a ANOVA concentra tudo em uma √∫nica an√°lise, indicando se ao menos um grupo se diferencia dos demais.

**Quando usar?**

Quando se deseja comparar mais de dois grupos que n√£o possuem rela√ß√£o entre si. Exemplos:

* Comparar o desempenho de v√°rias turmas escolares em uma mesma prova.
* Avaliar a efic√°cia de diferentes tratamentos m√©dicos aplicados a grupos distintos de pacientes.

**Hip√≥teses:**

* H‚ÇÄ: todas as m√©dias populacionais s√£o iguais (n√£o h√° diferen√ßa significativa).
* H‚ÇÅ: ao menos uma das m√©dias √© diferente das demais.

In [None]:
# Exemplo Pr√°tico

## Carregando biblioteca
from scipy.stats import f_oneway

## Gerando grupos de dados
grupoA = np.random.normal(50, 5, 30)
grupoB = np.random.normal(55, 5, 30)
grupoC = np.random.normal(60, 5, 30)

## Aplicando o teste
stat, p = f_oneway(grupoA, grupoB, grupoC)

## Imprimindo resultado
print(f'p-valor: {p:.4f}')

p-valor: 0.0000


**Conclus√£o:**

<p align="justify">
O Teste ANOVA (An√°lise de Vari√¢ncia) resultou em um p-valor de 0.0000. Considerando um n√≠vel de signific√¢ncia de 0.05, como o p-valor obtido √© menor que esse limite, rejeitamos a hip√≥tese nula. Assim, h√° evid√™ncias suficientes para afirmar que pelo menos uma das m√©dias dos grupos analisados √© significativamente diferente. Portanto, com base nos dados, podemos concluir que existe uma diferen√ßa estatisticamente significativa entre as m√©dias dos grupos comparados.

### **‚û°Ô∏è ANOVA Two-Way**

**O que √©?**

√â uma t√©cnica estat√≠stica que investiga o impacto simult√¢neo de dois fatores (ou vari√°veis independentes) sobre uma vari√°vel dependente. Al√©m de analisar os efeitos isolados de cada fator, tamb√©m verifica se h√° intera√ß√£o entre eles ‚Äî ou seja, se a combina√ß√£o dos fatores produz um efeito diferente do que cada um causaria isoladamente.

**Quando usar?**

Quando se deseja compreender como dois aspectos influenciam um resultado, separadamente e em conjunto. Exemplo:

* Estudar o impacto de dieta e exerc√≠cio f√≠sico na perda de peso.
* Avaliar o efeito de duas metodologias de ensino em diferentes turmas escolares.

**Hip√≥teses:**

* H‚ÇÄ: n√£o h√° efeito significativo de nenhum dos fatores nem da intera√ß√£o entre eles.
* H‚ÇÅ: h√° efeito significativo de pelo menos um fator ou da intera√ß√£o.

In [None]:
# Exemplo Pr√°tico

## Carregando bibliotecas
import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import ols

## Construindo DataFrame
df = pd.DataFrame({
    'fator1': np.repeat(['A', 'B'], 30),
    'fator2': np.tile(['X', 'Y'], 30),
    'resposta': np.random.normal(50, 10, 60)
})

## Aplicando teste
modelo = ols('resposta ~ C(fator1) * C(fator2)', data = df).fit()
anova_twoway = sm.stats.anova_lm(modelo, typ = 2)

## Imprimindo resultado
print(anova_twoway)

                          sum_sq    df         F    PR(>F)
C(fator1)             377.657558   1.0  3.747750  0.057933
C(fator2)              63.178663   1.0  0.626964  0.431812
C(fator1):C(fator2)    21.400242   1.0  0.212369  0.646702
Residual             5643.071771  56.0       NaN       NaN


**Conclus√£o:**

O Teste ANOVA Two-way apresentou os seguintes resultados:

* Para o fator 1, o p-valor foi de 0.0579;

* Para o fator 2, o p-valor foi de 0.4318;

* Para a intera√ß√£o entre os fatores, o p-valor foi de 0.6467.

Considerando um n√≠vel de signific√¢ncia de 0.05:

* Para o fator 1: o p-valor √© maior que 0.05, portanto n√£o rejeitamos a hip√≥tese nula. N√£o h√° evid√™ncias suficientes para afirmar que o fator 1 tem efeito significativo sobre a vari√°vel resposta.

* Para o fator 2: o p-valor tamb√©m √© maior que 0.05, logo n√£o rejeitamos a hip√≥tese nula. N√£o h√° evid√™ncias de que o fator 2 tenha efeito significativo.

* Para a intera√ß√£o: o p-valor novamente √© maior que 0.05, indicando que n√£o h√° evid√™ncias suficientes de intera√ß√£o significativa entre os fatores.

Assim, com base nos dados analisados, n√£o foram encontradas diferen√ßas estatisticamente significativas associadas aos fatores ou √† intera√ß√£o entre eles.

### **‚úÖ 2. Testes de Normalidade**

Antes de aplicar testes param√©tricos, √© essencial verificar se os dados seguem distribui√ß√£o normal.

#### **üîπ Teste de Shapiro-Wilk**

**O que √©?**

√â um dos testes estat√≠sticos mais utilizados para verificar se uma amostra de dados segue uma distribui√ß√£o normal. Ele avalia a ader√™ncia dos dados √† curva normal, sendo especialmente recomendado para amostras pequenas a moderadas.

**Quando usar?**

Sempre que for necess√°rio verificar a suposi√ß√£o de normalidade antes de aplicar testes param√©tricos, como o teste t ou a ANOVA. Exemplo:

* Checar se os tempos de rea√ß√£o seguem distribui√ß√£o normal antes de aplicar um teste t.
* Validar a normalidade de notas escolares antes de realizar uma ANOVA.

**Hip√≥teses:**

* H‚ÇÄ: os dados seguem uma distribui√ß√£o normal.
* H‚ÇÅ: os dados n√£o seguem uma distribui√ß√£o normal.

In [None]:
# Exemplo Pr√°tico

## Carregando biblioteca
from scipy.stats import shapiro

## Aplicando teste
stat, p = shapiro(dados)

## Imprimindo resultado
print(f'p-valor: {p:.4f}')

p-valor: 0.5254


**Conclus√£o:**

<p align="justify">
O Teste de Shapiro-Wilk resultou em um p-valor de 0.5254. Considerando um n√≠vel de signific√¢ncia de 0.05, como o p-valor obtido √© maior que esse limite, n√£o rejeitamos a hip√≥tese nula. Assim, n√£o h√° evid√™ncias suficientes para afirmar que a amostra n√£o segue uma distribui√ß√£o normal, ou seja, os dados podem ser considerados normalmente distribu√≠dos.

#### **üîπ Teste de Anderson-Darling**

**O que √©?**

√â um teste estat√≠stico robusto para avaliar se uma amostra segue uma distribui√ß√£o espec√≠fica, geralmente a normal. Diferente de outros testes, ele d√° mais peso √†s caudas da distribui√ß√£o, tornando-se sens√≠vel a desvios nessas regi√µes.

**Quando usar?**

Quando se deseja uma avalia√ß√£o mais rigorosa da normalidade, especialmente em an√°lises onde desvios nas extremidades dos dados podem impactar os resultados.* Exemplo:

* Verificar se os res√≠duos de um modelo seguem distribui√ß√£o normal.
* Checar normalidade em estudos financeiros, onde caudas extremas s√£o importantes.

Hip√≥teses:

* H‚ÇÄ: os dados seguem a distribui√ß√£o especificada (normal, na maioria dos casos).
* H‚ÇÅ: os dados n√£o seguem a distribui√ß√£o especificada.

In [None]:
# Exemplo Pr√°tico

## Carregando biblioteca
from scipy.stats import anderson

## Aplicando teste
result = anderson(dados)

## Imprimindo resultado
print(f'Estat√≠stica: {result.statistic:.4f}')
print('Cr√≠ticos:', result.critical_values)

Estat√≠stica: 0.2627
Cr√≠ticos: [0.521 0.593 0.712 0.83  0.988]


**Conclus√£o:**

<p align="justify">
O Teste de Anderson-Darling resultou em uma estat√≠stica de 0.2627, enquanto os valores cr√≠ticos para os n√≠veis de signific√¢ncia comuns s√£o [0.521, 0.593, 0.712, 0.83, 0.988]. Como a estat√≠stica obtida √© menor que o valor cr√≠tico para o n√≠vel de 0.05 (0.712), n√£o rejeitamos a hip√≥tese nula. Dessa forma, n√£o h√° evid√™ncias suficientes para afirmar que a amostra n√£o segue uma distribui√ß√£o normal, ou seja, os dados podem ser considerados normalmente distribu√≠dos.

### **‚úÖ 3. Testes para Vari√¢ncia e Homogeneidade**

Outra premissa importante para testes param√©tricos √© a homogeneidade das vari√¢ncias entre grupos.

#### **üîπ Teste F para igualdade de vari√¢ncias**

**O que √©?**

√â um teste estat√≠stico que compara as vari√¢ncias de dois grupos, verificando se elas podem ser consideradas estatisticamente iguais. Ele √© frequentemente utilizado como pr√©-requisito antes de testes que assumem homogeneidade de vari√¢ncia, como o teste t para duas amostras independentes.*

**Quando usar?**

Quando √© necess√°rio verificar se dois grupos apresentam a mesma variabilidade.* Exemplos:

* Antes de aplicar um teste t para duas amostras independentes.
* Ao comparar a consist√™ncia de desempenho entre dois times ou produtos.

**Hip√≥teses:**

* H‚ÇÄ: as vari√¢ncias dos dois grupos s√£o iguais.
* H‚ÇÅ: as vari√¢ncias dos dois grupos s√£o diferentes.

In [None]:
# Exemplo Pr√°tico

## Gerando dados
var1 = np.var(grupo1, ddof=1)
var2 = np.var(grupo2, ddof=1)

## Calculando valor de F
F = var1 / var2

## Imprimindo resultado
print(f'Estat√≠stica F: {F:.4f}')

Estat√≠stica F: 0.8975


**Conclus√£o:**

<p align="justify">
O c√°lculo da estat√≠stica F para compara√ß√£o das vari√¢ncias dos dois grupos resultou em 0.8975. Considerando que valores pr√≥ximos de 1 indicam vari√¢ncias semelhantes entre os grupos, este resultado sugere que n√£o h√° diferen√ßa significativa entre as vari√¢ncias das amostras analisadas.


#### **üîπ Teste de Levene**

**O que √©?**

√â um teste estat√≠stico que avalia se diferentes grupos possuem vari√¢ncias iguais (homocedasticidade). √â mais robusto do que o Teste F, pois √© menos sens√≠vel √† viola√ß√£o da suposi√ß√£o de normalidade.

**Quando usar?**

Antes de realizar testes que assumem homogeneidade de vari√¢ncia, especialmente quando h√° suspeita de que os dados n√£o sejam normalmente distribu√≠dos. Exemplos:

* Comparar a variabilidade do desempenho entre v√°rias equipes.
* Avaliar se tratamentos diferentes t√™m a mesma dispers√£o de efeitos.

**Hip√≥teses:**

* H‚ÇÄ: as vari√¢ncias dos grupos s√£o iguais.
* H‚ÇÅ: as vari√¢ncias dos grupos s√£o diferentes.

In [None]:
# Exemplo Pr√°tico

## Carregando biblioteca
from scipy.stats import levene

## Aplicando teste
_, p = levene(grupo1, grupo2)

## Imprimindo resultado
print(f'p-valor: {p:.4f}')

p-valor: 0.4982


**Conclus√£o:**

<p align="justify">
O teste de Levene para igualdade de vari√¢ncias resultou em um p-valor de 0.4982. Considerando um n√≠vel de signific√¢ncia de 0.05, como o p-valor obtido √© maior que esse limite, n√£o rejeitamos a hip√≥tese nula. Assim, n√£o h√° evid√™ncias suficientes para afirmar que as vari√¢ncias dos grupos s√£o diferentes, indicando que as vari√¢ncias podem ser consideradas homog√™neas.

# **‚úÖ Considera√ß√µes Finais**

‚úÖ Os testes param√©tricos s√£o ferramentas fundamentais para quem quer realizar an√°lises estat√≠sticas com rigor.

‚úÖ Eles oferecem maior poder estat√≠stico, mas exigem que as premissas sejam respeitadas: normalidade, homocedasticidade e independ√™ncia.

‚úÖ Sempre que poss√≠vel, complemente sua an√°lise com gr√°ficos (histogramas, boxplots) e os testes.

üìå Lembre-se: se as premissas n√£o forem atendidas, opte por testes n√£o param√©tricos, como Mann-Whitney, Wilcoxon ou Kruskal-Wallis.

---
**Autor:** Rivaldo Correia Santos J√∫nior

**LinkedIn:** [https://www.linkedin.com/in/rivaldo-correia/]