### TESTE T PARA DOIS GRUPOS OU AMOSTRAS INDEPENDENTES - TESTE T AMOSTRAS NÃO EMPARELHADAS - UNPAIRED T TEST

Comparar a média entre dois grupos ou amostras independentes. Amostras independentes (não emparelhadas) são selecionados aleatoriamente de modo que os valores de observações não dependam de valores de outras observações.

#### PREMISSAS:
- Premissa 1: Distribuição Normal 
- Premissa 2: Amostras independentes
- Premissa 3: Variâncias iguais                                                                    

#### HIPÓTESES:

- Ho: médias estatisticamente iguais
- Ha: médias estatisticamente diferentes

#### CRITÉRIOS:

* Se p-value for menor que nível de significância, rejeita-se Ho.

In [1]:
# DESATIVA NOTAÇÃO CIENTÍFICA
options(scipen = 999)

In [2]:
# DESATIVAR MENSAGENS DE WARNINGS (warn = -1) E ATIVAR (warn = 0)
options(warn = -1)

In [3]:
# CARREGAR BIBLIOTECAS
suppressPackageStartupMessages({
library(dplyr)
library(RcmdrMisc)
})

#### CARREGAR DATASET

Dataset com pesos de homens e mulheres.

#### TESTE:
Existe alguma diferença significativa entre os pesos das mulheres e dos homens?

In [4]:
load('mw_weight.Rdata')
dados_peso <- as.data.frame(mw_weight)
glimpse(dados_peso)

Rows: 18
Columns: 2
$ group  <fct> Woman, Woman, Woman, Woman, Woman, Woman, Woman, Woman, Woman, ~
$ weight <dbl> 38.9, 61.2, 73.3, 21.8, 63.4, 64.6, 48.4, 48.8, 48.5, 67.8, 60.~


#### TESTE DE NORMALIDADE

In [5]:
normalityTest(~ weight, test = "shapiro.test", data = dados_peso[dados_peso$group == "Man",])


	Shapiro-Wilk normality test

data:  weight
W = 0.86425, p-value = 0.1066


In [6]:
normalityTest(~ weight, test = "shapiro.test", data = dados_peso[dados_peso$group == "Woman",])


	Shapiro-Wilk normality test

data:  weight
W = 0.94266, p-value = 0.6101


Conforme resultados acima, o p-value foi maior que o nível de significância 0.05. Então conclui-se que a distribuição dos dados não é significamente diferente da distribuição normal. A hipótese alternativa Ha foi rejeitada.

Se os dados não forem distribuídos normalmente, é recomendável usar outro teste de duas amostras não paramétrico.

#### TESTE F

In [7]:
nivel_confianca <- 0.95
Teste_F2 <- var.test(weight ~ group, alternative = "two.sided", conf.level = nivel_confianca, data = dados_peso)
Teste_F2


	F test to compare two variances

data:  weight by group
F = 0.36134, num df = 8, denom df = 8, p-value = 0.1714
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.08150656 1.60191315
sample estimates:
ratio of variances 
         0.3613398 


Resultados:
F Calculado: 0.36134
Intervalo de Confiança: [ 0.08150656 ; 1.601913 ]
Valor F Tabelado Superior: 3.438101
Valor F Tabelado Inferior: 0.290858

Conforme o teste, percebe-se que a verdadeira razão entre as variâncias é igual a 1. Logo não rejeita-se Ho, 
pois as variâncias são iguais estatisticamente, com 95 % de confiança.

Portanto, podemos usar o teste t-student clássico que assume a igualdade das duas variâncias.

#### TESTE T 

In [8]:
nivel_confianca <- 0.95
nivel_significancia <- 0.05

Teste_t2 <- t.test(weight ~ group, data = dados_peso, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
Teste_t2


	Two Sample t-test

data:  weight by group
t = 2.7842, df = 16, p-value = 0.01327
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  4.029759 29.748019
sample estimates:
  mean in group Man mean in group Woman 
           68.98889            52.10000 


Resultados:
t Calculado: 2.7842
Intervalo de Confiança: [ 4.029759 ; 29.74802 ]
t tabelado: [ -2.12 ; 2.12 ]

Conforme o teste, percebe-se que a verdadeira diferença entre as medias não é igual a 0. Logo rejeita-se Ho, pois 
as médias são diferentes estatisticamente, com 95 % de confiança.

#### TESTE T - FÓRMULA

In [None]:
nivel_confianca <- 0.95
nivel_significancia <- 0.05

t_tabelado = round(qt(1-(nivel_significancia/2), df = Teste_t2$parameter),2)

cat("Resultados:")
cat("\nt Calculado:", round(Teste_t2$statistic, 4))
cat("\nIntervalo de Confiança: [", round(Teste_t2$conf.int[1], 8),";", round(Teste_t2$conf.int[2], 8),"]")
cat("\nt tabelado: [", -t_tabelado,";", t_tabelado,"]")

if ((Teste_t2$statistic >= (-t_tabelado)) & (Teste_t2$statistic <= t_tabelado)){
    cat("\n\nConforme o teste, percebe-se que a verdadeira diferença entre as médias é igual a 0. Logo não rejeita-se Ho, 
pois as médias são iguais estatisticamente, com",nivel_confianca*100,"% de confiança.")
} else{
    cat("\n\nConforme o teste, percebe-se que a verdadeira diferença entre as medias não é igual a 0. Logo rejeita-se Ho, pois 
as médias são diferentes estatisticamente, com",nivel_confianca*100,"% de confiança.")
    
}