<a href="https://colab.research.google.com/github/JosenildoJunior/StatPyDataScience/blob/main/Testes_n%C3%A3o_param%C3%A9tricos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **O que são testes não paramétricos**

Um teste não paramétrico é um tipo de teste estatístico que não faz suposições sobre a distribuição subjacente dos dados. Em outras palavras, eles não requerem que os dados sejam normalmente distribuídos.

Esses testes são úteis em várias situações, incluindo:

- Quando os dados são de natureza ordinal, ou seja, podem ser ordenados, mas não se sabe a distância entre os valores.
- Quando os dados são categóricos ou nominais.
- Quando há violações das suposições dos testes paramétricos, como a normalidade ou a homogeneidade de variâncias.
- Quando se deseja realizar inferências sobre a mediana, em vez da média, dos dados.

Agora vamos observar alguns exemplos de testes não paramétricos.

## **Teste de Wilcoxon**

O teste de Wilcoxon, também conhecido como teste de Wilcoxon de sinais ou teste de Wilcoxon de pares, é comumente usado para comparar duas amostras pareadas ou relacionadas.

- Comparação de duas amostras pareadas

- Quando os dados não são distribuídos normalmente

- Pequenas amostras

Nesse teste as hipoteses assumem as seguintes formas:

- Hipótese nula: Não há diferença entre as duas populações
- Hipótese alternativa: Existe uma diferença nas populações.

Dito isso vamos observar um exemplo de aplicação desse teste


**Exercício:**
Você está conduzindo um experimento para determinar se um novo método de ensino melhora o desempenho dos alunos em um teste de matemática. Você coletou as notas de 15 alunos em um teste antes de aplicar o novo método (amostra1) e, em seguida, as notas desses mesmos alunos em um teste semelhante após a aplicação do novo método (amostra2). Use o teste de Wilcoxon para determinar se há uma diferença significativa nas notas dos alunos antes e depois da aplicação do novo método de ensino.

- Valores das notas dos alunos no primeiro teste (amostra1):
[60, 65, 70, 55, 68, 72, 58, 64, 75, 62, 70, 68, 72, 69, 66]

- Valores das notas dos mesmos alunos no segundo teste (amostra2):
[65, 70, 75, 58, 70, 78, 60, 68, 80, 66, 75, 72, 77, 72, 68]

Resposta: Vamos aplicar o teste de Wilcoxon. Como já havíamos visto, as hipóteses por padrão vão assumir as seguintes formas:

- H0: Não existe diferença entre as duas populações.

- Ha: Existe diferença entre as duas populações.

Dito isso, vamos seguir adiante para a importação dos recursos necessários.

In [None]:
# Funções matématicas
import numpy as np

# Importando o teste de wilcoxon
from scipy.stats import wilcoxon

Agora vamos para a aplicação do teste.

In [None]:
# Definindo as notas do primeiro teste
notas_teste1 = np.array([60, 65, 70, 55, 68, 72, 58, 64, 75, 62, 70, 68, 72, 69, 66])

# Definindo as notas do segundo teste
notas_teste2 = np.array([65, 70, 75, 58, 70, 78, 60, 68, 80, 66, 75, 72, 77, 72, 68])

# Aplicando o teste de Wilcoxon
stat, p_valor = wilcoxon(notas_teste1, notas_teste2)

# Exibindo os resultados
print("Estatística do teste de Wilcoxon:", stat)
print("Valor p:", p_valor)

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_valor < alpha:
    print("\nRejeitar H0: Há evidências suficientes para concluir que existe diferenças entre as populações.")
else:
    print("Falha em rejeitar H0: Não há evidências suficientes para concluir que existe diferenças entre as populações.")

Estatística do teste de Wilcoxon: 0.0
Valor p: 6.103515625e-05

Rejeitar H0: Há evidências suficientes para concluir que existe diferenças entre as populações.


Após aplicarmos nosso teste de Wilcoxon utilizando um nível de significância de 0.05, rejeitamos a hipótese nula. Logo, podemos concluir que existem evidências de que as populações apresentam diferenças, ou seja, há diferenças entre as notas dos alunos após a aplicação do novo método.

## **Teste de Mann-Whitney**

O teste U de Mann-Whitney é a contrapartida não paramétrica do teste t
para amostras independentes

Quando utilizar o teste de Mann-Whitney:

- Comparação de duas amostras independentes

- Quando os dados não são distribuídos normalmente

- Escalas ordinais ou categóricas

- Amostras pequenas ou grandes

- Quando você precisa de uma alternativa não paramétrica

Nesses testes as hipoteses assumem a seguinte forma:

- Hipótese nula: Não há diferença entre as duas populações
- Hipótese alternativa: Existe uma diferença nas populações.

Dito isso vamos observar uma aplicação desse teste

**Exercício:**
Suponha que você seja um pesquisador estudando o efeito de dois diferentes tratamentos em pacientes com dor crônica nas costas. Você coletou os níveis de dor relatados por 20 pacientes que receberam o tratamento A (amostra1) e os níveis de dor relatados por 20 pacientes diferentes que receberam o tratamento B (amostra2). Sua tarefa é aplicar o teste de Mann-Whitney para determinar se há uma diferença significativa nos níveis de dor entre os dois tratamentos.

Os dados para as duas amostras são os seguintes:

- Amostra 1 (tratamento A): [5, 6, 7, 8, 4, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 4, 6, 7, 8]
- Amostra 2 (tratamento B): [3, 4, 5, 6, 3, 4, 5, 6, 3, 4, 5, 6, 3, 4, 5, 6, 3, 4, 5, 6]

Resposta: Como este é um teste Mann-Whitney, podemos definir nossas hipóteses da seguinte forma:

- H0: Amostra 1 = Amostra 2
- Ha: Amostra 1 ≠ Amostra 2

Dito isso, vamos começar realizando as importações necessárias.

In [17]:
# Importando o teste de Mann-whitney
from scipy.stats import mannwhitneyu

Agora vamos partir para os cálculos.

In [None]:
# Criando duas amostras independentes
tratamento_a = [23, 45, 67, 32, 41]
tratamento_b = [18, 40, 65, 30, 38]

# Aplicando o teste de Mann-Whitney, Utilizei o 'alternative = two-sided' pois se trata de um teste bicaudal
stat, p_valor = mannwhitneyu(tratamento_a, tratamento_b, alternative = 'two-sided')

# Exibindo os resultados
print("Estatística do teste de Mann-whitney:", stat)
print("Valor p:", p_valor)

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_valor < alpha:
    print("\nRejeitar H0: Há evidências suficientes para concluir que existe diferenças entre as populações.")
else:
    print("\nFalha em rejeitar H0: Não há evidências suficientes para concluir que existe diferenças entre as populações.")

Estatística do teste de Mann-whitney: 16.0
Valor p: 0.5476190476190477

Falha em rejeitar H0: Não há evidências suficientes para concluir que existe diferenças entre as populações.


Após a aplicação do nosso teste de Mann-Whitney a um nível de significância de 0,05, falhamos em rejeitar a hipótese nula. Logo, podemos concluir que não existem evidências suficientes das diferenças entre as populações, então não existe diferença entre os níveis de dor dos tratamentos.

## **Teste de Kolmogorov-Smirnov(KS)**

Diferente dos demais, o KS não tem o objetivo de comparar valores amostrais.
A ideia aqui é aplicamos o teste de aderência de Kolmogorov-Smirnov para
verificar se determinada amostra vem de população com distribuição
específica. Essa “distribuição específica” é, na maioria das vezes, a distribuição
normal.

Nesses testes as hipoteses assumem:

- A hipótese nula diz que a amostra segue a mesma distribuição que é
normal.
- A hipótese alternativa diz que as duas distribuições são diferentes.

Para entendermos melhor este teste, vamos observar um exemplo de aplicação.

**Exercício:**
Suponha que você esteja estudando a altura de duas espécies de plantas em diferentes condições de solo. Você coletou a altura de 30 plantas da espécie A e 30 plantas da espécie B. Agora, sua tarefa é aplicar o teste de Kolmogorov-Smirnov para determinar se as alturas das duas espécies seguem a mesma distribuição de altura.

Dados de altura das plantas da espécie A (amostra1):
[20, 22, 25, 21, 23, 24, 26, 19, 20, 21, 23, 22, 24, 25, 26, 20, 21, 22, 23, 24, 25, 20, 21, 22, 23, 24, 25, 26, 27, 28]

Dados de altura das plantas da espécie B (amostra2):
[19, 21, 24, 20, 22, 23, 25, 18, 19, 20, 22, 21, 23, 24, 25, 19, 20, 21, 22, 23, 24, 19, 20, 21, 22, 23, 24, 25, 26, 27]

Aplique o teste de Kolmogorov-Smirnov a esses dados e interprete os resultados.

**Resposta**: Dito isso, vamos começar a definir as nossas hipóteses:

- H0: As amostras possuem distribuição iguais.
- Ha: As amostras possuem distribuição diferentes.

Agora que já realizamos as importações, vamos partir para os cálculos.

In [20]:
# Importando o KS
from scipy.stats import ks_2samp

# Funções matématicas
import numpy as np

Agora que já realizamos as importações, vamos partir para os cálculos.

In [None]:
# Altura das plantas A
especie_a = np.array([20, 22, 25, 21, 23, 24, 26, 19, 20, 21, 23, 22, 24, 25, 26, 20, 21, 22, 23, 24, 25, 20, 21, 22, 23, 24, 25, 26, 27, 28])

# Altura das plantas B
especie_b = np.array([19, 21, 24, 20, 22, 23, 25, 18, 19, 20, 22, 21, 23, 24, 25, 19, 20, 21, 22, 23, 24, 19, 20, 21, 22, 23, 24, 25, 26, 27])

# Aplicando o teste de Kolmogorov-Smirnov
stat, p_valor = ks_2samp(especie_a, especie_b)

# Exibindo os resultados
print("Estatística do teste KS:", stat)
print("Valor p:", p_valor)

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_valor < alpha:
    print("Rejeitar H0: Não há evidências suficientes de que a distribuição de cada amostra é semelhante.")
else:
    print("\nFalha em rejeitar H0: Há evidências suficientes de que a distribuição de cada amostra é semelhante.")

Estatística do teste KS: 0.13333333333333333
Valor p: 0.9578462903438838

Falha em rejeitar H0: Há evidências suficientes de que a distribuição de cada amostra é semelhante.


Ao aplicarmos o teste de Kolmogorov-Smirnov com um nível de significância de 0,05, não encontramos evidências suficientes para rejeitar a hipótese nula. Logo, podemos concluir que a distribuição das duas amostras é semelhante.

## **Bootstrapping**

 O método de bootstrap é uma técnica estatística que permite estimar a distribuição de uma estatística amostral através da reamostragem dos dados disponíveis. Em resumo, o processo envolve criar várias amostras de dados (chamadas de reamostragens) a partir da amostra original, com reposição, e calcular a estatística de interesse para cada uma dessas amostras.

Para entendermos um pouco melhor do assunto, vamos observar um exercício.

Exercício:
Considere uma amostra de 50 observações da variável Y:


- Y = [22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118]

Utilize o método de bootstrap para estimar um intervalo de confiança de 90% para a média populacional de Y. Realize 1000 reamostragens.

Resposta: Vamos começar realizando as importações necessárias para a nossa resolução.

In [35]:
# Importando o bootstrap
from scipy.stats import bootstrap

# Funções matématicas
import numpy as np

Com as importações realizadas, vamos partir para os cálculos.

In [None]:
# Definindo os dados
y = [22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118]

# Convertendo os dados
data = (y,)

# Calculando com 90% de intervalo de confiança um bootstrap para a média
bootstrap_ci = bootstrap(data, np.mean, confidence_level=0.90, method='percentile', n_resamples = 1000)

# Observando o resultado do intervalo de confiança
print(bootstrap_ci.confidence_interval)

ConfidenceInterval(low=62.73265306122449, high=76.3265306122449)


Logo, podemos afirmar com 90% de confiança que a média populacional estará entre os valores de 62,73 e 76,32. Isso significa que, em 90% das vezes, a média amostral estará dentro desse intervalo se repetirmos o processo de amostragem.

## **Exercicio**

### **Questão 1**

1. Você foi fornecido com duas amostras de dados, cada uma representando o desempenho de dois grupos de usuários em um novo recurso de um aplicativo. Realize um teste para determinar se há uma diferença significativa no desempenho entre os dois grupos. Apresente os resultados de forma clara e interprete-os.

- Amostra do Grupo A:
12,15,18,20,22,25,27,5,36,38,40,42,45,47,50,53,56,58,60,62,65,68,70,72,75,78,80,82,103,106,108,110,112,115,118,120,122,125,128,130, 144, 170

- Amostra do Grupo B:
14,16,19,21,23,26,29,31,34,37,39,41,44,46,49,52,55,57,59,61,64,67,69,71,74,76,79,81,84, 87 , 102,105,107,109,111,114,117,119,121,124,127,129,152,155,158

Resposta: Vamos começar definindo as nossas hipoteses

H0: amostra A = amostra B

Ha: amostra A ≠ amostra B

Estamos diante de um teste bicaudal

Nos temos mais de 30 elementos presentes nesses dados, e temos variaveis independentes sendo assim poderiamos aplicar um teste t no entando vamos observar se a distribuição dessas amostras se assemelham a uma normal dito isso vamos seguir adiante

In [16]:
# Dados da amostra A
amostra_a = [12,15,18,20,22,25,27,5,36,38,40,42,45,47,50,53,56,58,60,62,65,68,70,72,75,78,80,82,103,106,108,110,112,115,118,120,122,125,128,130, 144, 170]

# Dados da amostra B
amostra_b = [14,16,19,21,23,26,29,31,34,37,39,41,44,46,49,52,55,57,59,61,64,67,69,71,74,76,79,81,84,87,102,105,107,109,111,114,117,119,121,124,127,129,152,155,158]

In [33]:
len(amostra_a), len(amostra_b)

(42, 45)

Agora que temos os dados, vamos realizar as importações necessarias

In [11]:
# Importando o skew
from scipy.stats import skew

# Funções matémaricas
import numpy as np

Agora vamos observar a **distribuição dos dados**

In [15]:
# Calculando o skew da amostra A
coeficiente_assimetria_a = skew(amostra_a)

# Calculando o skew da amostra B
coeficiente_assimetria_b = skew(amostra_b)

print(f"Skew da amostra A: {coeficiente_assimetria_a}\nSkew da amostra B: {coeficiente_assimetria_b}")

Skew da amostra A: 0.3160286216418705
Skew da amostra B: 0.349434802019104


Esse skew indica uma assimetria positiva à direita por estar mais afastado de 0 podemos confirmar que essa distribuição não esta muito proxima a uma normal nesse caso isso se aplica as duas amostras

Agora vamos verificar a **variância dos dados**

In [32]:
# Importando o teste de barlett
from scipy.stats import bartlett

# Execute o teste de Bartlett para verificar a homogeneidade das variâncias
statistic, p_value = bartlett(amostra_a, amostra_b)

# Exiba o resultado do teste
print(f"Estatística de Bartlett: {statistic}")
print(f"Valor p: {p_value}\n")

# Nível de significância
alpha = 0.05

# Conclusões
if p_value < alpha:
    print("Rejeitar H0: Há evidências suficientes para rejeitar a hipótese nula. As variâncias são diferentes.")
else:
    print("Falha em rejeitar H0: Não temos evidências suficientes para rejeitar a hipótese nula. As variâncias são iguais.")

Estatística de Bartlett: 0.02169872752983223
Valor p: 0.8828913811967614

Falha em rejeitar H0: Não temos evidências suficientes para rejeitar a hipótese nula. As variâncias são iguais.


As amostras apresentam variancias iguais

**Vamos aplicar um teste T**

In [31]:
# Funções estatísticas
import scipy.stats as st

# Realizando o teste t de Student para duas amostras independentes
resultado_teste = st.ttest_ind(amostra_a, amostra_b, equal_var=True)

# Extraindo o valor-p do resultado do teste
valor_p = resultado_teste.pvalue

print("Valor p:", valor_p)

# Nível de significância
alpha = 0.05

# Conclusões
if valor_p < alpha:
    print("Rejeitar H0: As médias das duas amostras são estatisticamente diferentes.")
else:
    print("Falha em rejeitar H0: As médias das duas amostras NÃO são estatisticamente diferentes.")

Valor p: 0.7887120236572458
Falha em rejeitar H0: As médias das duas amostras NÃO são estatisticamente diferentes.


Apos aplicarmos o nosso teste a um nivel de significancia de 0,05, falhamos em rejeitar a hipotese nula, logo podemos afirmar que não existem evidencias suficientes de que as médias sejam diferentes.

**Vamos aplicar um teste Mann-Whitney**

In [28]:
# Aplicando o teste de Mann-Whitney, Utilizei o 'alternative = two-sided' pois se trata de um teste bicaudal
stat, p_valor = mannwhitneyu(amostra_a, amostra_b, alternative = 'two-sided')

# Exibindo os resultados
print("Estatística do teste de Mann-whitney:", stat)
print("Valor p:", p_valor)

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_valor < alpha:
    print("\nRejeitar H0: Há evidências suficientes para concluir que existe diferenças entre as populações.")
else:
    print("\nFalha em rejeitar H0: Não há evidências suficientes para concluir que existe diferenças entre as populações.")

Estatística do teste de Mann-whitney: 916.0
Valor p: 0.8087163030849599

Falha em rejeitar H0: Não há evidências suficientes para concluir que existe diferenças entre as populações.


Apos aplicarmos o nosso teste a um nivel de significancia de 0,05, falhamos em rejeitar a hipotese nula, logo podemos afirmar que não existem evidencias suficientes de que as médias sejam diferentes.

**Conclusão** Podemos observar que em ambos os casos falhamos em rejeitar a hipotese nula, logo não temos evidencias suficientes para acreditar que os grupos apresentam desempenho diferentes.



Nesse caso em particular optei por utilizar os dois testes pois eu tinha uma 'brecha' para utilizar tanto um teste nparamétrico quanto um não parametrico então foi isso que decidi fazer dessa forma puder deixar minha conclusão mais assegurada por assim dizer

### **Questão 2**

1. Suponha que você tenha uma amostra de dados que representa o tempo de resposta de dois sistemas diferentes. Calcule um intervalo de confiança de 95% para a diferença média entre os tempos de resposta dos dois sistemas usando a técnica de bootstrap. Explique o que você percebe desse resultado

amostra A: [12.5, 14.2, 15.7, 18.3, 20.1, 21.8, 22.6, 25.3, 28.9, 20.2]
amostra B: [12.2, 13.2, 15.7, 13.3, 10.1, 21.8, 21.3, 25.3, 29.4, 24.2]

Resposta: Como o proprio problema ja nos informa será necessario utilizarmos o bootstrap mas antes vamos começar realizando as importaçõe necessarias

In [None]:
# Importando o bootstrap
from scipy.stats import bootstrap

# Funções matématicas
import numpy as np

Agora vamos aplicar o função propriamente dito

In [44]:
# Definindo as amostras
amostra_A = np.array([12.5, 14.2, 15.7, 18.3, 20.1, 21.8, 22.6, 25.3, 28.9, 20.2])
amostra_B = np.array([12.2, 13.2, 15.7, 13.3, 10.1, 21.8, 21.3, 25.3, 29.4, 24.2])

# Defina o número de reamostragens bootstrap
n_bootstraps = 1000

# Lista para armazenar as diferenças de médias de cada reamostragem
diferencas_medias = []

# Loop para realizar as reamostragens bootstrap
for _ in range(n_bootstraps):

    # Realize a reamostragem com reposição para as duas amostras
    amostra_A_boot = np.random.choice(amostra_A, len(amostra_A), replace=True)
    amostra_B_boot = np.random.choice(amostra_B, len(amostra_B), replace=True)

    # Calcule as médias das amostras reamostradas
    media_amostra_A_boot = np.mean(amostra_A_boot)
    media_amostra_B_boot = np.mean(amostra_B_boot)

    # Calculando a diferença entre as médias das amostras reamostradas
    diferenca_media = media_amostra_A_boot - media_amostra_B_boot

    # Armazenando na lista das diferenças
    diferencas_medias.append(diferenca_media)

# Calculando o intervalo de confiança de 95% para a diferença de médias
limite_inferior = np.percentile(diferencas_medias, 2.5)
limite_superior = np.percentile(diferencas_medias, 97.5)

# Exibindo o intervalo
print("Intervalo de confiança (95%) da diferença de médias entre os sistemas A e B:", (limite_inferior, limite_superior))

Intervalo de confiança (95%) da diferença de médias entre os sistemas A e B: (-3.7302500000000003, 5.829999999999998)


Com 95% de confiança, podemos afirmar que a diferença média entre os tempos de resposta dos dois sistemas estará entre -3,73 e 5,82