
# **TESTES DE HIPÓTESES - PARTE 1(Definindo Teste de Hipóteses)**

O teste de hipótese é um tipo de análise estatística em que você testa suas suposições sobre um parâmetro populacional. É usado para estimar a relação entre 2 variáveis estatísticas.

Vamos discutir alguns exemplos de hipóteses estatísticas da vida real:

•	Um professor supõe que 10% dos alunos de sua faculdade vêm de famílias de classe alta.
•	Um médico acredita o tratamento contra a obesidade é 40% eficaz para pacientes diabéticos.

Agora que você conhece o teste de hipótese, veja os dois tipos de teste de hipótese em estatística.

A hipótese nula é a suposição de que o evento não ocorrerá. Uma hipótese nula não tem influência sobre o resultado do estudo, a menos que seja rejeitada.

**H0 é o símbolo para isso, e é pronunciado H-nula.**

A hipótese alternativa é o oposto lógico da hipótese nula. A aceitação da hipótese alternativa segue a rejeição da hipótese nula. H1 é o símbolo para isso.



Vamos entender isso com um exemplo.

Um fabricante de desinfetante afirma que seu produto mata 45% dos germes em média.
Para testar a afirmação dessa empresa, crie uma hipótese nula e alternativa.

H0 (Hipótese Nula): Média = 95%.
Hipótese alternativa (H1): A média é inferior a 95%. **negrito**

Outro exemplo direto para entender esse conceito é determinar se uma moeda é cara ou coroa. A hipótese nula afirma que a probabilidade de dar cara é igual à probabilidade de dar coroa. Em contraste, a teoria alternativa afirma que a probabilidade de uma exibição de caras e coroas seria muito diferente.
Dependendo da distribuição da população, você pode classificar a hipótese estatística em dois tipos.
Hipótese Simples: Uma hipótese simples especifica um valor exato para o parâmetro.
Hipótese composta: Uma hipótese composta especifica um intervalo de valores.

***Nível de significância***

O valor alfa é um critério para determinar se uma estatística de teste é estatisticamente significativa. Em um teste estatístico, Alfa representa uma probabilidade aceitável de um erro Tipo I. Como alfa é uma probabilidade, pode estar entre 0 e 1. Na prática, os valores de alfa mais comumente usados são 0,01, 0,05 e 0,1, que representam 1%, 5% e 10% de chance de um erro Tipo I , respectivamente (ou seja, rejeitar a hipótese nula quando ela é de fato correta).

***Valor P***

Um valor-p é uma métrica que expressa a probabilidade de uma diferença observada ter ocorrido por acaso. À medida que o valor-p diminui, a significância estatística da diferença observada aumenta. Se o valor-p for muito baixo, você rejeita a hipótese nula.


# **TESTES DE HIPÓTESES - PARTE 2(Etapas de Construção de um Teste de Hipótese)**

A empresa Suco Bom produz sucos de frutas em embalagens de 500 ml. Seu processo de produção é quase todo automatizado e as embalagens de sucos são preenchidas por uma máquina que às vezes apresenta um certo desajuste, levando a erros no preenchimento das embalagens para mais ou menos conteúdo. Quando o volume médio cai abaixo de 500 ml, a empresa se preocupa em perder vendas e ter problemas com os orgãos fiscalizadores. Quando o volume passa de 500 ml, a empresa começa a se preocupar com prejuízos no processo de produção.

O setor de controle de qualidade da empresa Suco Bom extrai, periodicamente, amostras de 50 embalagens para monitorar o processo de produção. Para cada amostra, é realizado um teste de hipóteses para avaliar se o maquinário se desajustou. A equipe de controle de qualidade assume um nível de significância de 5%.

Suponha agora que uma amostra de 50 embalagens foi selecionada e que a média amostral observada foi de 503,24 ml e desvio padrao 4,48. Esse valor de média amostral é suficientemente maior que 500 ml para nos fazer rejeitar a hipótese de que a média do processo é de 500 ml ao nível de significância de 5%?



In [1]:
from scipy.stats import norm
from numpy import sqrt

In [2]:
# Hipotese de ser igual, significa um bicaudal com h0 da medias serem iguais
# 𝐻0:𝜇=500 
# 𝐻1:𝜇≠500

In [3]:
u = 500
n = 50
sig = 0.05

In [4]:
z_sig_sob2 = norm.ppf(sig/2)
print(z_sig_sob2)
x = 503.24
s = 4.48
z = (x-u)/(s/sqrt(n))
z

-1.9599639845400545


5.113897256795581

In [5]:
area = norm.cdf(z)
print(area)
pvalor = 2*(1-area)
print(pvalor)
if (pvalor <= sig):
    print('Rejeita h0')
else:
    print('Aceita h0')

#Rejeitar  𝐻0  se o valor  𝑝≤𝛼

0.9999998422104751
3.155790497810784e-07
Rejeita h0


# **TESTES DE HIPÓTESES - PARTE 3(Definindo Método de Neyman-Pearson)**


O paradigma NP visa corrigir esse problema abordando diretamente os erros de classificação assimétricos. O objetivo é maximizar a taxa de verdadeiros positivos (TP) enquanto se mantém a taxa de falsos positivos (FP) dentro de um limite aceitável. Isso é conseguido através da maximização da Razão de Verdadeiros Positivos (TPR) e da minimização da Razão de Falsos Positivos (FPR) - duas métricas de avaliação de desempenho amplamente utilizadas no mundo da classificação binária. O paradigma NP é amplamente usado em aplicações onde os erros de classificação assimétricos são preocupações centrais, como detecção de fraudes, diagnóstico médico e detecção de uso indevido.

O uso do paradigma de classificação NP tem se mostrado bastante útil para melhorar a precisão de classificação de dados. Por exemplo, ao processar dados de imagem, é possível detectar erros de classificação mais graves e minimizar os erros menos graves. Isso é particularmente útil para aplicações médicas, onde é necessário um alto nível de precisão para evitar erros potencialmente fatais. Além disso, o uso do paradigma de classificação NP torna possível a classificação de dados heterogêneos e em grande escala, o que é essencial para aplicações móveis e na web.

# **TESTES DE HIPÓTESES - PARTE 4(Neyman-Pearson na Prática)**







In [8]:
pip install nproc

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting nproc
  Downloading nproc-1.5.2-py3-none-any.whl (19 kB)
Collecting sklearn
  Downloading sklearn-0.0.post1.tar.gz (3.6 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: sklearn
  Building wheel for sklearn (setup.py) ... [?25l[?25hdone
  Created wheel for sklearn: filename=sklearn-0.0.post1-py3-none-any.whl size=2344 sha256=c092b0da1f2b190d457f4f1aaad56cd41af303980136fb4a76214f3be02c9378
  Stored in directory: /root/.cache/pip/wheels/14/25/f7/1cc0956978ae479e75140219088deb7a36f60459df242b1a72
Successfully built sklearn
Installing collected packages: sklearn, nproc
Successfully installed nproc-1.5.2 sklearn-0.0.post1


In [9]:
from nproc import npc

In [11]:
import numpy as np
import os
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score
from nproc import npc

In [12]:
test = npc()

np.random.seed()

In [13]:
# Crie um conjunto de dados (x,y) com 2 recursos, rótulo binário e tamanho de amostra 10000.
n = 10000
x = np.random.normal(0, 1, (n,2))
c = 1+3*x[:,0]
y = np.random.binomial(1, 1/(1+np.exp(-c)), n)

In [14]:
# Chame a função npc para construir classificadores Neyman-Pearson.
# O limite superior padrão da taxa de erro tipo I é alfa=0,05.
fit = test.npc(x, y, 'logistic', n_cores=os.cpu_count())

In [15]:
# Avalie a predição do ajuste do classificador NP em um conjunto de teste (xtest, ytest).
x_test = np.random.normal(0, 1, (n,2))
c_test = 1+3*x_test[:,0]
y_test = np.random.binomial(1, 1/(1+np.exp(-c_test)), n)

In [16]:
#Calcule a precisão geral do classificador, bem como a realizada
# taxa de erro tipo I em dados de teste.
# Estritamente falando, para demonstrar a eficácia do classificador de ajuste
# sob o paradigma NP, devemos repetir este experimento muitas vezes, e
# mostra que em 1 - delta dessas repetições, a taxa de erro tipo I é menor que alfa.

fitted_score = test.predict(fit,x)
print("Accuracy on training set:", accuracy_score(fitted_score[0], y))
pred_score = test.predict(fit,x_test)
print("Accuracy on test set:", accuracy_score(pred_score[0], y_test))

Accuracy on training set: 0.7268
Accuracy on test set: 0.7243


In [17]:
cm = confusion_matrix(y_test, pred_score[0])
print("Confusion matrix:")
print(cm)
tn, fp, fn, tp = cm.ravel()
print("Type I error rate: {:.5f}".format(fp/(fp+tn)))
print("Type II error rate: {:.5f}".format(fn/(fn+tp)))

Confusion matrix:
[[3816  125]
 [2632 3427]]
Type I error rate: 0.03172
Type II error rate: 0.43440
