# Hypothesis Testing for a Single Proportion

---

## Import

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import scipy.stats as stats
import statsmodels.api as sm
import statsmodels.formula.api as smf
from statsmodels.stats.power import TTestIndPower

plt.style.use("fivethirtyeight")
%matplotlib inline

---

Nell'*hypothesis testing* su una *singola proportion* le condizioni da rispettare sono identiche a quelle del corrispondente *CLT*, ma è necessario fare chiarezza sull'uso di $p$ e $\hat{p}$: per la *success/failure* si usa $\hat{p}$ nella costruzione dei *CI* (perchè le condizioni devono essere rispettate dal *sample*) e $p$ nell'*HT* (perché il punto di partenza è l'ipotesi nulla); stessa cosa per lo *standard error*, difatti nei *CI* uso $\hat{p}$ perché non conosco $p$ e nell'*HT* uso $p$ per via del *CLT*.

La *test statistic* è sempre lo *z-score*:

$$\large Z=\frac{\hat{p}-p_{null}}{SE}\;\;\;\;\;
SE=\sqrt{\frac{p_{null}(1-p_{null})}{n}}$$

La regola generale per stabilire se sia possibile usare i metodi dell'*hypothesis testing* con la distribuzione normale è costituita da due condizioni:

$$\large np_{null}\geq 15\;\;\; n(1-p_{null})\geq 15$$

---

**\[Esempio\]**

In [2]:
n = 1983
phat = 0.6
pnull = 0.5

test_statistic, p_value = sm.stats.proportions_ztest(
    count = 1190,
    nobs = n,
    value = pnull,
    alternative = "larger",
    prop_var = pnull)

test_statistic, p_value

(8.915160160413807, 2.435558464081159e-19)

---