# 08. Uji Hipotesis (Hypothesis Testing)

## Tujuan Pembelajaran
- Memahami konsep uji hipotesis dalam statistika
- Membedakan hipotesis nol dan hipotesis alternatif
- Menghitung p-value dan tingkat signifikansi
- Menerapkan uji hipotesis untuk berbagai jenis data

## Materi
1. Pengertian Uji Hipotesis (Hypothesis Testing)
2. Hipotesis Nol dan Alternatif (Null and Alternative Hypothesis)
3. Tingkat Signifikansi dan P-value
4. Jenis-jenis Error (Type I dan Type II Error)
5. Langkah-langkah Uji Hipotesis
6. Aplikasi dalam Analisis Data


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from scipy import stats
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

# Set up plotting
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

print("Libraries imported successfully!")
print("SciPy version:", stats.__version__)


## 1. Pengertian Uji Hipotesis (Hypothesis Testing)

**Uji Hipotesis** adalah prosedur statistik yang digunakan untuk menentukan apakah ada cukup bukti untuk menolak atau menerima suatu pernyataan tentang parameter populasi.

### Konsep Dasar:
- **Hipotesis**: Pernyataan yang akan diuji
- **Populasi**: Seluruh objek yang menjadi perhatian
- **Sampel**: Bagian dari populasi yang diamati
- **Statistik Uji**: Nilai yang dihitung dari sampel
- **Keputusan**: Menolak atau menerima hipotesis

### Tujuan:
1. Menguji klaim tentang parameter populasi
2. Membuat keputusan berdasarkan data sampel
3. Menentukan apakah perbedaan yang diamati signifikan secara statistik


## 7. Jenis-jenis Uji Hipotesis (Types of Hypothesis Tests)

### A. Uji Z (Z-Test):
- **Kegunaan**: Menguji mean populasi dengan varians diketahui
- **Kondisi**: n ≥ 30 atau populasi normal dengan σ diketahui
- **Statistik Uji**: Z = (x̄ - μ₀) / (σ/√n)
- **Aplikasi**: Quality control, survei besar

### B. Uji t (T-Test):
- **Kegunaan**: Menguji mean populasi dengan varians tidak diketahui
- **Kondisi**: Populasi normal atau n ≥ 30
- **Statistik Uji**: t = (x̄ - μ₀) / (s/√n)
- **Aplikasi**: Penelitian medis, eksperimen laboratorium

### C. Uji Chi-Square (Chi-Square Test):
- **Kegunaan**: Menguji independensi atau goodness of fit
- **Kondisi**: Data kategorik, frekuensi yang diharapkan ≥ 5
- **Statistik Uji**: χ² = Σ(O - E)² / E
- **Aplikasi**: Analisis survei, uji kualitas

### D. Uji F (F-Test):
- **Kegunaan**: Menguji perbedaan varians atau ANOVA
- **Kondisi**: Populasi normal, independen
- **Statistik Uji**: F = s₁² / s₂²
- **Aplikasi**: Analisis varians, quality control

### E. Uji Non-Parametrik:
- **Kegunaan**: Menguji hipotesis tanpa asumsi distribusi
- **Kondisi**: Data tidak normal atau ordinal
- **Contoh**: Mann-Whitney U, Kruskal-Wallis
- **Aplikasi**: Data medis, survei kepuasan


In [None]:
# Demonstrasi Jenis-jenis Uji Hipotesis
print("=== DEMONSTRASI JENIS-JENIS UJI HIPOTESIS ===")

# Data untuk demonstrasi
np.random.seed(42)

# 1. Uji Z - Mean dengan Varians Diketahui
print("\n1. UJI Z - MEAN DENGAN VARIANS DIKETAHUI:")
# Populasi: Mean = 100, Std = 15
population_mean = 100
population_std = 15
sample_size = 50
sample = np.random.normal(population_mean, population_std, sample_size)

# Hipotesis: H0: μ = 100, H1: μ ≠ 100
hypothesized_mean = 100
alpha = 0.05

# Hitung statistik uji Z
z_stat = (np.mean(sample) - hypothesized_mean) / (population_std / np.sqrt(sample_size))
z_critical = stats.norm.ppf(1 - alpha/2)
p_value = 2 * (1 - stats.norm.cdf(abs(z_stat)))

print(f"Sampel: n={sample_size}, mean={np.mean(sample):.2f}")
print(f"Z-statistik: {z_stat:.2f}")
print(f"Z-kritis: ±{z_critical:.2f}")
print(f"P-value: {p_value:.4f}")
print(f"Keputusan: {'Tolak H0' if p_value < alpha else 'Terima H0'}")

# 2. Uji t - Mean dengan Varians Tidak Diketahui
print("\n2. UJI T - MEAN DENGAN VARIANS TIDAK DIKETAHUI:")
# Hipotesis: H0: μ = 100, H1: μ ≠ 100
sample_mean = np.mean(sample)
sample_std = np.std(sample, ddof=1)

# Hitung statistik uji t
t_stat = (sample_mean - hypothesized_mean) / (sample_std / np.sqrt(sample_size))
t_critical = stats.t.ppf(1 - alpha/2, sample_size - 1)
p_value_t = 2 * (1 - stats.t.cdf(abs(t_stat), sample_size - 1))

print(f"Sampel: n={sample_size}, mean={sample_mean:.2f}, std={sample_std:.2f}")
print(f"t-statistik: {t_stat:.2f}")
print(f"t-kritis: ±{t_critical:.2f}")
print(f"P-value: {p_value_t:.4f}")
print(f"Keputusan: {'Tolak H0' if p_value_t < alpha else 'Terima H0'}")

# 3. Uji Chi-Square - Goodness of Fit
print("\n3. UJI CHI-SQUARE - GOODNESS OF FIT:")
# Data kategorik: A, B, C, D
observed = [25, 30, 20, 25]  # Frekuensi yang diamati
expected = [25, 25, 25, 25]  # Frekuensi yang diharapkan (uniform)

chi2_stat = np.sum((np.array(observed) - np.array(expected))**2 / np.array(expected))
chi2_critical = stats.chi2.ppf(1 - alpha, len(observed) - 1)
p_value_chi2 = 1 - stats.chi2.cdf(chi2_stat, len(observed) - 1)

print(f"Frekuensi yang diamati: {observed}")
print(f"Frekuensi yang diharapkan: {expected}")
print(f"Chi-square statistik: {chi2_stat:.2f}")
print(f"Chi-square kritis: {chi2_critical:.2f}")
print(f"P-value: {p_value_chi2:.4f}")
print(f"Keputusan: {'Tolak H0' if p_value_chi2 < alpha else 'Terima H0'}")

# 4. Uji F - Perbedaan Varians
print("\n4. UJI F - PERBEDAAN VARIANS:")
# Dua sampel independen
sample1 = np.random.normal(100, 15, 30)
sample2 = np.random.normal(100, 20, 30)

# Hipotesis: H0: σ₁² = σ₂², H1: σ₁² ≠ σ₂²
var1 = np.var(sample1, ddof=1)
var2 = np.var(sample2, ddof=1)

f_stat = var1 / var2 if var1 >= var2 else var2 / var1
f_critical = stats.f.ppf(1 - alpha/2, len(sample1)-1, len(sample2)-1)
p_value_f = 2 * (1 - stats.f.cdf(f_stat, len(sample1)-1, len(sample2)-1))

print(f"Sampel 1: n={len(sample1)}, var={var1:.2f}")
print(f"Sampel 2: n={len(sample2)}, var={var2:.2f}")
print(f"F-statistik: {f_stat:.2f}")
print(f"F-kritis: {f_critical:.2f}")
print(f"P-value: {p_value_f:.4f}")
print(f"Keputusan: {'Tolak H0' if p_value_f < alpha else 'Terima H0'}")

# 5. Uji Non-Parametrik - Mann-Whitney U
print("\n5. UJI NON-PARAMETRIK - MANN-WHITNEY U:")
# Dua sampel independen untuk uji perbedaan median
sample1_nonparam = np.random.normal(100, 15, 20)
sample2_nonparam = np.random.normal(110, 15, 20)

# Hipotesis: H0: median1 = median2, H1: median1 ≠ median2
u_stat, p_value_u = stats.mannwhitneyu(sample1_nonparam, sample2_nonparam, alternative='two-sided')

print(f"Sampel 1: n={len(sample1_nonparam)}, median={np.median(sample1_nonparam):.2f}")
print(f"Sampel 2: n={len(sample2_nonparam)}, median={np.median(sample2_nonparam):.2f}")
print(f"U-statistik: {u_stat:.2f}")
print(f"P-value: {p_value_u:.4f}")
print(f"Keputusan: {'Tolak H0' if p_value_u < alpha else 'Terima H0'}")

# 6. Visualisasi Jenis-jenis Uji Hipotesis
plt.figure(figsize=(18, 12))

# Plot 1: Uji Z - Distribusi Normal
plt.subplot(3, 3, 1)
x = np.linspace(-4, 4, 1000)
y = stats.norm.pdf(x, 0, 1)
plt.plot(x, y, 'b-', linewidth=2, label='Standard Normal')
plt.axvline(z_stat, color='red', linestyle='--', linewidth=2, label=f'Z-stat: {z_stat:.2f}')
plt.axvline(z_critical, color='green', linestyle=':', linewidth=2, label=f'Z-crit: {z_critical:.2f}')
plt.axvline(-z_critical, color='green', linestyle=':', linewidth=2)
plt.fill_between(x, 0, y, where=(x >= z_critical) | (x <= -z_critical), alpha=0.3, color='red', label='Rejection Region')
plt.xlabel('Z')
plt.ylabel('Density')
plt.title('Uji Z - Distribusi Normal')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 2: Uji t - Distribusi t
plt.subplot(3, 3, 2)
x_t = np.linspace(-4, 4, 1000)
y_t = stats.t.pdf(x_t, sample_size - 1)
plt.plot(x_t, y_t, 'b-', linewidth=2, label=f't-distribution (df={sample_size-1})')
plt.axvline(t_stat, color='red', linestyle='--', linewidth=2, label=f't-stat: {t_stat:.2f}')
plt.axvline(t_critical, color='green', linestyle=':', linewidth=2, label=f't-crit: {t_critical:.2f}')
plt.axvline(-t_critical, color='green', linestyle=':', linewidth=2)
plt.fill_between(x_t, 0, y_t, where=(x_t >= t_critical) | (x_t <= -t_critical), alpha=0.3, color='red', label='Rejection Region')
plt.xlabel('t')
plt.ylabel('Density')
plt.title('Uji t - Distribusi t')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 3: Uji Chi-Square - Distribusi Chi-Square
plt.subplot(3, 3, 3)
x_chi2 = np.linspace(0, 20, 1000)
y_chi2 = stats.chi2.pdf(x_chi2, len(observed) - 1)
plt.plot(x_chi2, y_chi2, 'b-', linewidth=2, label=f'Chi-square (df={len(observed)-1})')
plt.axvline(chi2_stat, color='red', linestyle='--', linewidth=2, label=f'Chi2-stat: {chi2_stat:.2f}')
plt.axvline(chi2_critical, color='green', linestyle=':', linewidth=2, label=f'Chi2-crit: {chi2_critical:.2f}')
plt.fill_between(x_chi2, 0, y_chi2, where=x_chi2 >= chi2_critical, alpha=0.3, color='red', label='Rejection Region')
plt.xlabel('Chi-square')
plt.ylabel('Density')
plt.title('Uji Chi-Square')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 4: Uji F - Distribusi F
plt.subplot(3, 3, 4)
x_f = np.linspace(0, 5, 1000)
y_f = stats.f.pdf(x_f, len(sample1)-1, len(sample2)-1)
plt.plot(x_f, y_f, 'b-', linewidth=2, label=f'F-distribution (df1={len(sample1)-1}, df2={len(sample2)-1})')
plt.axvline(f_stat, color='red', linestyle='--', linewidth=2, label=f'F-stat: {f_stat:.2f}')
plt.axvline(f_critical, color='green', linestyle=':', linewidth=2, label=f'F-crit: {f_critical:.2f}')
plt.fill_between(x_f, 0, y_f, where=x_f >= f_critical, alpha=0.3, color='red', label='Rejection Region')
plt.xlabel('F')
plt.ylabel('Density')
plt.title('Uji F - Distribusi F')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 5: Perbandingan P-values
plt.subplot(3, 3, 5)
tests = ['Z-Test', 't-Test', 'Chi-Square', 'F-Test', 'Mann-Whitney']
p_values = [p_value, p_value_t, p_value_chi2, p_value_f, p_value_u]
colors = ['lightblue', 'lightgreen', 'lightcoral', 'lightyellow', 'lightpink']
plt.bar(tests, p_values, color=colors, alpha=0.7)
plt.axhline(alpha, color='red', linestyle='--', linewidth=2, label=f'α = {alpha}')
plt.ylabel('P-value')
plt.title('Perbandingan P-values')
plt.xticks(rotation=45)
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 6: Power Analysis
plt.subplot(3, 3, 6)
effect_sizes = np.linspace(0, 2, 100)
powers = []
for effect in effect_sizes:
    power = 1 - stats.norm.cdf(stats.norm.ppf(1 - alpha/2) - effect * np.sqrt(sample_size))
    powers.append(power)

plt.plot(effect_sizes, powers, 'b-', linewidth=2)
plt.axhline(0.8, color='red', linestyle='--', linewidth=2, label='Power = 0.8')
plt.xlabel('Effect Size (Cohen\'s d)')
plt.ylabel('Power')
plt.title('Power Analysis')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 7: Sample Size vs Power
plt.subplot(3, 3, 7)
sample_sizes_power = np.arange(10, 200, 10)
powers_sample = []
for n in sample_sizes_power:
    power = 1 - stats.norm.cdf(stats.norm.ppf(1 - alpha/2) - 0.5 * np.sqrt(n))
    powers_sample.append(power)

plt.plot(sample_sizes_power, powers_sample, 'b-', linewidth=2)
plt.axhline(0.8, color='red', linestyle='--', linewidth=2, label='Power = 0.8')
plt.xlabel('Sample Size')
plt.ylabel('Power')
plt.title('Sample Size vs Power')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 8: Type I vs Type II Error
plt.subplot(3, 3, 8)
alpha_values = np.linspace(0.01, 0.1, 100)
beta_values = []
for a in alpha_values:
    beta = stats.norm.cdf(stats.norm.ppf(1 - a/2) - 0.5 * np.sqrt(sample_size))
    beta_values.append(beta)

plt.plot(alpha_values, beta_values, 'b-', linewidth=2, label='Type II Error')
plt.plot(alpha_values, alpha_values, 'r--', linewidth=2, label='Type I Error')
plt.xlabel('Type I Error (α)')
plt.ylabel('Type II Error (β)')
plt.title('Type I vs Type II Error')
plt.legend()
plt.grid(True, alpha=0.3)

# Plot 9: Confidence Interval vs Hypothesis Test
plt.subplot(3, 3, 9)
ci_lower = sample_mean - t_critical * (sample_std / np.sqrt(sample_size))
ci_upper = sample_mean + t_critical * (sample_std / np.sqrt(sample_size))

plt.errorbar(0, sample_mean, yerr=t_critical * (sample_std / np.sqrt(sample_size)), 
             fmt='o', capsize=10, capthick=2, color='blue', markersize=8, label='95% CI')
plt.axhline(hypothesized_mean, color='red', linestyle='-', linewidth=2, label=f'H0: μ = {hypothesized_mean}')
plt.axhline(ci_lower, color='blue', linestyle=':', alpha=0.7, label=f'CI Lower: {ci_lower:.2f}')
plt.axhline(ci_upper, color='blue', linestyle=':', alpha=0.7, label=f'CI Upper: {ci_upper:.2f}')
plt.xlim(-0.5, 0.5)
plt.xlabel('')
plt.ylabel('Value')
plt.title('Confidence Interval vs Hypothesis Test')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# 7. Kesimpulan dan Rekomendasi
print("\n7. KESIMPULAN DAN REKOMENDASI:")
print("   - Uji Z: Cocok untuk sampel besar dengan varians diketahui")
print("   - Uji t: Cocok untuk sampel kecil dengan varians tidak diketahui")
print("   - Uji Chi-Square: Cocok untuk data kategorik")
print("   - Uji F: Cocok untuk perbandingan varians")
print("   - Uji Non-Parametrik: Cocok untuk data tidak normal")
print("   - Pilih uji sesuai dengan jenis data dan asumsi")
print("   - Pertimbangkan power dan sample size")
print("   - Selalu periksa asumsi sebelum melakukan uji")


## 2. Hipotesis Nol dan Alternatif (Null and Alternative Hypothesis)

### Hipotesis Nol (H₀ - Null Hypothesis):
- Pernyataan yang menyatakan tidak ada perbedaan atau tidak ada efek
- Status quo atau kondisi yang dianggap benar
- Selalu mengandung tanda "=" (sama dengan)

### Hipotesis Alternatif (H₁ - Alternative Hypothesis):
- Pernyataan yang menyatakan ada perbedaan atau ada efek
- Pernyataan yang ingin dibuktikan
- Mengandung tanda "≠", ">", atau "<"

### Contoh:
**Kasus**: Menguji apakah rata-rata tinggi badan mahasiswa berbeda dari 170 cm

- H₀: μ = 170 cm (rata-rata tinggi badan = 170 cm)
- H₁: μ ≠ 170 cm (rata-rata tinggi badan ≠ 170 cm)

### Jenis Uji:
1. **Two-tailed test (Uji dua arah)**: H₁: μ ≠ μ₀
2. **One-tailed test (Uji satu arah)**: 
   - Right-tailed: H₁: μ > μ₀
   - Left-tailed: H₁: μ < μ₀
