# 17. Uji Non-Parametrik (Non-Parametric Tests)

## Tujuan Pembelajaran
- Memahami konsep uji non-parametrik dan kapan menggunakannya
- Membedakan uji parametrik dan non-parametrik
- Menerapkan berbagai uji non-parametrik untuk data yang tidak memenuhi asumsi normalitas
- Menginterpretasikan hasil uji non-parametrik dengan benar
- Memahami kelebihan dan keterbatasan uji non-parametrik
- Menerapkan uji non-parametrik dalam berbagai skenario penelitian
- Memahami konsep rank dan transformasi data
- Menganalisis power dan efisiensi uji non-parametrik
- Memilih uji non-parametrik yang tepat untuk setiap situasi
- Mengintegrasikan uji non-parametrik dalam analisis data yang komprehensif

## Materi
1. **Pengertian Uji Non-Parametrik (Non-Parametric Tests)**
   - Definisi dan karakteristik
   - Perbedaan dengan uji parametrik
   - Kapan menggunakan uji non-parametrik
   - Kelebihan dan keterbatasan

2. **Uji Mann-Whitney U (Mann-Whitney U Test)**
   - Konsep dan asumsi
   - Prosedur pengujian
   - Interpretasi hasil
   - Aplikasi praktis

3. **Uji Wilcoxon (Wilcoxon Signed-Rank Test)**
   - Uji Wilcoxon untuk sampel berpasangan
   - Uji Wilcoxon untuk sampel tunggal
   - Prosedur dan interpretasi
   - Perbandingan dengan t-test

4. **Uji Kruskal-Wallis (Kruskal-Wallis Test)**
   - Konsep dan asumsi
   - Prosedur pengujian
   - Post-hoc analysis
   - Aplikasi untuk multiple groups

5. **Uji Friedman (Friedman Test)**
   - Uji untuk repeated measures
   - Prosedur dan interpretasi
   - Perbandingan dengan ANOVA
   - Aplikasi praktis

6. **Uji Non-Parametrik Lainnya**
   - Uji Kolmogorov-Smirnov
   - Uji Anderson-Darling
   - Uji Shapiro-Wilk
   - Uji Lilliefors

7. **Aplikasi dalam Analisis Data**
   - Penelitian medis
   - Penelitian psikologi
   - Penelitian sosial
   - Penelitian bisnis

8. **Best Practices dan Troubleshooting**
   - Pemilihan uji yang tepat
   - Interpretasi hasil
   - Pelaporan hasil
   - Common mistakes


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from scipy import stats
from scipy.stats import mannwhitneyu, wilcoxon, kruskal, friedmanchisquare
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

# Set up plotting
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

print("Libraries imported successfully!")
print("SciPy version:", stats.__version__)


## 1. Pengertian Uji Non-Parametrik (Non-Parametric Tests)

### 1.1 Definisi dan Karakteristik

**Uji Non-Parametrik** adalah metode statistik yang tidak memerlukan asumsi tentang distribusi populasi yang mendasari data. Berbeda dengan uji parametrik yang mengasumsikan data berdistribusi normal, uji non-parametrik dapat digunakan untuk data dengan distribusi apa pun.

#### 1.1.1 Karakteristik Utama
- **Distribution-free**: Tidak memerlukan asumsi distribusi tertentu
- **Rank-based**: Menggunakan ranking data, bukan nilai asli
- **Robust**: Tahan terhadap outlier dan data yang tidak normal
- **Flexible**: Dapat digunakan untuk berbagai jenis data
- **Less powerful**: Secara umum kurang powerful dibanding uji parametrik

#### 1.1.2 Konsep Ranking
Uji non-parametrik menggunakan konsep ranking, di mana data diurutkan dari yang terkecil hingga terbesar dan diberi peringkat:

**Contoh Ranking:**
- Data: [3, 7, 1, 9, 5]
- Ranking: [2, 4, 1, 5, 3]

**Handling Ties (Data Sama):**
- Data: [3, 7, 3, 9, 5]
- Ranking: [1.5, 4, 1.5, 5, 3] (rata-rata ranking untuk data yang sama)

### 1.2 Perbedaan dengan Uji Parametrik

| Aspek | Uji Parametrik | Uji Non-Parametrik |
|-------|----------------|-------------------|
| **Asumsi Distribusi** | Normal | Tidak ada asumsi |
| **Skala Data** | Interval/Rasio | Ordinal, Interval, Rasio |
| **Power** | Lebih tinggi | Lebih rendah |
| **Sensitivitas** | Sensitif terhadap outlier | Robust terhadap outlier |
| **Interpretasi** | Mean, variance | Median, ranking |
| **Sample Size** | Dapat kecil | Perlu lebih besar |
| **Computation** | Lebih kompleks | Lebih sederhana |

### 1.3 Kapan Menggunakan Uji Non-Parametrik

#### 1.3.1 Situasi yang Memerlukan Uji Non-Parametrik
1. **Data Tidak Normal**
   - Data tidak berdistribusi normal
   - Transformasi tidak berhasil menormalkan data
   - Sample size kecil untuk uji normalitas

2. **Data Ordinal**
   - Data berupa ranking atau skala ordinal
   - Data kategorikal yang dapat diurutkan
   - Data yang tidak memiliki unit pengukuran yang bermakna

3. **Outliers**
   - Data memiliki outlier yang ekstrem
   - Outlier tidak dapat dihapus atau dijelaskan
   - Data yang sangat skewed

4. **Sample Size Kecil**
   - Sample size terlalu kecil untuk uji normalitas
   - Tidak dapat mengasumsikan distribusi normal
   - Perlu metode yang robust

5. **Data Censored atau Truncated**
   - Data yang terpotong atau terbatas
   - Data yang tidak lengkap
   - Data yang memiliki batas atas/bawah

#### 1.3.2 Indikator untuk Menggunakan Uji Non-Parametrik
- **Shapiro-Wilk test** p-value < 0.05
- **Kolmogorov-Smirnov test** p-value < 0.05
- **Skewness** > 2 atau < -2
- **Kurtosis** > 7 atau < -7
- **Visual inspection** menunjukkan non-normal distribution

### 1.4 Kelebihan dan Keterbatasan

#### 1.4.1 Kelebihan
1. **Flexibility**
   - Dapat digunakan untuk berbagai jenis data
   - Tidak memerlukan asumsi distribusi
   - Dapat menangani data ordinal

2. **Robustness**
   - Tahan terhadap outlier
   - Tidak terpengaruh oleh transformasi data
   - Dapat menangani data yang tidak normal

3. **Simplicity**
   - Prosedur yang relatif sederhana
   - Interpretasi yang mudah
   - Tidak memerlukan perhitungan yang kompleks

4. **Wide Applicability**
   - Dapat digunakan untuk berbagai skenario
   - Tidak memerlukan data yang sempurna
   - Dapat menangani data yang bermasalah

#### 1.4.2 Keterbatasan
1. **Lower Power**
   - Secara umum kurang powerful dibanding uji parametrik
   - Memerlukan sample size yang lebih besar
   - Mungkin tidak mendeteksi perbedaan yang kecil

2. **Information Loss**
   - Menggunakan ranking, bukan nilai asli
   - Kehilangan informasi tentang magnitude
   - Tidak dapat memberikan estimasi parameter

3. **Limited Inference**
   - Tidak dapat membuat inferensi tentang parameter populasi
   - Hanya dapat menguji perbedaan distribusi
   - Tidak dapat memberikan confidence interval untuk mean

4. **Ties Problem**
   - Data yang sama dapat menyebabkan masalah
   - Perlu penanganan khusus untuk ties
   - Dapat mempengaruhi hasil uji

### 1.5 Jenis-Jenis Uji Non-Parametrik

#### 1.5.1 Berdasarkan Jumlah Sampel
- **One Sample**: Uji untuk satu sampel
- **Two Sample**: Uji untuk dua sampel
- **Multiple Sample**: Uji untuk lebih dari dua sampel

#### 1.5.2 Berdasarkan Jenis Data
- **Independent Samples**: Sampel yang independen
- **Paired Samples**: Sampel yang berpasangan
- **Repeated Measures**: Pengukuran berulang

#### 1.5.3 Berdasarkan Tujuan Uji
- **Goodness of Fit**: Uji kesesuaian distribusi
- **Independence**: Uji independensi
- **Homogeneity**: Uji kesamaan distribusi
- **Location**: Uji perbedaan lokasi

### 1.6 Power dan Efisiensi

#### 1.6.1 Power Analysis
- **Power** adalah probabilitas untuk mendeteksi perbedaan yang benar-benar ada
- **Efficiency** adalah perbandingan power antara uji non-parametrik dan parametrik
- **Asymptotic Relative Efficiency (ARE)** mengukur efisiensi relatif

#### 1.6.2 Efisiensi Relatif
- **Mann-Whitney U vs t-test**: ARE = 0.955 (normal), 1.0 (uniform), 1.5 (exponential)
- **Wilcoxon vs t-test**: ARE = 0.955 (normal), 1.0 (uniform), 1.5 (exponential)
- **Kruskal-Wallis vs ANOVA**: ARE = 0.955 (normal), 1.0 (uniform), 1.5 (exponential)

### 1.7 Interpretasi Hasil

#### 1.7.1 P-value
- **P-value < 0.05**: Tolak H0, ada perbedaan yang signifikan
- **P-value ≥ 0.05**: Gagal tolak H0, tidak ada perbedaan yang signifikan
- **Effect Size**: Ukuran efek untuk mengukur magnitude perbedaan

#### 1.7.2 Effect Size
- **Cohen's d**: Standardized difference between means
- **r**: Correlation coefficient
- **η²**: Eta-squared (proportion of variance explained)
- **Cliff's delta**: Non-parametric effect size

### 1.8 Aplikasi Praktis

#### 1.8.1 Penelitian Medis
- Uji efektivitas pengobatan
- Analisis kualitas hidup
- Uji perbedaan gejala

#### 1.8.2 Penelitian Psikologi
- Uji perbedaan skor tes
- Analisis rating skala
- Uji perbedaan kelompok

#### 1.8.3 Penelitian Sosial
- Uji perbedaan pendapat
- Analisis survey
- Uji perbedaan demografi

#### 1.8.4 Penelitian Bisnis
- Uji perbedaan kepuasan
- Analisis rating produk
- Uji perbedaan performa


## 2. Uji Mann-Whitney U (Mann-Whitney U Test)

### 2.1 Konsep dan Asumsi

**Uji Mann-Whitney U** adalah uji non-parametrik untuk membandingkan dua kelompok independen. Uji ini merupakan alternatif non-parametrik dari uji t untuk dua sampel independen.

#### 2.1.1 Konsep Dasar
- **Tujuan**: Menguji apakah dua kelompok independen berasal dari populasi yang sama
- **Hipotesis**: 
  - H₀: Kedua kelompok berasal dari populasi yang sama
  - H₁: Kedua kelompok berasal dari populasi yang berbeda
- **Asumsi**: Data dapat diurutkan (ordinal, interval, atau rasio)

#### 2.1.2 Asumsi Uji Mann-Whitney U
1. **Independence**: Observasi dalam setiap kelompok independen
2. **Ordinality**: Data dapat diurutkan (ordinal, interval, atau rasio)
3. **Random Sampling**: Sampel dipilih secara acak
4. **No Ties**: Idealnya tidak ada data yang sama (ties)

#### 2.1.3 Kapan Menggunakan
- Data tidak berdistribusi normal
- Data ordinal atau interval
- Sample size kecil
- Data memiliki outlier
- Transformasi tidak berhasil menormalkan data

### 2.2 Prosedur Pengujian

#### 2.2.1 Langkah-langkah Uji
1. **Gabungkan data** dari kedua kelompok
2. **Urutkan data** dari terkecil hingga terbesar
3. **Beri ranking** pada setiap data
4. **Hitung U statistic** untuk setiap kelompok
5. **Tentukan U minimum** sebagai statistik uji
6. **Hitung p-value** berdasarkan distribusi U

#### 2.2.2 Rumus U Statistic
Untuk kelompok 1:
```
U₁ = n₁n₂ + n₁(n₁+1)/2 - R₁
```

Untuk kelompok 2:
```
U₂ = n₁n₂ + n₂(n₂+1)/2 - R₂
```

Dimana:
- n₁, n₂ = ukuran sampel kelompok 1 dan 2
- R₁, R₂ = jumlah ranking kelompok 1 dan 2

#### 2.2.3 U Minimum
```
U = min(U₁, U₂)
```

#### 2.2.4 P-value
- **Exact test**: Untuk n₁, n₂ ≤ 20
- **Normal approximation**: Untuk n₁, n₂ > 20

### 2.3 Interpretasi Hasil

#### 2.3.1 U Statistic
- **U kecil**: Kelompok 1 cenderung memiliki ranking lebih rendah
- **U besar**: Kelompok 1 cenderung memiliki ranking lebih tinggi
- **U = n₁n₂/2**: Tidak ada perbedaan antara kelompok

#### 2.3.2 P-value
- **P < 0.05**: Tolak H₀, ada perbedaan signifikan
- **P ≥ 0.05**: Gagal tolak H₀, tidak ada perbedaan signifikan

#### 2.3.3 Effect Size
- **r = Z/√N**: Cohen's r untuk effect size
- **r < 0.1**: Effect size kecil
- **r = 0.1-0.3**: Effect size sedang
- **r > 0.3**: Effect size besar

### 2.4 Aplikasi Praktis

#### 2.4.1 Penelitian Medis
- **Efektivitas Pengobatan**: Membandingkan efektivitas dua obat
- **Kualitas Hidup**: Membandingkan kualitas hidup pasien
- **Gejala**: Membandingkan tingkat gejala antara kelompok

#### 2.4.2 Penelitian Psikologi
- **Skor Tes**: Membandingkan skor tes antara kelompok
- **Rating Skala**: Membandingkan rating pada skala Likert
- **Perilaku**: Membandingkan frekuensi perilaku

#### 2.4.3 Penelitian Bisnis
- **Kepuasan**: Membandingkan kepuasan pelanggan
- **Produktivitas**: Membandingkan produktivitas karyawan
- **Penjualan**: Membandingkan performa penjualan

### 2.5 Kelebihan dan Keterbatasan

#### 2.5.1 Kelebihan
- **Robust**: Tahan terhadap outlier dan non-normal data
- **Flexible**: Dapat digunakan untuk berbagai jenis data
- **Simple**: Prosedur yang relatif sederhana
- **Powerful**: Untuk data yang tidak normal, lebih powerful dari t-test

#### 2.5.2 Keterbatasan
- **Ties**: Data yang sama dapat menyebabkan masalah
- **Power**: Untuk data normal, kurang powerful dari t-test
- **Interpretation**: Hanya menguji perbedaan distribusi, bukan mean
- **Effect Size**: Sulit menginterpretasikan magnitude perbedaan

### 2.6 Perbandingan dengan t-test

| Aspek | t-test | Mann-Whitney U |
|-------|--------|----------------|
| **Asumsi** | Normal distribution | No distribution assumption |
| **Data** | Interval/Ratio | Ordinal, Interval, Ratio |
| **Power** | Higher (normal data) | Higher (non-normal data) |
| **Outliers** | Sensitive | Robust |
| **Interpretation** | Mean difference | Distribution difference |
| **Effect Size** | Cohen's d | Cohen's r |

### 2.7 Tips Praktis

#### 2.7.1 Persiapan Data
- Periksa asumsi independence
- Handle missing values
- Identifikasi dan handle outliers
- Periksa apakah data dapat diurutkan

#### 2.7.2 Pelaporan Hasil
- Laporkan U statistic dan p-value
- Sertakan effect size (Cohen's r)
- Jelaskan interpretasi praktis
- Diskusikan keterbatasan

#### 2.7.3 Interpretasi
- Fokus pada perbedaan distribusi
- Pertimbangkan effect size
- Kontekstualkan dalam penelitian
- Bandingkan dengan studi lain


In [None]:
# 2.8 Demonstrasi Kode: Uji Mann-Whitney U

# Import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from scipy import stats
from scipy.stats import mannwhitneyu
import seaborn as sns
from sklearn.preprocessing import StandardScaler

# Set random seed untuk reproducibility
np.random.seed(42)

print("=== DEMONSTRASI UJI MANN-WHITNEY U ===\n")

# 1. Membuat Data Simulasi
print("1. Membuat Data Simulasi")
print("-" * 40)

# Data kelompok 1 (kontrol) - distribusi normal
group1 = np.random.normal(50, 10, 30)
print(f"Kelompok 1 (Kontrol): n = {len(group1)}")
print(f"Mean: {np.mean(group1):.2f}, Std: {np.std(group1):.2f}")

# Data kelompok 2 (perlakuan) - distribusi normal dengan mean berbeda
group2 = np.random.normal(60, 12, 25)
print(f"Kelompok 2 (Perlakuan): n = {len(group2)}")
print(f"Mean: {np.mean(group2):.2f}, Std: {np.std(group2):.2f}")

# 2. Uji Normalitas
print("\n2. Uji Normalitas")
print("-" * 40)

# Shapiro-Wilk test
shapiro1 = stats.shapiro(group1)
shapiro2 = stats.shapiro(group2)

print(f"Kelompok 1 - Shapiro-Wilk: W = {shapiro1.statistic:.4f}, p = {shapiro1.pvalue:.4f}")
print(f"Kelompok 2 - Shapiro-Wilk: W = {shapiro2.statistic:.4f}, p = {shapiro2.pvalue:.4f}")

# Interpretasi
if shapiro1.pvalue > 0.05 and shapiro2.pvalue > 0.05:
    print("→ Kedua kelompok berdistribusi normal (p > 0.05)")
else:
    print("→ Setidaknya satu kelompok tidak normal (p < 0.05)")

# 3. Uji Mann-Whitney U
print("\n3. Uji Mann-Whitney U")
print("-" * 40)

# Melakukan uji Mann-Whitney U
statistic, p_value = mannwhitneyu(group1, group2, alternative='two-sided')

print(f"U Statistic: {statistic:.4f}")
print(f"P-value: {p_value:.4f}")

# Interpretasi hasil
if p_value < 0.05:
    print("→ Tolak H0: Ada perbedaan signifikan antara kelompok (p < 0.05)")
else:
    print("→ Gagal tolak H0: Tidak ada perbedaan signifikan (p ≥ 0.05)")

# 4. Effect Size (Cohen's r)
print("\n4. Effect Size")
print("-" * 40)

# Hitung Z-score untuk effect size
n1, n2 = len(group1), len(group2)
z_score = (statistic - n1*n2/2) / np.sqrt(n1*n2*(n1+n2+1)/12)
cohens_r = abs(z_score) / np.sqrt(n1 + n2)

print(f"Z-score: {z_score:.4f}")
print(f"Cohen's r: {cohens_r:.4f}")

# Interpretasi effect size
if cohens_r < 0.1:
    effect_size = "kecil"
elif cohens_r < 0.3:
    effect_size = "sedang"
else:
    effect_size = "besar"

print(f"→ Effect size: {effect_size}")

# 5. Perbandingan dengan t-test
print("\n5. Perbandingan dengan t-test")
print("-" * 40)

# Independent t-test
t_stat, t_p = stats.ttest_ind(group1, group2)
print(f"t-test: t = {t_stat:.4f}, p = {t_p:.4f}")

# Interpretasi perbandingan
print(f"→ Mann-Whitney U: p = {p_value:.4f}")
print(f"→ t-test: p = {t_p:.4f}")

if abs(p_value - t_p) < 0.01:
    print("→ Hasil kedua uji sangat mirip")
else:
    print("→ Hasil kedua uji berbeda")

# 6. Visualisasi Data
print("\n6. Visualisasi Data")
print("-" * 40)

# Membuat DataFrame untuk visualisasi
data = pd.DataFrame({
    'Value': np.concatenate([group1, group2]),
    'Group': ['Kontrol'] * len(group1) + ['Perlakuan'] * len(group2)
})

# Plot 1: Box Plot
plt.figure(figsize=(15, 10))

plt.subplot(2, 3, 1)
sns.boxplot(data=data, x='Group', y='Value')
plt.title('Box Plot: Kelompok Kontrol vs Perlakuan')
plt.ylabel('Nilai')

# Plot 2: Histogram
plt.subplot(2, 3, 2)
plt.hist(group1, alpha=0.7, label='Kontrol', bins=15, color='blue')
plt.hist(group2, alpha=0.7, label='Perlakuan', bins=15, color='red')
plt.title('Histogram: Distribusi Data')
plt.xlabel('Nilai')
plt.ylabel('Frekuensi')
plt.legend()

# Plot 3: Q-Q Plot untuk normalitas
plt.subplot(2, 3, 3)
stats.probplot(group1, dist="norm", plot=plt)
plt.title('Q-Q Plot: Kelompok Kontrol')
plt.grid(True)

plt.subplot(2, 3, 4)
stats.probplot(group2, dist="norm", plot=plt)
plt.title('Q-Q Plot: Kelompok Perlakuan')
plt.grid(True)

# Plot 4: Violin Plot
plt.subplot(2, 3, 5)
sns.violinplot(data=data, x='Group', y='Value')
plt.title('Violin Plot: Distribusi Data')
plt.ylabel('Nilai')

# Plot 5: Strip Plot
plt.subplot(2, 3, 6)
sns.stripplot(data=data, x='Group', y='Value', jitter=True)
plt.title('Strip Plot: Data Points')
plt.ylabel('Nilai')

plt.tight_layout()
plt.show()

# 7. Ringkasan Statistik
print("\n7. Ringkasan Statistik")
print("-" * 40)

# Statistik deskriptif
desc1 = stats.describe(group1)
desc2 = stats.describe(group2)

print("Kelompok Kontrol:")
print(f"  Mean: {desc1.mean:.2f}")
print(f"  Median: {np.median(group1):.2f}")
print(f"  Std: {np.sqrt(desc1.variance):.2f}")
print(f"  Min: {desc1.minmax[0]:.2f}")
print(f"  Max: {desc1.minmax[1]:.2f}")

print("\nKelompok Perlakuan:")
print(f"  Mean: {desc2.mean:.2f}")
print(f"  Median: {np.median(group2):.2f}")
print(f"  Std: {np.sqrt(desc2.variance):.2f}")
print(f"  Min: {desc2.minmax[0]:.2f}")
print(f"  Max: {desc2.minmax[1]:.2f}")

# 8. Interpretasi Praktis
print("\n8. Interpretasi Praktis")
print("-" * 40)

print("Berdasarkan hasil uji Mann-Whitney U:")
print(f"- U statistic = {statistic:.4f}")
print(f"- P-value = {p_value:.4f}")
print(f"- Effect size (Cohen's r) = {cohens_r:.4f} ({effect_size})")

if p_value < 0.05:
    print("\nKesimpulan:")
    print("Ada perbedaan yang signifikan antara kelompok kontrol dan perlakuan.")
    print("Kelompok perlakuan cenderung memiliki nilai yang lebih tinggi.")
    print(f"Perbedaan ini memiliki effect size yang {effect_size}.")
else:
    print("\nKesimpulan:")
    print("Tidak ada perbedaan yang signifikan antara kelompok kontrol dan perlakuan.")
    print("Kedua kelompok berasal dari populasi yang sama.")

print("\n" + "="*60)
print("DEMONSTRASI SELESAI")
print("="*60)


## 3. Uji Wilcoxon (Wilcoxon Signed-Rank Test)

### 3.1 Konsep dan Asumsi

**Uji Wilcoxon** adalah uji non-parametrik untuk membandingkan dua kelompok yang berpasangan (paired samples). Uji ini merupakan alternatif non-parametrik dari uji t untuk sampel berpasangan.

#### 3.1.1 Konsep Dasar
- **Tujuan**: Menguji apakah ada perbedaan signifikan antara dua pengukuran yang berpasangan
- **Hipotesis**: 
  - H₀: Tidak ada perbedaan antara pengukuran berpasangan
  - H₁: Ada perbedaan antara pengukuran berpasangan
- **Asumsi**: Data dapat diurutkan dan berpasangan

#### 3.1.2 Jenis Uji Wilcoxon
1. **Wilcoxon Signed-Rank Test**: Untuk sampel berpasangan
2. **Wilcoxon Rank-Sum Test**: Untuk sampel independen (sama dengan Mann-Whitney U)

#### 3.1.3 Asumsi Uji Wilcoxon
1. **Paired Data**: Data harus berpasangan
2. **Ordinality**: Data dapat diurutkan (ordinal, interval, atau rasio)
3. **Random Sampling**: Sampel dipilih secara acak
4. **Symmetric Distribution**: Distribusi perbedaan harus simetris

#### 3.1.4 Kapan Menggunakan
- Data berpasangan (before-after, pre-post, matched pairs)
- Data tidak berdistribusi normal
- Data ordinal atau interval
- Sample size kecil
- Data memiliki outlier

### 3.2 Prosedur Pengujian

#### 3.2.1 Langkah-langkah Uji
1. **Hitung perbedaan** antara pengukuran berpasangan
2. **Hapus perbedaan nol** (jika ada)
3. **Urutkan perbedaan** berdasarkan nilai absolut
4. **Beri ranking** pada perbedaan yang tidak nol
5. **Hitung W statistic** (jumlah ranking bertanda)
6. **Tentukan p-value** berdasarkan distribusi W

#### 3.2.2 Rumus W Statistic
```
W = min(W⁺, W⁻)
```

Dimana:
- W⁺ = jumlah ranking positif
- W⁻ = jumlah ranking negatif

#### 3.2.3 P-value
- **Exact test**: Untuk n ≤ 20
- **Normal approximation**: Untuk n > 20

### 3.3 Interpretasi Hasil

#### 3.3.1 W Statistic
- **W kecil**: Ada perbedaan signifikan antara pengukuran
- **W besar**: Tidak ada perbedaan signifikan
- **W = n(n+1)/4**: Tidak ada perbedaan (expected value)

#### 3.3.2 P-value
- **P < 0.05**: Tolak H₀, ada perbedaan signifikan
- **P ≥ 0.05**: Gagal tolak H₀, tidak ada perbedaan signifikan

#### 3.3.3 Effect Size
- **r = Z/√N**: Cohen's r untuk effect size
- **r < 0.1**: Effect size kecil
- **r = 0.1-0.3**: Effect size sedang
- **r > 0.3**: Effect size besar

### 3.4 Aplikasi Praktis

#### 3.4.1 Penelitian Medis
- **Before-After Treatment**: Membandingkan kondisi sebelum dan sesudah pengobatan
- **Pre-Post Surgery**: Membandingkan kondisi sebelum dan sesudah operasi
- **Drug Efficacy**: Membandingkan efektivitas obat

#### 3.4.2 Penelitian Psikologi
- **Pre-Post Therapy**: Membandingkan kondisi sebelum dan sesudah terapi
- **Learning Assessment**: Membandingkan skor sebelum dan sesudah pembelajaran
- **Behavior Change**: Membandingkan perilaku sebelum dan sesudah intervensi

#### 3.4.3 Penelitian Bisnis
- **Customer Satisfaction**: Membandingkan kepuasan sebelum dan sesudah layanan
- **Employee Performance**: Membandingkan performa sebelum dan sesudah pelatihan
- **Product Quality**: Membandingkan kualitas sebelum dan sesudah perbaikan

### 3.5 Kelebihan dan Keterbatasan

#### 3.5.1 Kelebihan
- **Robust**: Tahan terhadap outlier dan non-normal data
- **Paired Design**: Mengontrol variabel confounding
- **Flexible**: Dapat digunakan untuk berbagai jenis data
- **Powerful**: Untuk data yang tidak normal, lebih powerful dari t-test

#### 3.5.2 Keterbatasan
- **Ties**: Data yang sama dapat menyebabkan masalah
- **Power**: Untuk data normal, kurang powerful dari t-test
- **Interpretation**: Hanya menguji perbedaan, bukan magnitude
- **Effect Size**: Sulit menginterpretasikan magnitude perbedaan

### 3.6 Perbandingan dengan t-test

| Aspek | Paired t-test | Wilcoxon Signed-Rank |
|-------|---------------|---------------------|
| **Asumsi** | Normal distribution | No distribution assumption |
| **Data** | Interval/Ratio | Ordinal, Interval, Ratio |
| **Power** | Higher (normal data) | Higher (non-normal data) |
| **Outliers** | Sensitive | Robust |
| **Interpretation** | Mean difference | Median difference |
| **Effect Size** | Cohen's d | Cohen's r |

### 3.7 Tips Praktis

#### 3.7.1 Persiapan Data
- Pastikan data berpasangan
- Periksa asumsi independence
- Handle missing values
- Identifikasi dan handle outliers

#### 3.7.2 Pelaporan Hasil
- Laporkan W statistic dan p-value
- Sertakan effect size (Cohen's r)
- Jelaskan interpretasi praktis
- Diskusikan keterbatasan

#### 3.7.3 Interpretasi
- Fokus pada perbedaan median
- Pertimbangkan effect size
- Kontekstualkan dalam penelitian
- Bandingkan dengan studi lain


In [None]:
# 3.8 Demonstrasi Kode: Uji Wilcoxon Signed-Rank

print("=== DEMONSTRASI UJI WILCOXON SIGNED-RANK ===\n")

# 1. Membuat Data Simulasi (Paired Data)
print("1. Membuat Data Simulasi (Paired Data)")
print("-" * 50)

# Data sebelum perlakuan (baseline)
np.random.seed(42)
baseline = np.random.normal(50, 8, 25)
print(f"Data Baseline: n = {len(baseline)}")
print(f"Mean: {np.mean(baseline):.2f}, Std: {np.std(baseline):.2f}")

# Data sesudah perlakuan (dengan efek perlakuan)
treatment_effect = np.random.normal(8, 3, 25)  # Efek perlakuan
post_treatment = baseline + treatment_effect
print(f"Data Post-Treatment: n = {len(post_treatment)}")
print(f"Mean: {np.mean(post_treatment):.2f}, Std: {np.std(post_treatment):.2f}")

# Hitung perbedaan
differences = post_treatment - baseline
print(f"Perbedaan (Post - Baseline):")
print(f"Mean: {np.mean(differences):.2f}, Std: {np.std(differences):.2f}")

# 2. Uji Normalitas untuk Perbedaan
print("\n2. Uji Normalitas untuk Perbedaan")
print("-" * 50)

# Shapiro-Wilk test untuk perbedaan
shapiro_diff = stats.shapiro(differences)
print(f"Perbedaan - Shapiro-Wilk: W = {shapiro_diff.statistic:.4f}, p = {shapiro_diff.pvalue:.4f}")

# Interpretasi
if shapiro_diff.pvalue > 0.05:
    print("→ Perbedaan berdistribusi normal (p > 0.05)")
    print("→ Dapat menggunakan paired t-test")
else:
    print("→ Perbedaan tidak normal (p < 0.05)")
    print("→ Gunakan Wilcoxon signed-rank test")

# 3. Uji Wilcoxon Signed-Rank
print("\n3. Uji Wilcoxon Signed-Rank")
print("-" * 50)

# Melakukan uji Wilcoxon signed-rank
w_statistic, w_p_value = wilcoxon(baseline, post_treatment, alternative='two-sided')

print(f"W Statistic: {w_statistic:.4f}")
print(f"P-value: {w_p_value:.4f}")

# Interpretasi hasil
if w_p_value < 0.05:
    print("→ Tolak H0: Ada perbedaan signifikan antara baseline dan post-treatment (p < 0.05)")
else:
    print("→ Gagal tolak H0: Tidak ada perbedaan signifikan (p ≥ 0.05)")

# 4. Effect Size (Cohen's r)
print("\n4. Effect Size")
print("-" * 50)

# Hitung Z-score untuk effect size
n = len(differences)
z_score = (w_statistic - n*(n+1)/4) / np.sqrt(n*(n+1)*(2*n+1)/24)
cohens_r = abs(z_score) / np.sqrt(n)

print(f"Z-score: {z_score:.4f}")
print(f"Cohen's r: {cohens_r:.4f}")

# Interpretasi effect size
if cohens_r < 0.1:
    effect_size = "kecil"
elif cohens_r < 0.3:
    effect_size = "sedang"
else:
    effect_size = "besar"

print(f"→ Effect size: {effect_size}")

# 5. Perbandingan dengan Paired t-test
print("\n5. Perbandingan dengan Paired t-test")
print("-" * 50)

# Paired t-test
t_stat, t_p = stats.ttest_rel(baseline, post_treatment)
print(f"Paired t-test: t = {t_stat:.4f}, p = {t_p:.4f}")

# Interpretasi perbandingan
print(f"→ Wilcoxon Signed-Rank: p = {w_p_value:.4f}")
print(f"→ Paired t-test: p = {t_p:.4f}")

if abs(w_p_value - t_p) < 0.01:
    print("→ Hasil kedua uji sangat mirip")
else:
    print("→ Hasil kedua uji berbeda")

# 6. Analisis Perbedaan
print("\n6. Analisis Perbedaan")
print("-" * 50)

# Statistik perbedaan
positive_changes = np.sum(differences > 0)
negative_changes = np.sum(differences < 0)
no_changes = np.sum(differences == 0)

print(f"Perubahan Positif: {positive_changes} ({positive_changes/len(differences)*100:.1f}%)")
print(f"Perubahan Negatif: {negative_changes} ({negative_changes/len(differences)*100:.1f}%)")
print(f"Tidak Ada Perubahan: {no_changes} ({no_changes/len(differences)*100:.1f}%)")

# 7. Visualisasi Data
print("\n7. Visualisasi Data")
print("-" * 50)

# Membuat DataFrame untuk visualisasi
data_paired = pd.DataFrame({
    'Baseline': baseline,
    'Post_Treatment': post_treatment,
    'Difference': differences
})

# Plot 1: Before-After Comparison
plt.figure(figsize=(15, 12))

plt.subplot(2, 3, 1)
plt.scatter(baseline, post_treatment, alpha=0.7)
plt.plot([baseline.min(), baseline.max()], [baseline.min(), baseline.max()], 'r--', label='No Change')
plt.xlabel('Baseline')
plt.ylabel('Post-Treatment')
plt.title('Before vs After Treatment')
plt.legend()
plt.grid(True)

# Plot 2: Histogram Perbedaan
plt.subplot(2, 3, 2)
plt.hist(differences, bins=15, alpha=0.7, color='green')
plt.axvline(0, color='red', linestyle='--', label='No Change')
plt.xlabel('Perbedaan (Post - Baseline)')
plt.ylabel('Frekuensi')
plt.title('Distribusi Perbedaan')
plt.legend()
plt.grid(True)

# Plot 3: Box Plot Perbedaan
plt.subplot(2, 3, 3)
plt.boxplot(differences)
plt.ylabel('Perbedaan (Post - Baseline)')
plt.title('Box Plot Perbedaan')
plt.grid(True)

# Plot 4: Q-Q Plot Perbedaan
plt.subplot(2, 3, 4)
stats.probplot(differences, dist="norm", plot=plt)
plt.title('Q-Q Plot: Perbedaan')
plt.grid(True)

# Plot 5: Violin Plot
plt.subplot(2, 3, 5)
data_long = pd.melt(data_paired[['Baseline', 'Post_Treatment']], var_name='Time', value_name='Value')
sns.violinplot(data=data_long, x='Time', y='Value')
plt.title('Violin Plot: Baseline vs Post-Treatment')
plt.ylabel('Nilai')

# Plot 6: Strip Plot
plt.subplot(2, 3, 6)
sns.stripplot(data=data_long, x='Time', y='Value', jitter=True)
plt.title('Strip Plot: Baseline vs Post-Treatment')
plt.ylabel('Nilai')

plt.tight_layout()
plt.show()

# 8. Ringkasan Statistik
print("\n8. Ringkasan Statistik")
print("-" * 50)

print("Baseline:")
print(f"  Mean: {np.mean(baseline):.2f}")
print(f"  Median: {np.median(baseline):.2f}")
print(f"  Std: {np.std(baseline):.2f}")

print("\nPost-Treatment:")
print(f"  Mean: {np.mean(post_treatment):.2f}")
print(f"  Median: {np.median(post_treatment):.2f}")
print(f"  Std: {np.std(post_treatment):.2f}")

print("\nPerbedaan (Post - Baseline):")
print(f"  Mean: {np.mean(differences):.2f}")
print(f"  Median: {np.median(differences):.2f}")
print(f"  Std: {np.std(differences):.2f}")

# 9. Interpretasi Praktis
print("\n9. Interpretasi Praktis")
print("-" * 50)

print("Berdasarkan hasil uji Wilcoxon Signed-Rank:")
print(f"- W statistic = {w_statistic:.4f}")
print(f"- P-value = {w_p_value:.4f}")
print(f"- Effect size (Cohen's r) = {cohens_r:.4f} ({effect_size})")

if w_p_value < 0.05:
    print("\nKesimpulan:")
    print("Ada perbedaan yang signifikan antara baseline dan post-treatment.")
    if np.mean(differences) > 0:
        print("Post-treatment cenderung memiliki nilai yang lebih tinggi.")
    else:
        print("Post-treatment cenderung memiliki nilai yang lebih rendah.")
    print(f"Perbedaan ini memiliki effect size yang {effect_size}.")
else:
    print("\nKesimpulan:")
    print("Tidak ada perbedaan yang signifikan antara baseline dan post-treatment.")
    print("Perlakuan tidak memberikan efek yang signifikan.")

print("\n" + "="*60)
print("DEMONSTRASI SELESAI")
print("="*60)


## 4. Uji Kruskal-Wallis (Kruskal-Wallis Test)

### 4.1 Konsep dan Asumsi

**Uji Kruskal-Wallis** adalah uji non-parametrik untuk membandingkan tiga atau lebih kelompok independen. Uji ini merupakan alternatif non-parametrik dari ANOVA satu arah.

#### 4.1.1 Konsep Dasar
- **Tujuan**: Menguji apakah tiga atau lebih kelompok independen berasal dari populasi yang sama
- **Hipotesis**: 
  - H₀: Semua kelompok berasal dari populasi yang sama
  - H₁: Setidaknya satu kelompok berasal dari populasi yang berbeda
- **Asumsi**: Data dapat diurutkan (ordinal, interval, atau rasio)

#### 4.1.2 Asumsi Uji Kruskal-Wallis
1. **Independence**: Observasi dalam setiap kelompok independen
2. **Ordinality**: Data dapat diurutkan (ordinal, interval, atau rasio)
3. **Random Sampling**: Sampel dipilih secara acak
4. **No Ties**: Idealnya tidak ada data yang sama (ties)

#### 4.1.3 Kapan Menggunakan
- Data tidak berdistribusi normal
- Data ordinal atau interval
- Sample size kecil
- Data memiliki outlier
- Transformasi tidak berhasil menormalkan data
- Lebih dari dua kelompok

### 4.2 Prosedur Pengujian

#### 4.2.1 Langkah-langkah Uji
1. **Gabungkan data** dari semua kelompok
2. **Urutkan data** dari terkecil hingga terbesar
3. **Beri ranking** pada setiap data
4. **Hitung H statistic** berdasarkan ranking
5. **Tentukan p-value** berdasarkan distribusi chi-square

#### 4.2.2 Rumus H Statistic
```
H = (12/(N(N+1))) × Σ(Ri²/ni) - 3(N+1)
```

Dimana:
- N = total jumlah observasi
- ni = jumlah observasi dalam kelompok i
- Ri = jumlah ranking dalam kelompok i

#### 4.2.3 P-value
- **Chi-square distribution**: df = k-1 (k = jumlah kelompok)
- **Exact test**: Untuk sample size kecil
- **Normal approximation**: Untuk sample size besar

### 4.3 Interpretasi Hasil

#### 4.3.1 H Statistic
- **H besar**: Ada perbedaan signifikan antara kelompok
- **H kecil**: Tidak ada perbedaan signifikan
- **H = 0**: Tidak ada perbedaan (expected value)

#### 4.3.2 P-value
- **P < 0.05**: Tolak H₀, ada perbedaan signifikan
- **P ≥ 0.05**: Gagal tolak H₀, tidak ada perbedaan signifikan

#### 4.3.3 Effect Size
- **η² = (H - k + 1)/(N - k)**: Eta-squared untuk effect size
- **η² < 0.01**: Effect size kecil
- **η² = 0.01-0.06**: Effect size sedang
- **η² > 0.06**: Effect size besar

### 4.4 Post-hoc Analysis

#### 4.4.1 Kapan Diperlukan
- H statistic signifikan (p < 0.05)
- Lebih dari dua kelompok
- Perlu mengetahui kelompok mana yang berbeda

#### 4.4.2 Metode Post-hoc
1. **Dunn's Test**: Perbandingan berpasangan dengan koreksi Bonferroni
2. **Mann-Whitney U**: Perbandingan berpasangan
3. **Conover-Iman Test**: Perbandingan berpasangan
4. **Nemenyi Test**: Perbandingan berpasangan

#### 4.4.3 Koreksi Multiple Comparisons
- **Bonferroni**: α/k(k-1)/2
- **Holm**: Step-down procedure
- **FDR**: False Discovery Rate

### 4.5 Aplikasi Praktis

#### 4.5.1 Penelitian Medis
- **Efektivitas Pengobatan**: Membandingkan efektivitas beberapa obat
- **Kualitas Hidup**: Membandingkan kualitas hidup pasien
- **Gejala**: Membandingkan tingkat gejala antara kelompok

#### 4.5.2 Penelitian Psikologi
- **Skor Tes**: Membandingkan skor tes antara kelompok
- **Rating Skala**: Membandingkan rating pada skala Likert
- **Perilaku**: Membandingkan frekuensi perilaku

#### 4.5.3 Penelitian Bisnis
- **Kepuasan**: Membandingkan kepuasan pelanggan
- **Produktivitas**: Membandingkan produktivitas karyawan
- **Penjualan**: Membandingkan performa penjualan

### 4.6 Kelebihan dan Keterbatasan

#### 4.6.1 Kelebihan
- **Robust**: Tahan terhadap outlier dan non-normal data
- **Flexible**: Dapat digunakan untuk berbagai jenis data
- **Multiple Groups**: Dapat menangani lebih dari dua kelompok
- **Powerful**: Untuk data yang tidak normal, lebih powerful dari ANOVA

#### 4.6.2 Keterbatasan
- **Ties**: Data yang sama dapat menyebabkan masalah
- **Power**: Untuk data normal, kurang powerful dari ANOVA
- **Interpretation**: Hanya menguji perbedaan distribusi, bukan mean
- **Post-hoc**: Memerlukan analisis tambahan untuk perbandingan berpasangan

### 4.7 Perbandingan dengan ANOVA

| Aspek | One-way ANOVA | Kruskal-Wallis |
|-------|---------------|----------------|
| **Asumsi** | Normal distribution | No distribution assumption |
| **Data** | Interval/Ratio | Ordinal, Interval, Ratio |
| **Power** | Higher (normal data) | Higher (non-normal data) |
| **Outliers** | Sensitive | Robust |
| **Interpretation** | Mean difference | Distribution difference |
| **Effect Size** | η² | η² |
| **Post-hoc** | Tukey HSD | Dunn's test |

### 4.8 Tips Praktis

#### 4.8.1 Persiapan Data
- Periksa asumsi independence
- Handle missing values
- Identifikasi dan handle outliers
- Periksa apakah data dapat diurutkan

#### 4.8.2 Pelaporan Hasil
- Laporkan H statistic dan p-value
- Sertakan effect size (η²)
- Lakukan post-hoc analysis jika signifikan
- Jelaskan interpretasi praktis

#### 4.8.3 Interpretasi
- Fokus pada perbedaan distribusi
- Pertimbangkan effect size
- Lakukan post-hoc analysis
- Kontekstualkan dalam penelitian


In [None]:
# 4.9 Demonstrasi Kode: Uji Kruskal-Wallis

print("=== DEMONSTRASI UJI KRUSKAL-WALLIS ===\n")

# 1. Membuat Data Simulasi (Multiple Groups)
print("1. Membuat Data Simulasi (Multiple Groups)")
print("-" * 50)

# Data kelompok 1 (kontrol) - distribusi normal
np.random.seed(42)
group1 = np.random.normal(50, 8, 20)
print(f"Kelompok 1 (Kontrol): n = {len(group1)}")
print(f"Mean: {np.mean(group1):.2f}, Std: {np.std(group1):.2f}")

# Data kelompok 2 (perlakuan A) - distribusi normal dengan mean berbeda
group2 = np.random.normal(60, 10, 18)
print(f"Kelompok 2 (Perlakuan A): n = {len(group2)}")
print(f"Mean: {np.mean(group2):.2f}, Std: {np.std(group2):.2f}")

# Data kelompok 3 (perlakuan B) - distribusi normal dengan mean berbeda
group3 = np.random.normal(55, 9, 22)
print(f"Kelompok 3 (Perlakuan B): n = {len(group3)}")
print(f"Mean: {np.mean(group3):.2f}, Std: {np.std(group3):.2f}")

# Data kelompok 4 (perlakuan C) - distribusi normal dengan mean berbeda
group4 = np.random.normal(65, 11, 19)
print(f"Kelompok 4 (Perlakuan C): n = {len(group4)}")
print(f"Mean: {np.mean(group4):.2f}, Std: {np.std(group4):.2f}")

# 2. Uji Normalitas untuk Setiap Kelompok
print("\n2. Uji Normalitas untuk Setiap Kelompok")
print("-" * 50)

groups = [group1, group2, group3, group4]
group_names = ['Kontrol', 'Perlakuan A', 'Perlakuan B', 'Perlakuan C']

for i, (group, name) in enumerate(zip(groups, group_names)):
    shapiro = stats.shapiro(group)
    print(f"{name}: W = {shapiro.statistic:.4f}, p = {shapiro.pvalue:.4f}")

# Interpretasi
normal_groups = sum(1 for group in groups if stats.shapiro(group).pvalue > 0.05)
print(f"\n→ {normal_groups}/{len(groups)} kelompok berdistribusi normal")

if normal_groups < len(groups):
    print("→ Setidaknya satu kelompok tidak normal")
    print("→ Gunakan Kruskal-Wallis test")
else:
    print("→ Semua kelompok normal")
    print("→ Dapat menggunakan ANOVA atau Kruskal-Wallis")

# 3. Uji Kruskal-Wallis
print("\n3. Uji Kruskal-Wallis")
print("-" * 50)

# Melakukan uji Kruskal-Wallis
h_statistic, h_p_value = kruskal(group1, group2, group3, group4)

print(f"H Statistic: {h_statistic:.4f}")
print(f"P-value: {h_p_value:.4f}")

# Interpretasi hasil
if h_p_value < 0.05:
    print("→ Tolak H0: Ada perbedaan signifikan antara kelompok (p < 0.05)")
else:
    print("→ Gagal tolak H0: Tidak ada perbedaan signifikan (p ≥ 0.05)")

# 4. Effect Size (Eta-squared)
print("\n4. Effect Size")
print("-" * 50)

# Hitung effect size
n_total = sum(len(group) for group in groups)
k = len(groups)
eta_squared = (h_statistic - k + 1) / (n_total - k)

print(f"Eta-squared: {eta_squared:.4f}")

# Interpretasi effect size
if eta_squared < 0.01:
    effect_size = "kecil"
elif eta_squared < 0.06:
    effect_size = "sedang"
else:
    effect_size = "besar"

print(f"→ Effect size: {effect_size}")

# 5. Perbandingan dengan ANOVA
print("\n5. Perbandingan dengan ANOVA")
print("-" * 50)

# One-way ANOVA
f_stat, f_p = stats.f_oneway(group1, group2, group3, group4)
print(f"ANOVA: F = {f_stat:.4f}, p = {f_p:.4f}")

# Interpretasi perbandingan
print(f"→ Kruskal-Wallis: p = {h_p_value:.4f}")
print(f"→ ANOVA: p = {f_p:.4f}")

if abs(h_p_value - f_p) < 0.01:
    print("→ Hasil kedua uji sangat mirip")
else:
    print("→ Hasil kedua uji berbeda")

# 6. Post-hoc Analysis (Mann-Whitney U)
print("\n6. Post-hoc Analysis")
print("-" * 50)

if h_p_value < 0.05:
    print("Karena H statistic signifikan, lakukan post-hoc analysis:")
    print("Perbandingan berpasangan menggunakan Mann-Whitney U:")
    
    # Perbandingan berpasangan
    comparisons = [
        (0, 1, "Kontrol vs Perlakuan A"),
        (0, 2, "Kontrol vs Perlakuan B"),
        (0, 3, "Kontrol vs Perlakuan C"),
        (1, 2, "Perlakuan A vs Perlakuan B"),
        (1, 3, "Perlakuan A vs Perlakuan C"),
        (2, 3, "Perlakuan B vs Perlakuan C")
    ]
    
    # Koreksi Bonferroni
    alpha = 0.05
    n_comparisons = len(comparisons)
    alpha_corrected = alpha / n_comparisons
    
    print(f"Alpha level: {alpha:.3f}")
    print(f"Koreksi Bonferroni: {alpha_corrected:.4f}")
    print()
    
    for i, j, name in comparisons:
        u_stat, u_p = mannwhitneyu(groups[i], groups[j], alternative='two-sided')
        significant = "Signifikan" if u_p < alpha_corrected else "Tidak signifikan"
        print(f"{name}: U = {u_stat:.4f}, p = {u_p:.4f} ({significant})")
else:
    print("H statistic tidak signifikan, tidak perlu post-hoc analysis")

# 7. Visualisasi Data
print("\n7. Visualisasi Data")
print("-" * 50)

# Membuat DataFrame untuk visualisasi
data_multi = pd.DataFrame({
    'Value': np.concatenate(groups),
    'Group': [group_names[i] for i, group in enumerate(groups) for _ in group]
})

# Plot 1: Box Plot
plt.figure(figsize=(15, 12))

plt.subplot(2, 3, 1)
sns.boxplot(data=data_multi, x='Group', y='Value')
plt.title('Box Plot: Semua Kelompok')
plt.ylabel('Nilai')
plt.xticks(rotation=45)

# Plot 2: Violin Plot
plt.subplot(2, 3, 2)
sns.violinplot(data=data_multi, x='Group', y='Value')
plt.title('Violin Plot: Semua Kelompok')
plt.ylabel('Nilai')
plt.xticks(rotation=45)

# Plot 3: Strip Plot
plt.subplot(2, 3, 3)
sns.stripplot(data=data_multi, x='Group', y='Value', jitter=True)
plt.title('Strip Plot: Semua Kelompok')
plt.ylabel('Nilai')
plt.xticks(rotation=45)

# Plot 4: Histogram
plt.subplot(2, 3, 4)
for i, (group, name) in enumerate(zip(groups, group_names)):
    plt.hist(group, alpha=0.7, label=name, bins=10)
plt.title('Histogram: Semua Kelompok')
plt.xlabel('Nilai')
plt.ylabel('Frekuensi')
plt.legend()

# Plot 5: Q-Q Plot
plt.subplot(2, 3, 5)
for i, (group, name) in enumerate(zip(groups, group_names)):
    stats.probplot(group, dist="norm", plot=plt)
plt.title('Q-Q Plot: Semua Kelompok')
plt.grid(True)

# Plot 6: Mean dengan Error Bar
plt.subplot(2, 3, 6)
means = [np.mean(group) for group in groups]
stds = [np.std(group) for group in groups]
plt.errorbar(range(len(groups)), means, yerr=stds, fmt='o', capsize=5)
plt.xticks(range(len(groups)), group_names, rotation=45)
plt.title('Mean dengan Error Bar')
plt.ylabel('Nilai')

plt.tight_layout()
plt.show()

# 8. Ringkasan Statistik
print("\n8. Ringkasan Statistik")
print("-" * 50)

for i, (group, name) in enumerate(zip(groups, group_names)):
    desc = stats.describe(group)
    print(f"{name}:")
    print(f"  n = {len(group)}")
    print(f"  Mean: {desc.mean:.2f}")
    print(f"  Median: {np.median(group):.2f}")
    print(f"  Std: {np.sqrt(desc.variance):.2f}")
    print(f"  Min: {desc.minmax[0]:.2f}")
    print(f"  Max: {desc.minmax[1]:.2f}")
    print()

# 9. Interpretasi Praktis
print("\n9. Interpretasi Praktis")
print("-" * 50)

print("Berdasarkan hasil uji Kruskal-Wallis:")
print(f"- H statistic = {h_statistic:.4f}")
print(f"- P-value = {h_p_value:.4f}")
print(f"- Effect size (η²) = {eta_squared:.4f} ({effect_size})")

if h_p_value < 0.05:
    print("\nKesimpulan:")
    print("Ada perbedaan yang signifikan antara kelompok.")
    print("Setidaknya satu kelompok berbeda dari yang lain.")
    print(f"Perbedaan ini memiliki effect size yang {effect_size}.")
    
    if h_p_value < 0.05:
        print("\nRekomendasi:")
        print("Lakukan post-hoc analysis untuk mengetahui kelompok mana yang berbeda.")
        print("Gunakan koreksi multiple comparisons untuk menghindari Type I error.")
else:
    print("\nKesimpulan:")
    print("Tidak ada perbedaan yang signifikan antara kelompok.")
    print("Semua kelompok berasal dari populasi yang sama.")

print("\n" + "="*60)
print("DEMONSTRASI SELESAI")
print("="*60)


## 5. Uji Friedman (Friedman Test)

### 5.1 Konsep dan Asumsi

**Uji Friedman** adalah uji non-parametrik untuk membandingkan tiga atau lebih kelompok yang berpasangan (repeated measures). Uji ini merupakan alternatif non-parametrik dari repeated measures ANOVA.

#### 5.1.1 Konsep Dasar
- **Tujuan**: Menguji apakah ada perbedaan signifikan antara tiga atau lebih pengukuran berpasangan
- **Hipotesis**: 
  - H₀: Tidak ada perbedaan antara pengukuran berpasangan
  - H₁: Ada perbedaan antara pengukuran berpasangan
- **Asumsi**: Data dapat diurutkan dan berpasangan

#### 5.1.2 Asumsi Uji Friedman
1. **Repeated Measures**: Data harus berpasangan (repeated measures)
2. **Ordinality**: Data dapat diurutkan (ordinal, interval, atau rasio)
3. **Random Sampling**: Sampel dipilih secara acak
4. **No Ties**: Idealnya tidak ada data yang sama (ties)

#### 5.1.3 Kapan Menggunakan
- Data repeated measures (before-after, pre-post, multiple time points)
- Data tidak berdistribusi normal
- Data ordinal atau interval
- Sample size kecil
- Data memiliki outlier
- Lebih dari dua pengukuran berpasangan

### 5.2 Prosedur Pengujian

#### 5.2.1 Langkah-langkah Uji
1. **Hitung ranking** untuk setiap subjek (across conditions)
2. **Hitung rata-rata ranking** untuk setiap kondisi
3. **Hitung Q statistic** berdasarkan ranking
4. **Tentukan p-value** berdasarkan distribusi chi-square

#### 5.2.2 Rumus Q Statistic
```
Q = (12/(Nk(k+1))) × Σ(Ri²) - 3N(k+1)
```

Dimana:
- N = jumlah subjek
- k = jumlah kondisi
- Ri = jumlah ranking untuk kondisi i

#### 5.2.3 P-value
- **Chi-square distribution**: df = k-1
- **Exact test**: Untuk sample size kecil
- **Normal approximation**: Untuk sample size besar

### 5.3 Interpretasi Hasil

#### 5.3.1 Q Statistic
- **Q besar**: Ada perbedaan signifikan antara kondisi
- **Q kecil**: Tidak ada perbedaan signifikan
- **Q = 0**: Tidak ada perbedaan (expected value)

#### 5.3.2 P-value
- **P < 0.05**: Tolak H₀, ada perbedaan signifikan
- **P ≥ 0.05**: Gagal tolak H₀, tidak ada perbedaan signifikan

#### 5.3.3 Effect Size
- **W = Q/(N(k-1))**: Kendall's W untuk effect size
- **W < 0.1**: Effect size kecil
- **W = 0.1-0.3**: Effect size sedang
- **W > 0.3**: Effect size besar

### 5.4 Post-hoc Analysis

#### 5.4.1 Kapan Diperlukan
- Q statistic signifikan (p < 0.05)
- Lebih dari dua kondisi
- Perlu mengetahui kondisi mana yang berbeda

#### 5.4.2 Metode Post-hoc
1. **Wilcoxon Signed-Rank**: Perbandingan berpasangan
2. **Dunn's Test**: Perbandingan berpasangan dengan koreksi
3. **Conover-Iman Test**: Perbandingan berpasangan

#### 5.4.3 Koreksi Multiple Comparisons
- **Bonferroni**: α/k(k-1)/2
- **Holm**: Step-down procedure
- **FDR**: False Discovery Rate

### 5.5 Aplikasi Praktis

#### 5.5.1 Penelitian Medis
- **Before-After-During Treatment**: Membandingkan kondisi sebelum, selama, dan sesudah pengobatan
- **Multiple Drug Trials**: Membandingkan efektivitas beberapa obat
- **Longitudinal Studies**: Membandingkan kondisi pada waktu yang berbeda

#### 5.5.2 Penelitian Psikologi
- **Pre-Post-Follow-up**: Membandingkan kondisi sebelum, sesudah, dan follow-up
- **Multiple Therapy Sessions**: Membandingkan efektivitas terapi pada sesi yang berbeda
- **Learning Assessment**: Membandingkan skor pada waktu yang berbeda

#### 5.5.3 Penelitian Bisnis
- **Customer Satisfaction**: Membandingkan kepuasan pada waktu yang berbeda
- **Employee Performance**: Membandingkan performa pada periode yang berbeda
- **Product Quality**: Membandingkan kualitas pada tahap yang berbeda

### 5.6 Kelebihan dan Keterbatasan

#### 5.6.1 Kelebihan
- **Robust**: Tahan terhadap outlier dan non-normal data
- **Repeated Measures**: Mengontrol variabel confounding
- **Flexible**: Dapat digunakan untuk berbagai jenis data
- **Powerful**: Untuk data yang tidak normal, lebih powerful dari repeated measures ANOVA

#### 5.6.2 Keterbatasan
- **Ties**: Data yang sama dapat menyebabkan masalah
- **Power**: Untuk data normal, kurang powerful dari repeated measures ANOVA
- **Interpretation**: Hanya menguji perbedaan, bukan magnitude
- **Post-hoc**: Memerlukan analisis tambahan untuk perbandingan berpasangan

### 5.7 Perbandingan dengan Repeated Measures ANOVA

| Aspek | Repeated Measures ANOVA | Friedman Test |
|-------|------------------------|---------------|
| **Asumsi** | Normal distribution | No distribution assumption |
| **Data** | Interval/Ratio | Ordinal, Interval, Ratio |
| **Power** | Higher (normal data) | Higher (non-normal data) |
| **Outliers** | Sensitive | Robust |
| **Interpretation** | Mean difference | Distribution difference |
| **Effect Size** | η² | Kendall's W |
| **Post-hoc** | Tukey HSD | Wilcoxon signed-rank |

### 5.8 Tips Praktis

#### 5.8.1 Persiapan Data
- Pastikan data repeated measures
- Periksa asumsi independence
- Handle missing values
- Identifikasi dan handle outliers

#### 5.8.2 Pelaporan Hasil
- Laporkan Q statistic dan p-value
- Sertakan effect size (Kendall's W)
- Lakukan post-hoc analysis jika signifikan
- Jelaskan interpretasi praktis

#### 5.8.3 Interpretasi
- Fokus pada perbedaan distribusi
- Pertimbangkan effect size
- Lakukan post-hoc analysis
- Kontekstualkan dalam penelitian


In [None]:
# 5.9 Demonstrasi Kode: Uji Friedman

print("=== DEMONSTRASI UJI FRIEDMAN ===\n")

# 1. Membuat Data Simulasi (Repeated Measures)
print("1. Membuat Data Simulasi (Repeated Measures)")
print("-" * 50)

# Data untuk 3 kondisi (baseline, treatment, follow-up)
np.random.seed(42)
n_subjects = 20

# Baseline data
baseline = np.random.normal(50, 8, n_subjects)
print(f"Baseline: n = {len(baseline)}")
print(f"Mean: {np.mean(baseline):.2f}, Std: {np.std(baseline):.2f}")

# Treatment data (dengan efek perlakuan)
treatment_effect = np.random.normal(10, 3, n_subjects)
treatment = baseline + treatment_effect
print(f"Treatment: n = {len(treatment)}")
print(f"Mean: {np.mean(treatment):.2f}, Std: {np.std(treatment):.2f}")

# Follow-up data (dengan efek yang berkurang)
followup_effect = np.random.normal(5, 2, n_subjects)
followup = baseline + followup_effect
print(f"Follow-up: n = {len(followup)}")
print(f"Mean: {np.mean(followup):.2f}, Std: {np.std(followup):.2f}")

# 2. Uji Normalitas untuk Setiap Kondisi
print("\n2. Uji Normalitas untuk Setiap Kondisi")
print("-" * 50)

conditions = [baseline, treatment, followup]
condition_names = ['Baseline', 'Treatment', 'Follow-up']

for i, (condition, name) in enumerate(zip(conditions, condition_names)):
    shapiro = stats.shapiro(condition)
    print(f"{name}: W = {shapiro.statistic:.4f}, p = {shapiro.pvalue:.4f}")

# Interpretasi
normal_conditions = sum(1 for condition in conditions if stats.shapiro(condition).pvalue > 0.05)
print(f"\n→ {normal_conditions}/{len(conditions)} kondisi berdistribusi normal")

if normal_conditions < len(conditions):
    print("→ Setidaknya satu kondisi tidak normal")
    print("→ Gunakan Friedman test")
else:
    print("→ Semua kondisi normal")
    print("→ Dapat menggunakan repeated measures ANOVA atau Friedman test")

# 3. Uji Friedman
print("\n3. Uji Friedman")
print("-" * 50)

# Melakukan uji Friedman
q_statistic, q_p_value = friedmanchisquare(baseline, treatment, followup)

print(f"Q Statistic: {q_statistic:.4f}")
print(f"P-value: {q_p_value:.4f}")

# Interpretasi hasil
if q_p_value < 0.05:
    print("→ Tolak H0: Ada perbedaan signifikan antara kondisi (p < 0.05)")
else:
    print("→ Gagal tolak H0: Tidak ada perbedaan signifikan (p ≥ 0.05)")

# 4. Effect Size (Kendall's W)
print("\n4. Effect Size")
print("-" * 50)

# Hitung effect size
n = len(baseline)
k = len(conditions)
kendalls_w = q_statistic / (n * (k - 1))

print(f"Kendall's W: {kendalls_w:.4f}")

# Interpretasi effect size
if kendalls_w < 0.1:
    effect_size = "kecil"
elif kendalls_w < 0.3:
    effect_size = "sedang"
else:
    effect_size = "besar"

print(f"→ Effect size: {effect_size}")

# 5. Perbandingan dengan Repeated Measures ANOVA
print("\n5. Perbandingan dengan Repeated Measures ANOVA")
print("-" * 50)

# Repeated measures ANOVA (menggunakan F-test)
# Untuk demonstrasi, kita akan menggunakan one-way ANOVA
f_stat, f_p = stats.f_oneway(baseline, treatment, followup)
print(f"Repeated Measures ANOVA: F = {f_stat:.4f}, p = {f_p:.4f}")

# Interpretasi perbandingan
print(f"→ Friedman Test: p = {q_p_value:.4f}")
print(f"→ Repeated Measures ANOVA: p = {f_p:.4f}")

if abs(q_p_value - f_p) < 0.01:
    print("→ Hasil kedua uji sangat mirip")
else:
    print("→ Hasil kedua uji berbeda")

# 6. Post-hoc Analysis (Wilcoxon Signed-Rank)
print("\n6. Post-hoc Analysis")
print("-" * 50)

if q_p_value < 0.05:
    print("Karena Q statistic signifikan, lakukan post-hoc analysis:")
    print("Perbandingan berpasangan menggunakan Wilcoxon Signed-Rank:")
    
    # Perbandingan berpasangan
    comparisons = [
        (0, 1, "Baseline vs Treatment"),
        (0, 2, "Baseline vs Follow-up"),
        (1, 2, "Treatment vs Follow-up")
    ]
    
    # Koreksi Bonferroni
    alpha = 0.05
    n_comparisons = len(comparisons)
    alpha_corrected = alpha / n_comparisons
    
    print(f"Alpha level: {alpha:.3f}")
    print(f"Koreksi Bonferroni: {alpha_corrected:.4f}")
    print()
    
    for i, j, name in comparisons:
        w_stat, w_p = wilcoxon(conditions[i], conditions[j], alternative='two-sided')
        significant = "Signifikan" if w_p < alpha_corrected else "Tidak signifikan"
        print(f"{name}: W = {w_stat:.4f}, p = {w_p:.4f} ({significant})")
else:
    print("Q statistic tidak signifikan, tidak perlu post-hoc analysis")

# 7. Visualisasi Data
print("\n7. Visualisasi Data")
print("-" * 50)

# Membuat DataFrame untuk visualisasi
data_friedman = pd.DataFrame({
    'Baseline': baseline,
    'Treatment': treatment,
    'Follow-up': followup
})

# Plot 1: Box Plot
plt.figure(figsize=(15, 12))

plt.subplot(2, 3, 1)
sns.boxplot(data=data_friedman)
plt.title('Box Plot: Semua Kondisi')
plt.ylabel('Nilai')
plt.xticks(rotation=45)

# Plot 2: Violin Plot
plt.subplot(2, 3, 2)
sns.violinplot(data=data_friedman)
plt.title('Violin Plot: Semua Kondisi')
plt.ylabel('Nilai')
plt.xticks(rotation=45)

# Plot 3: Strip Plot
plt.subplot(2, 3, 3)
sns.stripplot(data=data_friedman, jitter=True)
plt.title('Strip Plot: Semua Kondisi')
plt.ylabel('Nilai')
plt.xticks(rotation=45)

# Plot 4: Histogram
plt.subplot(2, 3, 4)
for i, (condition, name) in enumerate(zip(conditions, condition_names)):
    plt.hist(condition, alpha=0.7, label=name, bins=10)
plt.title('Histogram: Semua Kondisi')
plt.xlabel('Nilai')
plt.ylabel('Frekuensi')
plt.legend()

# Plot 5: Q-Q Plot
plt.subplot(2, 3, 5)
for i, (condition, name) in enumerate(zip(conditions, condition_names)):
    stats.probplot(condition, dist="norm", plot=plt)
plt.title('Q-Q Plot: Semua Kondisi')
plt.grid(True)

# Plot 6: Mean dengan Error Bar
plt.subplot(2, 3, 6)
means = [np.mean(condition) for condition in conditions]
stds = [np.std(condition) for condition in conditions]
plt.errorbar(range(len(conditions)), means, yerr=stds, fmt='o', capsize=5)
plt.xticks(range(len(conditions)), condition_names, rotation=45)
plt.title('Mean dengan Error Bar')
plt.ylabel('Nilai')

plt.tight_layout()
plt.show()

# 8. Ringkasan Statistik
print("\n8. Ringkasan Statistik")
print("-" * 50)

for i, (condition, name) in enumerate(zip(conditions, condition_names)):
    desc = stats.describe(condition)
    print(f"{name}:")
    print(f"  n = {len(condition)}")
    print(f"  Mean: {desc.mean:.2f}")
    print(f"  Median: {np.median(condition):.2f}")
    print(f"  Std: {np.sqrt(desc.variance):.2f}")
    print(f"  Min: {desc.minmax[0]:.2f}")
    print(f"  Max: {desc.minmax[1]:.2f}")
    print()

# 9. Interpretasi Praktis
print("\n9. Interpretasi Praktis")
print("-" * 50)

print("Berdasarkan hasil uji Friedman:")
print(f"- Q statistic = {q_statistic:.4f}")
print(f"- P-value = {q_p_value:.4f}")
print(f"- Effect size (Kendall's W) = {kendalls_w:.4f} ({effect_size})")

if q_p_value < 0.05:
    print("\nKesimpulan:")
    print("Ada perbedaan yang signifikan antara kondisi.")
    print("Setidaknya satu kondisi berbeda dari yang lain.")
    print(f"Perbedaan ini memiliki effect size yang {effect_size}.")
    
    if q_p_value < 0.05:
        print("\nRekomendasi:")
        print("Lakukan post-hoc analysis untuk mengetahui kondisi mana yang berbeda.")
        print("Gunakan koreksi multiple comparisons untuk menghindari Type I error.")
else:
    print("\nKesimpulan:")
    print("Tidak ada perbedaan yang signifikan antara kondisi.")
    print("Semua kondisi berasal dari populasi yang sama.")

print("\n" + "="*60)
print("DEMONSTRASI SELESAI")
print("="*60)


## 6. Uji Non-Parametrik Lainnya

### 6.1 Uji Kolmogorov-Smirnov

#### 6.1.1 Konsep
- **Tujuan**: Menguji apakah data berdistribusi normal
- **Hipotesis**: 
  - H₀: Data berdistribusi normal
  - H₁: Data tidak berdistribusi normal
- **Asumsi**: Data kontinu dan independen

#### 6.1.2 Aplikasi
- Uji normalitas data
- Perbandingan distribusi
- Goodness of fit test

### 6.2 Uji Anderson-Darling

#### 6.2.1 Konsep
- **Tujuan**: Menguji apakah data berdistribusi normal
- **Hipotesis**: 
  - H₀: Data berdistribusi normal
  - H₁: Data tidak berdistribusi normal
- **Asumsi**: Data kontinu dan independen

#### 6.2.2 Aplikasi
- Uji normalitas data
- Perbandingan distribusi
- Goodness of fit test

### 6.3 Uji Shapiro-Wilk

#### 6.3.1 Konsep
- **Tujuan**: Menguji apakah data berdistribusi normal
- **Hipotesis**: 
  - H₀: Data berdistribusi normal
  - H₁: Data tidak berdistribusi normal
- **Asumsi**: Data kontinu dan independen

#### 6.3.2 Aplikasi
- Uji normalitas data
- Perbandingan distribusi
- Goodness of fit test

### 6.4 Uji Lilliefors

#### 6.4.1 Konsep
- **Tujuan**: Menguji apakah data berdistribusi normal
- **Hipotesis**: 
  - H₀: Data berdistribusi normal
  - H₁: Data tidak berdistribusi normal
- **Asumsi**: Data kontinu dan independen

#### 6.4.2 Aplikasi
- Uji normalitas data
- Perbandingan distribusi
- Goodness of fit test

## 7. Aplikasi dalam Analisis Data

### 7.1 Penelitian Medis

#### 7.1.1 Uji Efektivitas Pengobatan
- **Mann-Whitney U**: Membandingkan efektivitas dua obat
- **Wilcoxon**: Membandingkan kondisi sebelum dan sesudah pengobatan
- **Kruskal-Wallis**: Membandingkan efektivitas beberapa obat
- **Friedman**: Membandingkan kondisi pada waktu yang berbeda

#### 7.1.2 Analisis Kualitas Hidup
- **Mann-Whitney U**: Membandingkan kualitas hidup antara kelompok
- **Wilcoxon**: Membandingkan kualitas hidup sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan kualitas hidup pada kelompok yang berbeda
- **Friedman**: Membandingkan kualitas hidup pada waktu yang berbeda

#### 7.1.3 Uji Gejala
- **Mann-Whitney U**: Membandingkan tingkat gejala antara kelompok
- **Wilcoxon**: Membandingkan tingkat gejala sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan tingkat gejala pada kelompok yang berbeda
- **Friedman**: Membandingkan tingkat gejala pada waktu yang berbeda

### 7.2 Penelitian Psikologi

#### 7.2.1 Uji Skor Tes
- **Mann-Whitney U**: Membandingkan skor tes antara kelompok
- **Wilcoxon**: Membandingkan skor tes sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan skor tes pada kelompok yang berbeda
- **Friedman**: Membandingkan skor tes pada waktu yang berbeda

#### 7.2.2 Analisis Rating Skala
- **Mann-Whitney U**: Membandingkan rating pada skala Likert
- **Wilcoxon**: Membandingkan rating sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan rating pada kelompok yang berbeda
- **Friedman**: Membandingkan rating pada waktu yang berbeda

#### 7.2.3 Uji Perilaku
- **Mann-Whitney U**: Membandingkan frekuensi perilaku antara kelompok
- **Wilcoxon**: Membandingkan frekuensi perilaku sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan frekuensi perilaku pada kelompok yang berbeda
- **Friedman**: Membandingkan frekuensi perilaku pada waktu yang berbeda

### 7.3 Penelitian Sosial

#### 7.3.1 Uji Pendapat
- **Mann-Whitney U**: Membandingkan pendapat antara kelompok
- **Wilcoxon**: Membandingkan pendapat sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan pendapat pada kelompok yang berbeda
- **Friedman**: Membandingkan pendapat pada waktu yang berbeda

#### 7.3.2 Analisis Survey
- **Mann-Whitney U**: Membandingkan respons survey antara kelompok
- **Wilcoxon**: Membandingkan respons survey sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan respons survey pada kelompok yang berbeda
- **Friedman**: Membandingkan respons survey pada waktu yang berbeda

#### 7.3.3 Uji Demografi
- **Mann-Whitney U**: Membandingkan karakteristik demografi antara kelompok
- **Wilcoxon**: Membandingkan karakteristik demografi sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan karakteristik demografi pada kelompok yang berbeda
- **Friedman**: Membandingkan karakteristik demografi pada waktu yang berbeda

### 7.4 Penelitian Bisnis

#### 7.4.1 Uji Kepuasan
- **Mann-Whitney U**: Membandingkan kepuasan pelanggan antara kelompok
- **Wilcoxon**: Membandingkan kepuasan pelanggan sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan kepuasan pelanggan pada kelompok yang berbeda
- **Friedman**: Membandingkan kepuasan pelanggan pada waktu yang berbeda

#### 7.4.2 Analisis Produktivitas
- **Mann-Whitney U**: Membandingkan produktivitas karyawan antara kelompok
- **Wilcoxon**: Membandingkan produktivitas karyawan sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan produktivitas karyawan pada kelompok yang berbeda
- **Friedman**: Membandingkan produktivitas karyawan pada waktu yang berbeda

#### 7.4.3 Uji Penjualan
- **Mann-Whitney U**: Membandingkan performa penjualan antara kelompok
- **Wilcoxon**: Membandingkan performa penjualan sebelum dan sesudah
- **Kruskal-Wallis**: Membandingkan performa penjualan pada kelompok yang berbeda
- **Friedman**: Membandingkan performa penjualan pada waktu yang berbeda

## 8. Best Practices dan Troubleshooting

### 8.1 Best Practices untuk Uji Non-Parametrik

#### 8.1.1 Persiapan Data
- **Data Quality**: Pastikan data lengkap, akurat, dan konsisten
- **Missing Values**: Handle missing values dengan tepat
- **Outliers**: Identifikasi dan handle outliers dengan hati-hati
- **Data Types**: Pastikan tipe data sesuai (ordinal, interval, rasio)
- **Data Distribution**: Periksa distribusi data untuk setiap variabel

#### 8.1.2 Pemilihan Uji
- **Data Type**: Pilih uji berdasarkan tipe data
- **Sample Size**: Pertimbangkan ukuran sampel
- **Assumptions**: Periksa asumsi uji
- **Purpose**: Pilih uji berdasarkan tujuan penelitian

#### 8.1.3 Pelaksanaan Uji
- **Multiple Tests**: Lakukan koreksi multiple comparisons
- **Effect Size**: Hitung dan laporkan effect size
- **Post-hoc**: Lakukan post-hoc analysis jika diperlukan
- **Validation**: Validasi hasil dengan metode lain

#### 8.1.4 Interpretasi Hasil
- **Context**: Interpretasi dalam konteks penelitian
- **Limitations**: Diskusikan keterbatasan uji
- **Implications**: Jelaskan implikasi praktis
- **Recommendations**: Berikan rekomendasi tindakan

### 8.2 Troubleshooting Common Problems

#### 8.2.1 Data Problems

##### Missing Values
- **Problem**: Data tidak lengkap untuk beberapa variabel
- **Solutions**:
  - **Listwise Deletion**: Hapus observasi dengan missing values
  - **Pairwise Deletion**: Gunakan data yang tersedia
  - **Imputation**: Isi missing values dengan nilai yang masuk akal

##### Outliers
- **Problem**: Data ekstrem yang mempengaruhi uji
- **Solutions**:
  - **Identify**: Gunakan box plot, scatter plot, atau statistical tests
  - **Investigate**: Periksa apakah outlier adalah error atau data valid
  - **Handle**: Hapus, transform, atau gunakan robust methods

##### Non-normal Distribution
- **Problem**: Data tidak berdistribusi normal
- **Solutions**:
  - **Transform**: Gunakan log, square root, atau Box-Cox transformation
  - **Robust Methods**: Gunakan metode yang robust terhadap non-normality
  - **Non-parametric**: Gunakan uji non-parametrik

#### 8.2.2 Uji Problems

##### Ties
- **Problem**: Data yang sama dapat menyebabkan masalah
- **Solutions**:
  - **Handle Ties**: Gunakan metode yang tepat untuk handle ties
  - **Document**: Catat keputusan dan alasan
  - **Sensitivity**: Lakukan sensitivity analysis

##### Low Power
- **Problem**: Uji tidak powerful untuk mendeteksi perbedaan
- **Solutions**:
  - **Increase Sample Size**: Tingkatkan ukuran sampel
  - **Effect Size**: Pertimbangkan effect size yang meaningful
  - **Alternative Tests**: Gunakan uji alternatif yang lebih powerful

##### Multiple Comparisons
- **Problem**: Multiple comparisons dapat menyebabkan Type I error
- **Solutions**:
  - **Correction**: Gunakan koreksi multiple comparisons
  - **Bonferroni**: Gunakan koreksi Bonferroni
  - **FDR**: Gunakan False Discovery Rate

### 8.3 Common Mistakes

#### 8.3.1 Data Mistakes
- **Ignoring Missing Values**: Tidak menangani missing values dengan tepat
- **Not Checking Data Quality**: Tidak memeriksa kualitas data
- **Using Wrong Data Types**: Menggunakan tipe data yang salah
- **Not Handling Outliers**: Tidak menangani outlier dengan tepat

#### 8.3.2 Uji Mistakes
- **Wrong Test Selection**: Memilih uji yang salah
- **Ignoring Assumptions**: Tidak memeriksa asumsi uji
- **Not Reporting Effect Size**: Tidak melaporkan effect size
- **Not Doing Post-hoc**: Tidak melakukan post-hoc analysis

#### 8.3.3 Interpretation Mistakes
- **Confusing Correlation with Causation**: Mengacaukan korelasi dengan kausalitas
- **Ignoring Context**: Tidak mempertimbangkan konteks
- **Overinterpreting Results**: Terlalu berlebihan dalam interpretasi
- **Not Discussing Limitations**: Tidak membahas keterbatasan

### 8.4 Software dan Tools

#### 8.4.1 Python
- **scipy.stats**: Statistical tests
- **statsmodels**: Statistical models
- **pandas**: Data manipulation
- **numpy**: Numerical computing
- **matplotlib/seaborn**: Visualization

#### 8.4.2 R
- **wilcox.test()**: Wilcoxon tests
- **kruskal.test()**: Kruskal-Wallis test
- **friedman.test()**: Friedman test
- **ks.test()**: Kolmogorov-Smirnov test
- **shapiro.test()**: Shapiro-Wilk test

#### 8.4.3 SPSS
- **Non-parametric Tests**: Built-in non-parametric tests
- **Mann-Whitney U**: Independent samples
- **Wilcoxon**: Paired samples
- **Kruskal-Wallis**: Multiple independent samples
- **Friedman**: Multiple related samples

#### 8.4.4 SAS
- **PROC NPAR1WAY**: Non-parametric tests
- **PROC FREQ**: Chi-square tests
- **PROC UNIVARIATE**: Goodness of fit tests
- **PROC CORR**: Correlation tests

### 8.5 Reporting Guidelines

#### 8.5.1 Uji Description
- **Variables**: Jelaskan semua variabel yang digunakan
- **Sample Size**: Berikan ukuran sampel
- **Method**: Jelaskan metode yang digunakan
- **Assumptions**: Diskusikan asumsi dan validasi

#### 8.5.2 Results Presentation
- **Tables**: Gunakan tabel yang jelas dan informatif
- **Figures**: Gunakan grafik yang mendukung interpretasi
- **Statistics**: Berikan statistik yang relevan
- **Effect Sizes**: Diskusikan effect sizes, bukan hanya p-values

#### 8.5.3 Interpretation
- **Context**: Interpretasi dalam konteks penelitian
- **Practical Significance**: Diskusikan signifikansi praktis
- **Implications**: Jelaskan implikasi untuk praktik
- **Recommendations**: Berikan rekomendasi tindakan

### 8.6 Analysis Checklist

#### 8.6.1 Pre-analysis
- [ ] Data quality check
- [ ] Missing values analysis
- [ ] Outlier detection
- [ ] Data distribution check
- [ ] Test selection
- [ ] Sample size adequacy

#### 8.6.2 Analysis
- [ ] Test execution
- [ ] Assumption checking
- [ ] Effect size calculation
- [ ] Post-hoc analysis (if needed)
- [ ] Multiple comparisons correction
- [ ] Results validation

#### 8.6.3 Post-analysis
- [ ] Results interpretation
- [ ] Effect size interpretation
- [ ] Practical significance
- [ ] Limitations discussion
- [ ] Recommendations
- [ ] Reporting

## 9. Kesimpulan

### 9.1 Ringkasan Materi

Uji non-parametrik adalah metode statistik yang powerful untuk analisis data yang tidak memenuhi asumsi uji parametrik. Uji ini memungkinkan kita untuk:

1. **Menganalisis Data Non-Normal**: Menggunakan uji yang tidak memerlukan asumsi distribusi normal
2. **Menangani Data Ordinal**: Dapat digunakan untuk data yang dapat diurutkan
3. **Mengontrol Outliers**: Robust terhadap data ekstrem
4. **Membandingkan Kelompok**: Membandingkan dua atau lebih kelompok
5. **Menganalisis Repeated Measures**: Menangani data yang berpasangan

### 9.2 Konsep Kunci

#### 9.2.1 Uji Mann-Whitney U
- **Tujuan**: Membandingkan dua kelompok independen
- **Asumsi**: Data dapat diurutkan, independen
- **Interpretasi**: Perbedaan distribusi antara kelompok
- **Effect Size**: Cohen's r

#### 9.2.2 Uji Wilcoxon
- **Tujuan**: Membandingkan dua kelompok berpasangan
- **Asumsi**: Data dapat diurutkan, berpasangan
- **Interpretasi**: Perbedaan median antara pengukuran
- **Effect Size**: Cohen's r

#### 9.2.3 Uji Kruskal-Wallis
- **Tujuan**: Membandingkan tiga atau lebih kelompok independen
- **Asumsi**: Data dapat diurutkan, independen
- **Interpretasi**: Perbedaan distribusi antara kelompok
- **Effect Size**: Eta-squared

#### 9.2.4 Uji Friedman
- **Tujuan**: Membandingkan tiga atau lebih kelompok berpasangan
- **Asumsi**: Data dapat diurutkan, berpasangan
- **Interpretasi**: Perbedaan distribusi antara pengukuran
- **Effect Size**: Kendall's W

### 9.3 Aplikasi Praktis

Uji non-parametrik memiliki aplikasi yang luas di berbagai bidang:

1. **Penelitian Medis**: Uji efektivitas pengobatan, analisis kualitas hidup
2. **Penelitian Psikologi**: Uji skor tes, analisis rating skala
3. **Penelitian Sosial**: Uji pendapat, analisis survey
4. **Penelitian Bisnis**: Uji kepuasan, analisis produktivitas

### 9.4 Best Practices

#### 9.4.1 Persiapan Data
- Pastikan data berkualitas tinggi
- Handle missing values dengan tepat
- Identifikasi dan handle outliers
- Periksa distribusi data

#### 9.4.2 Pemilihan Uji
- Pilih uji berdasarkan tipe data
- Pertimbangkan ukuran sampel
- Periksa asumsi uji
- Pilih uji berdasarkan tujuan penelitian

#### 9.4.3 Interpretasi
- Interpretasi dalam konteks penelitian
- Diskusikan keterbatasan uji
- Jelaskan implikasi praktis
- Berikan rekomendasi tindakan

### 9.5 Keterbatasan

#### 9.5.1 Asumsi Uji
- Data harus dapat diurutkan
- Observasi harus independen
- Tidak ada ties (idealnya)

#### 9.5.2 Interpretasi
- Hanya menguji perbedaan distribusi
- Tidak dapat memberikan estimasi parameter
- Sulit menginterpretasikan magnitude perbedaan

#### 9.5.3 Praktis
- Memerlukan data berkualitas tinggi
- Interpretasi bisa kompleks
- Memerlukan pengetahuan statistik
- Tidak selalu memberikan jawaban yang jelas

### 9.6 Rekomendasi

#### 9.6.1 Untuk Peneliti
- Pahami asumsi uji sebelum menggunakan
- Validasi hasil dengan metode lain
- Diskusikan keterbatasan dalam laporan
- Gunakan multiple methods untuk validasi

#### 9.6.2 Untuk Praktisi
- Pastikan data berkualitas tinggi
- Gunakan software yang tepat
- Interpretasi hasil dengan hati-hati
- Konsultasi dengan ahli statistik jika perlu

#### 9.6.3 Untuk Pembelajar
- Pahami konsep dasar sebelum praktik
- Latihan dengan data nyata
- Pelajari berbagai metode
- Jangan takut bertanya

### 9.7 Penutup

Uji non-parametrik adalah teknik statistik yang powerful dan versatile yang dapat memberikan insights yang valuable untuk penelitian dan pengambilan keputusan. Namun, teknik ini memerlukan pemahaman yang baik tentang asumsi, keterbatasan, dan interpretasi yang tepat.

Dengan mengikuti best practices dan menghindari common mistakes, uji non-parametrik dapat menjadi alat yang sangat berguna untuk analisis data yang tidak memenuhi asumsi uji parametrik. Ingatlah bahwa statistik adalah alat untuk membantu pemahaman, bukan untuk menggantikan pemikiran kritis dan konteks penelitian.

Selamat belajar dan semoga sukses dalam penerapan uji non-parametrik dalam penelitian Anda!
