# Modul 4: Analisis Statistik Infernsial (Non-Parametrik)

### Objectives Praktikum

1. Praktikan mampu memahami prinsip-prinsip dasar analisis statistik inferensial nonparametrik, yaitu uji Run (uji keacakan), uji Sign (uji tanda), uji Wilcoxon Sign-Rank, dan uji Mann Whitney U
2. Praktikan mampu melakukan uji Run, uji Sign, uji Wilcoxon Sign-Rank, dan uji Mann Whitney U pada Stata & Jupyter.

### Review Teori

Analisis statistik inferensial merupakan analisis yang menarik kesimpulan mengenai karakteristik suatu populasi dari observasi terhadap sampel (Kachigan, 1982). Analisis statistik ini dapat dilakukan dengan dua pendekatan, yaitu estimasi parameter dan pengujian hipotesis. Estimasi parameter dilakukan dengan langsung memperkirakan karakteristik populasi melalui pengamatan sampel. Pengujian hipotesis dilakukan dengan menjadikan kesimpulan pengamatan sampel sebagai landasan untuk mendukung atau menentang hipotesis awal dalam menggambarkan karakteristik populasi. 

Pengujian hipotesis terbagi dua, yaitu pengujian hipotesis parametrik untuk data yang memiliki distribusi normal dan pengujian hipotesis nonparametrik untuk data yang memiliki distribusi tidak normal (Healey, 2012; Chase and Bown, 1998; Kachigan, 1982). Pengujian hipotesis nonparametrik di antaranya adalah uji Run, uji Sign, uji Wilcoxon Sign-Rank, dan uji Mann Whitney U. Adapun kegunaan masing-masing uji diuraikan sebagai berikut:

1. Uji Run dilakukan untuk mengetahui keacakan dari proses pengambilan sampel;
2. Uji Sign dilakukan untuk mengetahui ada tidaknya perbedaan yang nyata dari sampel berpasangan. Pasangan yang dimaksud biasanya kondisi sebelum dan sesudah, yang dinyatakan dalam bentuk tanda positif dan negatif. Uji ini hanya melihat arah dan ada tidaknya perbedaan nyata tanpa memperhatikan besarnya perbedaan;
3. Uji Wilcoxon Sign-Rank awalnya diperkenalkan sebagai penyempurnaan uji Sign. Selain memperhatikan  tanda perbedaan, uji ini memperhatikan besarnya perbedaan dalam menentukan ada tidaknya perbedaan nyata dari sampel berpasangan;
3. Uji Mann Whitney U dilakukan untuk mengetahui ada tidaknya perbedaan yang nyata dari sampel independen.

### Hands-on Praktikum

Melalui praktikum ini, praktikan diarahkan untuk melakukan pengujian hipotesis parametrik berupa uji Run, uji Sign (dengan 1 variabel dan 2 variabel), uji Wilcoxon Sign-Rank (dengan 1 variabel dan 2 variabel), dan uji Mann Whitney U.

#### 1. Uji Run
Uji Run merupakan uji yang digunakan untuk mengetahui keacakan dari proses pengambilan sampel. Satu Run adalah satu deretan simbol yang sama.

![uji run](img/img1.png)

Pada pengujian kali ini, data yang digunakan adalah data suatu kabupaten yang berupa kawasan perdesaan dengan kegiatan ekonomi utama berupa pertanian. Dalam musim panen ini, kabupaten ini mengalami kerugian akibat gagal panen yang dialami beberapa kecamatan. Pemerintah Daerah, khususnya Dinas Pertanian, ingin mengetahui apakah kegagalan tersebut terjadi secara acak (kebetulan) atau diakibatkan kesalahan dalam proses sebelum panen. Untuk itu, diambil sampel kecamatan A-Z dengan klasifikasi hasil panen 1=Berhasil dan 2=Gagal).

In [1]:
use "data/run.dta"


  ___  ____  ____  ____  ____ ©
 /__    /   ____/   /   ____/      17.0
___/   /   /___/   /   /___/       BE—Basic Edition

 Statistics and Data Science       Copyright 1985-2021 StataCorp LLC
                                   StataCorp
                                   4905 Lakeway Drive
                                   College Station, Texas 77845 USA
                                   800-STATA-PC        https://www.stata.com
                                   979-696-4600        stata@stata.com

Stata license: 25-student lab, expiring 14 Nov 2023
Serial number: 301709411476
  Licensed to: azwanaza
               Labscan PWK SAPPK ITB

Notes:
      1. Unicode is supported; see help unicode_advice.


In [2]:
%head 5

Unnamed: 0,kecamatan,h_panen
1,A,1
2,B,1
3,C,1
4,D,2
5,E,1


Berikut adalah langkah-langkah Uji Run:
a. Untuk melihat distribusi dan jumlah runs pada data hasil panen, dapat dituliskan command:

In [3]:
runtest h_panen

 N(h_panen <= 1) = 19
 N(h_panen >  1) = 7
             obs = 26
         N(runs) = 12
              z  = .4
        Prob>|z| = .6899999999999999


* Terdapat 19 panen yang berhasil, ditunjukkan oleh nilai N(h_panen<= 1);
* Terdapat 7 panen yang gagal, ditunjukkan oleh nilai N(h_panen > 1);
* Terdapat 12 Runs, ditunjukkan oleh N (runs).

b. Langkah yang selanjutnya dilakukan adalah menentukan hipotesis awal. Pada kasus ini, hipotesis awal adalah sebagai berikut.
* H0 = Kegagalan panen bersifat acak (sig => 0,05);
* H1 = Kegagalan panen tidak bersifat acak (sig < 0,05)

Untuk menentukan hipotesis awal yang diterima, **H0 diterima jika nilai signifikansi   > 0,05**. Nilai signifikansi dilihat dari nilai prob>|z| yang diperoleh. Pada kasus ini nilai prob > |z| yaitu 0,69 > 0,05, maka H0 diterima. Artinya, terjadinya gagal panen bersifat acak (kebetulan), bukan karena adanya kesalahan teknis dalam proses sebelum panen seperti penanaman, pembibitan, dan sebagainya.

#### 2. Uji Sign
Uji Sign merupakan uji yang dilakukan untuk mengetahui ada tidaknya perbedaan yang nyata dari sampel berpasangan. Pasangan yang dimaksud biasanya kondisi sebelum dan sesudah, yang dinyatakan dalam bentuk tanda positif dan negatif. Uji ini hanya melihat arah dan ada tidaknya perbedaan nyata tanpa memperhatikan besarnya perbedaan. Uji Sign tersebut memiliki 2 bentuk, yaitu dengan menggunakan 1 variabel dan dengan menggunakan 2 variabel.

Pada pengujian kali ini, digunakan data yang berisi data nilai kesejahteraan masyarakat sebelum Program Bandung Juara dan sesudah Program Bandung Juara.

In [4]:
use "data/sign test sign rank dan wilcoxon.dta", clear

In [5]:
%head 5

Unnamed: 0,Responden,sejahterasb,sejahterasd
1,Hana,60,90
2,Novia Lesmana,70,85
3,Muliati,60,90
4,Tirfan Juandi,60,90
5,Fajar Muhammadh,60,90


Berikut langkah-langkah **Uji Sign dengan 1 variabel**.

a. Menentukan hipotesis. Pada kasus ini, diasumsikan bahwa nilai kesejahteraan masyarakat dinilai baik jika mencapai nilai 80. Terdapat 3 hipotesis yang mungkin dibuat, yaitu:

**Hipotesis one-tailed (1)**:
* H0 : Nilai median pada populasi <= 80 (sig=>0.05);
* H1 : Nilai median pada populasi > 80 (sig<0.05).

**Hipotesis one-tailed (2)**:
* H0 : Nilai median pada populasi >= 80 (sig=>0.05);
* H1 : Nilai median pada populasi < 80 (sig<0.05).

**Hipotesis two-tailed (1)**:
* H0 : Nilai median pada populasi = 80 (sig=>0.05);
* H1 : Nilai median pada populasi ≠ 80 (sig<0.05).

b. Menuliskan command berikut.

In [6]:
signtest sejahterasd = 80


Sign test

        Sign |    Observed    Expected
-------------+------------------------
    Positive |          24        25.5
    Negative |          27        25.5
        Zero |          23          23
-------------+------------------------
         All |          74          74

One-sided tests:
  H0: median of sejahter~d - 80 = 0 vs.
  Ha: median of sejahter~d - 80 > 0
      Pr(#positive >= 24) =
         Binomial(n = 51, x >= 24, p = 0.5) = 0.7121

  H0: median of sejahter~d - 80 = 0 vs.
  Ha: median of sejahter~d - 80 < 0
      Pr(#negative >= 27) =
         Binomial(n = 51, x >= 27, p = 0.5) = 0.3899

Two-sided test:
  H0: median of sejahter~d - 80 = 0 vs.
  Ha: median of sejahter~d - 80 != 0
      Pr(#positive >= 27 or #negative >= 27) =
         min(1, 2*Binomial(n = 51, x >= 27, p = 0.5)) = 0.7798


Untuk menentukan hipotesis awal yang diterima, **H0 diterima jika nilai signifikansi > 0,05**. Pada hasil two-sided test, karena 0,7798 > 0,05, H0 diterima. Berarti, nilai median pada populasi sama dengan 80 sehingga tidak perlu melihat hasil one-sided test. Berarti, karena median mencapai angka 80, nilai kesejahteraan masyarakat dapat dinilai baik.

Berikut langkah-langkah **Uji Sign dengan 2 variabel**
a. Menentukan hipotesis. Terdapat 3 hipotesis yang mungkin dibuat, yaitu:

**Hipotesis one-tailed (1)**:
* H0 : Nilai median kesejahteraan sesudah program – kesejahteraan sebelum program <= 0 (sig=>0.05) 
* H1 : Nilai median kesejahteraan sesudah program – kesejahteraan sebelum program > 0 (sig<0.05)

**Hipotesis one-tailed (2)**:
* H0 : Nilai median kesejahteraan sesudah program – kesejahteraan sebelum program >= 0 (sig=>0.05) 
* H1 : Nilai median kesejahteraan sesudah program – kesejahteraan sebelum program < 0 (sig<0.05) 

**Hipotesis two-tailed (1)**:
* H0 : Nilai median kesejahteraan sesudah program – kesejahteraan sebelum program = 0 (sig=>0.05) 
* H1 : Nilai median kesejahteraan sesudah program – kesejahteraan sebelum program ≠ 0 (sig<0.05)

b. Menuliskan command sebagai berikut

In [7]:
signtest sejahterasd = sejahterasb


Sign test

        Sign |    Observed    Expected
-------------+------------------------
    Positive |          49        25.5
    Negative |           2        25.5
        Zero |          23          23
-------------+------------------------
         All |          74          74

One-sided tests:
  H0: median of sejahter~d - sejahterasb = 0 vs.
  Ha: median of sejahter~d - sejahterasb > 0
      Pr(#positive >= 49) =
         Binomial(n = 51, x >= 49, p = 0.5) = 0.0000

  H0: median of sejahter~d - sejahterasb = 0 vs.
  Ha: median of sejahter~d - sejahterasb < 0
      Pr(#negative >= 2) =
         Binomial(n = 51, x >= 2, p = 0.5) = 1.0000

Two-sided test:
  H0: median of sejahter~d - sejahterasb = 0 vs.
  Ha: median of sejahter~d - sejahterasb != 0
      Pr(#positive >= 49 or #negative >= 49) =
         min(1, 2*Binomial(n = 51, x >= 49, p = 0.5)) = 0.0000


Untuk menentukan hipotesis awal yang diterima, **H0 diterima jika nilai signifikansi > 0,05**. Pada hasil two-sided test, karena 0 < 0,05, H0 ditolak dan H1 diterima. Berarti, selisih nilai median kesejahteraan masyarakat sesudah dan sebelum adanya program Bandung Juara tidak sama dengan 0. Berarti, nilai kesejahteraan masyarakat Sekeloa mengalami perubahan antara sebelum dan sesudah adanya program Bandung Juara. 
Perubahan dapat dilihat pada hasil one-sided test. Pada one-sided test pertama, karena 0 < 0,005, H0 ditolak dan H1 diterima. Nilai median kesejahteraan sesudah program – kesejahteraan sebelum program > 0 (sig<0.05). Berarti, terdapat peningkatan persepsi penilaian tingkat kesejahteraan masyarakat Sekeloa setelah adanya program Bandung Juara.
Jika dilihat dari one-sided test kedua pun hasilnya sama. Karena 1 > 0,005, berarti H0 diterima. Nilai median kesejahteraan sesudah program – kesejahteraan sebelum program >= 0 (sig=>0.05). Berarti terdapat peningkatan persepsi penilaian tingkat kesejahteraan masyarakat Sekeloa setelah adanya program Bandung Juara.


#### 3. Uji Wilcoxon Sign-Rank
Terdapat 2 bentuk Uji Wilcoxon Sign-Rank, yaitu dengan menggunakan 1 variabel dan dengan menggunakan 2 variabel.

**Uji Wilcoxon Sign-Rank 1 Variabel**

Uji ini digunakan untuk melihat distribusi data pada satu data. Data yang digunakan masih data mengenai kesejahteraan sesudah program Bandung Juara. Berikut merupakan langkah-langkah untuk melakukan Uji Wilcoxon Sign-Rank 1 variabel.

a. Menentukan hipotesis
* H0 : Nilai median pada populasi = 80 (sig=>0.05) 
* H1 : Nilai median pada populasi ≠ 80 (sig<0.05)

b. Menulis command sebagai berikut.

In [9]:
signrank sejahterasd = 80


Wilcoxon signed-rank test

        Sign |      Obs   Sum ranks    Expected
-------------+---------------------------------
    Positive |       24         958      1249.5
    Negative |       27        1541      1249.5
        Zero |       23         276         276
-------------+---------------------------------
         All |       74        2775        2775

Unadjusted variance    34456.25
Adjustment for ties     -123.75
Adjustment for zeros   -1081.00
                     ----------
Adjusted variance      33251.50

H0: sejahterasd = 80
         z = -1.599
Prob > |z| = 0.1099
Exact prob = 0.1107


Berdasarkan hasil uji tersebut didapatkan bahwa:
* Nilai kesejahteraan sesudah program Bandung Juara > 80 → Rank positif = 24
* Nilai kesejahteraan sesudah program Bandung Juara < 80 → Rank negatif= 27
* Nilai kesejahteraan sesudah program Bandung Juara = 80 → Zero = 23

Berdasarkan hasil uji, didapatkan bahwa nilai prob>|z| yaitu 0,1099 > 0,05, maka H0 diterima. Artinya, nilai median pada populasi sama dengan 80.

**Uji Wilcoxon Sign-Rank 2 variabel**

Uji ini digunakan untuk kasus dua sampel yang dependen atau saling bergantungan/terkait. Uji ini menggunakan W sebagai statistik uji, yang merupakan jumlah Rank positif atau negatif berdasarkan perbedaan nilai setiap kasus dengan median yang diuji. Berikut merupakan langkah-langkah untuk melakukan **Uji Wilcoxon Sign-Rank Test 2 variabel**.

a. Menentukan hipotesis
* H0 : Tidak ada perbedaan nilai median populasi dari dua variabel dependen (sig=>0.05) 
* H1 : Terdapat perbedaan nilai median populasi dari dua variabel dependen (sig<0.05) 

b. Menuliskan command sebagai berikut

In [10]:
signrank sejahterasd = sejahterasb


Wilcoxon signed-rank test

        Sign |      Obs   Sum ranks    Expected
-------------+---------------------------------
    Positive |       49        2383      1249.5
    Negative |        2         116      1249.5
        Zero |       23         276         276
-------------+---------------------------------
         All |       74        2775        2775

Unadjusted variance    34456.25
Adjustment for ties     -101.38
Adjustment for zeros   -1081.00
                     ----------
Adjusted variance      33273.88

H0: sejahterasd = sejahterasb
         z =  6.214
Prob > |z| = 0.0000
Exact prob = 0.0000


Berdasarkan hasil uji tersebut didapatkan bahwa:
* Nilai kesejahteraan sebelum program Bandung Juara < Nilai kesejahteraan sesudah program Bandung Juara → Rank positif = 49
* Nilai kesejahteraan sebelum program Bandung Juara > Nilai kesejahteraan sesudah program Bandung Juara → Rank negatif = 2
* Nilai kesejahteraan sebelum program Bandung Juara = Nilai kesejahteraan sesudah program Bandung Juara → Zero = 23

Berdasarkan hasil uji, didapatkan nilai prob>|z| yaitu 0,0000 < 0,05, maka H1 diterima. Artinya, terdapat perbedaan antara nilai kesejahteraan sebelum dan sesudah program Bandung Juara.

#### 4. Uji Mann-Whitney U
Uji Mann-Whitney atau Uji U merupakan uji yang dilakukan untuk membandingkan dua median populasi berdasarkan suatu pengurutan semua sampel data secara merata. Uji U ini bisa membandingkan dua sampel yang independen. Data kedua sampel digabungkan dan diberi peringkat dari terkecil hingga terbesar. 

Pada pengujian kali ini, data yang digunakan adalah data yang berisi data nilai persepsi masyarakat terhadap kesejahteraan dan pendidikan di Kelurahan Sekeloa setelah adanya program Bandung Juara. Data ini berisi nilai mata pelajaran Fisika (1) dan Biologi (2) kelas A.

In [11]:
use "data/mann-whitney.dta", clear

In [12]:
%head 5

Unnamed: 0,mata_pel,nilai
1,1,24
2,1,43
3,1,58
4,1,71
5,1,43


Berikut merupakan langkah-langkah untuk melakukan Uji Mann-Whitney U
a. Menentukan hipotesis
* H0 : Tidak ada perbedaan nilai median populasi dari dua variabel independen (sig=>0.05) 
* H1 : Terdapat perbedaan nilai median populasi dari dua variabel independen (sig<0.05)

b. Menuliskan command sebagai berikut.

In [13]:
ranksum nilai, by(mata_pel)


Two-sample Wilcoxon rank-sum (Mann–Whitney) test

    mata_pel |      Obs    Rank sum    Expected
-------------+---------------------------------
Nilai Fisika |       21         410         357
Nilai Biolog |       12         151         204
-------------+---------------------------------
    Combined |       33         561         561

Unadjusted variance      714.00
Adjustment for ties       -1.79
                     ----------
Adjusted variance        712.21

H0: nilai(mata_pel==Nilai Fisika) = nilai(mata_pel==Nilai Biologi)
         z =  1.986
Prob > |z| = 0.0470
Exact prob = 0.0470


Berdasarkan hasil uji, nilai signifikansi (prob>|z|) yang ada di dalam tabel, maka diketahui bahwa nilai prob>|z| yaitu 0,047 < 0,05. Maka H0 ditolak dan H1 diterima, sehingga dapat disimpulkan bahwa terdapat perbedaan antara nilai median mata pelajaran fisika dan biologi.

Daftar Pustaka

Chase, W, & Bown F. (1998). General Statistics. John Wiley and Sons.

Healey, J. F. (2012). Statistics, A Tool for Social Research. Wadsworth Publishing Company.

Kachigan, S. K. (1982). Statistical Analysis. Radius Press: New York.

(2012). Solusi Praktis dan Mudah Menguasai SPSS 20 untuk Pengolahan Data. Penerbit Andi: Yogyakarta.