# Modul 5: Analisis Asosiasi

### Objectives Praktikum

1. Praktikan mampu memahami prinsip-prinsip dasar analisis statistik asosiasi
2. Praktikan mampu melakukan uji asosiasi untuk data nominal, data ordinal, data interval rasio pada Stata & Jupyter.

### Review Teori

Metode Analisis Asosiasi merupakan teknik statistik yang membantu untuk menilai adanya hubungan antara dua atau lebih karakteristik objek atau yang disebut sebagai variabel, dengan menjawab beberapa pertanyaan tentang:

1. Keberadaan hubungan, yang berkaitan dengan ada atau tidaknya hubungan antara dua variabel yang diuji.
2. Keeratan hubungan, yang berkaitan dengan derajat hubungan antar variabel (apakah hubungan sangat erat, cukup erat, atau lemah)
3. Arah hubungan, yang berkaitan dengan arah hubungan yang sama atau berbeda antara satu variabel dengan variabel lainnya yang ditunjukan dengan positif atau negatifnya nilai koefisien
4. Sifat hubungan, berkaitan dengan pola hubungan yang dapat ditunjukan dengan hubungan matematis antar varaibel. (Kachigan, 1986; Healey, 2010)

Selain itu menurut Kachigan (1986), hubungan yang ada antar dua variabel memiliki dua tipe dasar yaitu hubungan eksperimental dan hubungan korelasional. Hubungan bersifat eksperimen didasarkan pada percobaan serta menunjukan hubungan sebab akibat, sedangkan hubungan bersifat korelasi didasarkan pada lingkungan alamiah serta tidak menunjukan hubungan sebab akibat. Terdapat beberapa metode yang dapat digunakan dalam analisis asosiasi yang bergantung pada skala pengukuran datanya, yaitu (Healey,2012): Metode Analisis Asosiasi Variabel Nominal, Metode Asosiasi Variabel Ordinal, dan Metode Asosiasi Variabel Interval Rasio. Jenis-jenis analisis yang berada dalam lingkup analisis statistik asosiasi dapat terlihat pada tabel berikut ini:


| Penerapan                        | Nominal                                                                 | Ordinal                                                                                                                      | Interval/Rasio                                      |
|----------------------------------|-------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------------|
| **Asosiasi Bersifat Korelatif**  | **Ukuran Korelasi Berbasis Chi-Square**<br>Koefisien Phi<br>Koefisien V Creamer<br>Koefisien Kontingensi C<br>**Ukuran Korelasi Berbasis Proportional Reduction Error (PRE)**<br>Koefisien Lambda | Ukuran Korelasi Variabel Ordinal Kontinyu<br>Koefisien Korelasi Tau Kendal<br>Koefisien Korelasi Rho Spearmen<br>Ukuran Korelasi Variabel Ordinal Collapsed<br>Koefisien Gamma<br>Koefisien d Sommer<br>Koefisien Tau-b Kendal | Koefisien Korelasi r Pearson (Product Moment) |
| **Asosiasi Bersifat Eksperimental** |                                                                         |                                                                                                                             | Analisis Variansi (ANOVA)<br>Analisis Regresi       |


Pada praktikum ini akan dilakukan analisis statistik asosiasi dengan melakukan uji asosiasi untuk data nominal yaitu Cramer’s V, untuk data ordinal collapse dengan gamma dan Kendall’s tau-b, dan untuk interval rasio dengan R-Pearson, ANOVA, serta regresi linier 1 variabel.

### Hands-on Praktikum

Pada bagian ini akan dibahas contoh kasus, tujuan dari pengolahan, dan tahapan analisis.

**Contoh Kasus:**

Pemerintah Kabupaten A merencanakan sebuah program yang akan dilaksanakan di Desa B. Sebelum menerapkan program tersebut pemerintah terlebih dahulu ingin mengetahui karakteristik dari Desa B dilihat dari hubungan antara variabel pekerjaan dan jenis kelamin, variabel pendidikan terakhir dan tingkat pendapatan, kondisi jalan dan kondisi drainase, total pendapatan dan total pengeluaran, total pendapatan dan pekerjaan serta total pengeluaran dan total pendapatan. Untuk mengetahui karakteristik dari masyarakat Desa B tersebut pemerintah melakukan survei terhadap 110 masyarakat Desa B. 

Berdasarkan contoh kasus tersebut, maka penyelesaian dapat dilakukan dengan beberapa tahapan yaitu: (1) merumuskan pertanyaan penelitian; (2) memasukkan data pada Stata; (3) mengolah data menggunakan Stata; (4) menganalisis hasil pengolahan data dan melakukan interpretasi.

#### 1. Merumuskan Pertanyaan Penelitian
Dari contoh kasus tersebut maka didapat beberapa pertanyaan penelitian yaitu:
* Bagaimanakah hubungan antara variabel pekerjaan dan jenis kelamin?
* Bagaimanakah hubungan antara variabel pendidikan terakhir dan tingkat pendapatan?
* Bagaimanakah hubungan antara variabel kondisi jalan dan kondisi drainase?
* Bagaimanakah hubungan antara variabel total pendapatan dan total pengeluaran?
* Bagaimanakah hubungan antara variabel total pendapatan dan pekerjaan?
* Bagaimanakah hubungan antara variabel total pengeluaran dan total pendapatan?

#### 2. Memasukkan Data

In [None]:
use "data/data05.dta"

In [None]:
%head 5

#### 3. Mengolah data

Analisis data akan dilakukan sesuai dengan jenis variabel yang ada pada pertanyaan penelitian. 

##### A. Nominal (Uji Cramer’s V)

Untuk mengetahui hubungan antara pekerjaan dan jenis kelamin dilakukan uji Cramer’s V karena dalam analisis statistik asosiasi yang digunakan harus mengikuti data dengan skala pengukuran terendah dimana skala pengukuran dari data pekerjaan adalah nominal dan skala pengukuran dari data jenis kelamin juga nominal.

Langkah Penyelesaian:

Menampilkan hasil semua uji analisis statistik asosiasi.

In [None]:
tab Pekerjaan Jenis_Kelamin, all exact

Hasilnya menunjukan nilai dari setiap uji yang dilakukan pada analisis statistik asosiasi. Namun terdapat cara lain untuk mengetahui 1 nilai statistik uji yang dibutuhkan yaitu, sebagai berikut:

Menampilkan hasil Uji Cramer’s V

In [None]:
tab Pekerjaan Jenis_Kelamin , chi2 V


Hipotesa:
* H0 = Tidak ada hubungan antar kedua variabel (variabel pekerjaan
dan jenis kelamin).
* H1 = Ada hubungan antar kedua variabel (variabel pekerjaan dan
jenis kelamin).

Ketika Pr atau signifikasi ≤ 0.05 maka H1 yang diterima, dan ketika Pr atau signifikasi ≥ 0.05 H0 yang diterima. Karena pada gambar diatas terlihat bahwa Pr=0.000 maka H1 yang diterima. Hal ini menunjukan bahwa terdapat hubungan antara pekerjaan dan jenis kelamin. Hal ini juga dibuktikan dengan nilai Pearson Chi2 (X2) untuk df = 9 adalah 43.8513 dimana berada di wilayah kritis (berdasarkan tabel chi square pada signifikansi 0,05) yakni X2>16,9190 sehingga H0 dapat ditolak.

Ketika nilai Cramer’s V = 0 maka tidak terdapat hubungan antara pekerjaan dan jenis kelamin, dan ketika nilai Cramer’s V = 1 maka terdapat hubungan yang sangat kuat antara jenis kelamin dan pekerjaan. Sehingga, dengan nilai Cramer’s V 0.6314 menunjukan terdapat hubungan yang cukup kuat antara pekerjaan dan jenis kelamin.

##### B. Ordinal Collapse Non Matriks Persegi (Uji Gamma)

In [None]:
tab Pendidikan_Terakhir tkt_pendapatn, gamma

Pada hasil tersebut terlihat bahwa nilai gamma yang didapat adalah 
-0.0675. Karena nilai gamma ≠ 0 maka terdapat hubungan antara Pendidikan terakhir dan tingkat pendapatan serta semua kasus dari dua variabel tersebut diurutkan dalam urutan yang berkebalikan (karena nilai gamma negative).

Untuk melihat kekuatan hubungan dari uji Gamma dapat dilihat pada tabel berikut:

| Nilai Gamma | Kekuatan |
|---------|---------|
| 0.0-0.3 | Lemah |
| 0.31-0.6 | Moderat |
| >0.6 | Kuat |



##### C. Ordinal Collapse Matriks Persegi (Uji Kendall’s tau-b)

In [None]:
tab Kondisi_Jalan Kondisi_Drainase, taub

Apabila Kendall’s tau- b bernilai 0 maka tidak ada hubungan antara kedua variabel, dan jika nilai kendall’s tau-b adalah 1 maka terdapat hubungan sempurna antara kedua variabel dimana jika positif maka hubungannya searah dan jika negative berkebalikan. Pada hasil analisis di atas didapat nilai Kendall’s tau-b 0.0509 yang berarti terdapat hubungan antara kondisi jalan dan kondisi drainase tetapi tidak sempurna serta searah.


##### D. Interval Rasio (Pearson Correlation)

In [None]:
correlate Total_Pendapatan Total_Pengeluaran

Berdasarkan hasil analisis di atas, didapat nilai Pearson Correlation adalah 0.2039. Sehingga nilai tersebut menunjukan terdapat hubungan antara total pendapatan dan total pengeluaran. Selain itu nilai positif menunjukan arah hubungan yang sama antara variabel total pendapatan dan total pengeluaran. Jadi, total pengeluaran akan meningkat seiring meningkatnya total pendapatan.

##### E. ANOVA

In [None]:
anova Total_Pendapatan Pekerjaan //variabel dependen terlebih dahulu lalu variabel independent

Hipotesis yang akan diuji dalam Uji ANOVA adalah sebagai berikut :

* Ho: Tidak ada perbedaan rata-rata antara total pendapatan pada setiap jenis pekerjaan
* H1: Ada perbedaan rata-rata antara total pendapatan pada setiap jenis pekerjaan

Untuk menentukan Ho atau Ha yang diterima maka ketentuan yang harus diikuti adalah sebagai berikut : 
a) Jika Prob>F diatas 0.05, maka H0 diterima .
b) Jika Prb>F dibawah 0.05, maka H0 ditolak.

Berdasarkan hasil analisis di atas didapat nilai Prob>F 0.4929 maka H0 diterima sehingga tidak ada perbedaan rata-rata antara total pendapatan pada setiap jenis pekerjaan. Sehingga pekerjaan tidak mempunya pengaruh terhadap total pendapatan.

##### E. ANOVA

Mengetahui persamaan garis regresi,

In [None]:
regress Total_Pengeluaran Total_Pendapatan // variabel dependen terlebih dahulu, setelah itu variabel independent

Dari hasil analisis di atas didapat nilai Adj R-squared adalah 0.0327. Nilai tersebut menunjukan bahwa terdapat hubungan yang cukup lemah dimana total pendapatan hanya dapat menjelaskan 3.27% nilai total pengeluaran. Selain itu didapat nilai F 4.69. Dan nilai Prob>F adalah 0.0326, karena nilai **Prob>F kurang dari 0.05** menunjukan bahwa **regresi dapat dipakai**. Selanjutnya diketahui pula Koefisien total pendapatan adalah 0.1248279 dan Konstanta 2079870. Sehingga dapat diketahui persamaan dari regresi ini adalah Y = 2079870 + 0.1248279 X.


Selanjutnya, perlu dilihat juga signifikansi koefisien x dan konstanta dari persamaan regresi yang dihasilkan. Dengan melihat signifikansi dari kolom “P > |t|” terlihat bahwa nilai keduanya, koefisien total pendapatan dan konstantanya masing – masing 0,033 serta 0,000 yang mana nilainya lebih kecil dari 0,05 sehingga kedua koefisien ini memiliki keberartian dalam model ini.

Mengetahui Grafik Regresi

In [None]:
predict prediksi_pengeluaran, xb

Command diatas digunakan untuk memprediksi nilai pengeluaran menggunakan persamaan regresi yang telah terbentuk. Sehingga pada dataset akan didapat satu variabel baru yaitu variabel prediksi pengeluaran.

In [None]:
twoway (scatter Total_Pengeluaran Total_Pendapatan, sort)(line prediksi_pengeluaran Total_Pendapatan, sort)

Grafik tersebut menunjukan persebaran nilai total pengeluaran serta garis prediksi yang didapat dari persamaan regresi. Sebagian besar persebaran nilai total pengeluaran berada di sekitar garis prediksi atau regresi itu sendiri. 

Daftar Pustaka

Sawitri, Dewi. Maryati, Sri. 2014. Metode Analisis Perencanaan. Penerbit Universitas Terbuka: Tangerang.

Healey J F. Statistics, A Tool for Social Research, Ninth Edition. Wadsworth Publishing Company.2012 

Kachigan, Sam Kash. 1982. Statistical Analysis. Radius Press: New York.