### RANGKUMAN TEKNIK SAMPLING 
- Populasi merupakan wilayah generalisasi atau keseluruhan dari sesuatu yang sedang dipelajari karakteristiknya. 
- Sampel merupakan bagian dari dari populasi.
- Jadi sampel adalah sebagian dari keseluruhan obyek yang akan diteliti atau dievaluasi yang memiliki karakteristik tertentu dari sebuah populasi.
- Cara menentukan sampel disebut dengan teknik sampling atau teknik penyampelan.

In [137]:
import random
import pandas as pd
from faker import Faker

fake = Faker('id_ID')

names = set()
while len(names) < 50:
    names.add(fake.name())

names = list(names)

cities = ["Jakarta", "Surabaya", "Malang", "Yogyakarta"]
education = ["SD", "SMP", "SMA", "PT"]
jobs = ["Guru", "Dokter", "Insinyur", "Akuntan", "Developer", "Desainer", "Polisi"]
genders = ["Laki-laki", "Perempuan"]

data = []

for name in names:
    item = {
        "Nama": name,
        "Umur": random.randint(18, 65),
        "Kota": random.choice(cities),
        "Pendidikan Terakhir": random.choice(education),
        "Jenis Pekerjaan": random.choice(jobs),
        "Jenis Kelamin": random.choice(genders)
    }
    data.append(item)

df = pd.DataFrame(data)
df.to_csv("sampling.csv", index=False)

In [138]:
from tabulate import tabulate
print(tabulate(df, headers='keys', tablefmt='psql'))

+----+-------------------------------+--------+------------+-----------------------+-------------------+-----------------+
|    | Nama                          |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|----+-------------------------------+--------+------------+-----------------------+-------------------+-----------------|
|  0 | Drs. Uda Andriani             |     38 | Malang     | SD                    | Insinyur          | Laki-laki       |
|  1 | dr. Nova Prasasta, S.Pt       |     59 | Surabaya   | PT                    | Polisi            | Perempuan       |
|  2 | Ir. Darman Suryono            |     19 | Yogyakarta | SMP                   | Dokter            | Perempuan       |
|  3 | Sakura Santoso, M.Ak          |     40 | Jakarta    | SD                    | Insinyur          | Laki-laki       |
|  4 | Digdaya Purnawati             |     47 | Yogyakarta | SD                    | Guru              | Laki-laki       |
|  5 | Drs. Pia 

### A. Teknik Sampling Probabilitas
- Probability sampling adalah teknik pengambilan sampel yang memberikan peluang yang sama bagi setiap unsur (anggota) populasi untuk dipilih menjadi anggota sampel. 
- Teknik ini merupakan teknik yang memungkinkan peneliti atau evaluator untuk membuat generalisasi dari karakteristik sampel menjadi karakteristik populasi. 

#### 1. Simple Random Sampling
Penyampelan acak sederhana, memiliki maksud bahwa sebanyak n sampel diambil dari populasi N dan tiap anggota populasi mempunyai peluang yang sama untuk terambil.  

Terdapat 3 (tiga) cara untuk menentukan sampel dengan mengunakan teknik ini, yaitu:
- Cara undian 
- Mengambil perwakilan dari setiap beberapa baris
- Menggunakan komputer untuk memberi hasil acak

In [139]:
# Contoh mengambil 1 perwakilan untuk setiap 5 baris (total 10 sampel)
sample = []
count = 1
temp = []
for i in range(0, len(df)):
    temp.append(df.iloc[i])
    count += 1

    if count % 5 == 0:
        sample.append(random.choice(temp))
        temp = []
        
print(tabulate(sample, headers='keys', tablefmt='psql'))

+-------------------------------+--------+------------+-----------------------+-------------------+-----------------+
| Nama                          |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|-------------------------------+--------+------------+-----------------------+-------------------+-----------------|
| Sakura Santoso, M.Ak          |     40 | Jakarta    | SD                    | Insinyur          | Laki-laki       |
| drg. Wardi Wibowo             |     42 | Jakarta    | SMA                   | Guru              | Perempuan       |
| Siska Siregar                 |     29 | Yogyakarta | SD                    | Guru              | Laki-laki       |
| Dr. Almira Wijayanti          |     57 | Surabaya   | SMA                   | Insinyur          | Perempuan       |
| drg. Nadia Utami              |     42 | Yogyakarta | SD                    | Developer         | Perempuan       |
| Rahayu Prayoga, S.E.          |     64 | Jakarta    | 

In [140]:
# Contoh mengambil 10 sampel secara random
sample = random.sample(df.to_dict('records'), 10)
print(tabulate(sample, headers='keys', tablefmt='psql'))

+-------------------------------+--------+------------+-----------------------+-------------------+-----------------+
| Nama                          |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|-------------------------------+--------+------------+-----------------------+-------------------+-----------------|
| Siska Siregar                 |     29 | Yogyakarta | SD                    | Guru              | Laki-laki       |
| Ir. Darman Suryono            |     19 | Yogyakarta | SMP                   | Dokter            | Perempuan       |
| Salman Dabukke                |     23 | Jakarta    | SD                    | Dokter            | Perempuan       |
| R.M. Kurnia Mangunsong, S.Kom |     64 | Malang     | SD                    | Polisi            | Perempuan       |
| Dt. Baktiadi Najmudin         |     47 | Surabaya   | SD                    | Akuntan           | Perempuan       |
| Dt. Ajimin Gunarto            |     49 | Yogyakarta | 

#### 2. Stratified Random Sampling
Pada penyampelan jenis ini, anggota populasi dikelompokkan berdasarkan stratanya, misal tinggi, sedang, dan rendah. Kemudian dipilih sampel yang mewakili masing-masing strata.

Langkah-langkah dalam menentukan Stratified Random sampling: 
- Menentukan data pendukung tentang populasi yang diambil berikut strata-strata yang ada di dalamnya
- Mengklasifikasikan populasi ke dalam grup atau strata yang saling lepas
- Menentukan ukuran sample untuk tiap stratum
- Memilih secara acak setiap stratum dengan menggunakan simple random sampling 

In [141]:
# Mensampling berdasarkan pendidikan terakhir
sd = []
smp = []
sma = []
pt = []

for i in range(len(df)):
    if df.iloc[i]['Pendidikan Terakhir'] == 'SD':
        sd.append(df.iloc[i])
    elif df.iloc[i]['Pendidikan Terakhir'] == 'SMP':
        smp.append(df.iloc[i])
    elif df.iloc[i]['Pendidikan Terakhir'] == 'SMA':
        sma.append(df.iloc[i])
    elif df.iloc[i]['Pendidikan Terakhir'] == 'PT':
        pt.append(df.iloc[i])

print("Jumlah lulusan SD: ", len(sd))
print("Jumlah lulusan SMP: ", len(smp))
print("Jumlah lulusan SMA: ", len(sma))
print("Jumlah lulusan PT: ", len(pt))

# ambil 20% dari setiap jenjang pendidikan
sd_sample = random.sample(sd, int(len(sd) * 0.2))
smp_sample = random.sample(smp, int(len(smp) * 0.2))
sma_sample = random.sample(sma, int(len(sma) * 0.2))
pt_sample = random.sample(pt, int(len(pt) * 0.2))

print("\nJumlah sample SD: ", len(sd_sample))
print("Jumlah sample SMP: ", len(smp_sample))
print("Jumlah sample SMA: ", len(sma_sample))
print("Jumlah sample PT: ", len(pt_sample))

print("\nHasil sample: ")
sample = sd_sample + smp_sample + sma_sample + pt_sample
print(tabulate(sample, headers='keys', tablefmt='psql'))

Jumlah lulusan SD:  18
Jumlah lulusan SMP:  8
Jumlah lulusan SMA:  12
Jumlah lulusan PT:  12

Jumlah sample SD:  3
Jumlah sample SMP:  1
Jumlah sample SMA:  2
Jumlah sample PT:  2

Hasil sample: 
+-----------------------------+--------+------------+-----------------------+-------------------+-----------------+
| Nama                        |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|-----------------------------+--------+------------+-----------------------+-------------------+-----------------|
| Gara Yulianti               |     63 | Surabaya   | SD                    | Guru              | Laki-laki       |
| Zaenab Mansur, S.Pd         |     57 | Malang     | SD                    | Insinyur          | Perempuan       |
| Dr. Vanya Usada, S.Pd       |     65 | Malang     | SD                    | Developer         | Perempuan       |
| Lasmono Dabukke             |     43 | Jakarta    | SMP                   | Akuntan           | Perempuan 

#### 3. Sistematic Sampling 
Penyampelan dengan cara ini dilakukan dengan mengurutkan terlebih dahulu semua anggota, kemudian dipili urutan tertentu untuk dijadikan anggota sampel. 

In [142]:
sorted_df = df.sort_values(by='Nama')
print(tabulate(sorted_df, headers='keys', tablefmt='psql'))

+----+-------------------------------+--------+------------+-----------------------+-------------------+-----------------+
|    | Nama                          |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|----+-------------------------------+--------+------------+-----------------------+-------------------+-----------------|
| 36 | Argono Prasetyo               |     52 | Yogyakarta | SMA                   | Akuntan           | Laki-laki       |
| 48 | Bella Kuswandari              |     42 | Surabaya   | SMP                   | Insinyur          | Perempuan       |
| 38 | Cemplunk Wijayanti, M.Ak      |     32 | Jakarta    | SMA                   | Insinyur          | Laki-laki       |
| 17 | Daniswara Wibowo              |     46 | Yogyakarta | PT                    | Insinyur          | Perempuan       |
|  4 | Digdaya Purnawati             |     47 | Yogyakarta | SD                    | Guru              | Laki-laki       |
| 16 | Dr. Almir

In [143]:
# Mengambil sampel setiap kelipatan 5
sample = []
for i in range(0, len(sorted_df), 5):
    sample.append(sorted_df.iloc[i])

print(tabulate(sample, headers='keys', tablefmt='psql')) 

+------------------------+--------+------------+-----------------------+-------------------+-----------------+
| Nama                   |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|------------------------+--------+------------+-----------------------+-------------------+-----------------|
| Argono Prasetyo        |     52 | Yogyakarta | SMA                   | Akuntan           | Laki-laki       |
| Dr. Almira Wijayanti   |     57 | Surabaya   | SMA                   | Insinyur          | Perempuan       |
| Drs. Uda Andriani      |     38 | Malang     | SD                    | Insinyur          | Laki-laki       |
| Gara Yulianti          |     63 | Surabaya   | SD                    | Guru              | Laki-laki       |
| Ir. Darman Suryono     |     19 | Yogyakarta | SMP                   | Dokter            | Perempuan       |
| Lasmono Dabukke        |     43 | Jakarta    | SMP                   | Akuntan           | Perempuan       |
|

#### Cluster Sampling 
Pada penyampelan jenis ini, populasi dibagi menjadi wilayah atau klaster. Jika terpilih klasternya, seluruh anggota dalam klaster tersebut yang menjadi sampel. 

Langkah-langkah dalam pengambilan sample dengan cluster sampling:
- Menentukan cluster-clusternya  
- Menentukan banyak cluster yang akan dijadikan sample, misal n cluster 
- Memilih secara acak cluster 
- Semua anggota yang terdapat dalam klaster yang terpilih merupakan sampel 

In [144]:
# Misalkan terdapat 5 cluster
temp = df
c1 = []
c2 = []
c3 = []
c4 = []
c5 = []
clusters = [c1, c2, c3, c4, c5]

fill  = 0
count = 0
for i in range(len(temp)):
    if count == 5:
        count = 0
        fill += 1
        
    if fill <= 4:    
        clusters[fill].append(temp.iloc[i])
    count += 1

sample = random.choice(clusters)
print(tabulate(sample, headers='keys', tablefmt='psql'))

+----------------------+--------+------------+-----------------------+-------------------+-----------------+
| Nama                 |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|----------------------+--------+------------+-----------------------+-------------------+-----------------|
| Zizi Gunawan         |     37 | Surabaya   | SMA                   | Desainer          | Laki-laki       |
| Dr. Almira Wijayanti |     57 | Surabaya   | SMA                   | Insinyur          | Perempuan       |
| Daniswara Wibowo     |     46 | Yogyakarta | PT                    | Insinyur          | Perempuan       |
| Dt. Ajimin Gunarto   |     49 | Yogyakarta | PT                    | Polisi            | Laki-laki       |
| Yoga Usamah, S.E.    |     46 | Malang     | SD                    | Developer         | Laki-laki       |
+----------------------+--------+------------+-----------------------+-------------------+-----------------+


### B. Non Probability Sampling 
Nonprobability sampling adalah teknik pengambilan sampel yang tidak memberi peluang atau kesempatan sama bagi setiap unsur atau anggota populasi yang dipilih menjadi sampel. Teknik pengambilan sampel ini diantaranya sampling incidental, sampling bertujuan, sampling bola salju (snowball sampling), dan sampling kuota. Non probability sampling ini tidak bisa digunakan untuk membuat generalisasi. 

#### 1. Sampling Incidental
Nonprobability sampling adalah teknik pengambilan sampel yang tidak memberi peluang atau kesempatan sama bagi setiap unsur atau anggota populasi yang dipilih menjadi sampel. Teknik pengambilan sampel ini diantaranya sampling incidental, sampling bertujuan, sampling bola salju (snowball sampling), dan sampling kuota. Non probability sampling ini tidak bisa digunakan untuk membuat generalisasi. 

#### 2. Sampling purposive 
Teknik penentuan sampel berdasarkan pertimbangan peneliti atau evaluator tentang sampel mana yang paling bermanfaat dan representative (Babbie, 2004: 183). 
Terkadang sampel yang akan diambil ditentukan berdasarkan pengetahuan tentang suatu populasi, anggota-anggotanya dan tujuan dari penelitian. Jenis sampel ini sangat baik jika dimanfaatkan untuk studi penjajagan (studi awal untuk penelitian atau evaluasi). 


In [145]:
# Mengambil sampel hanya yang berprofesi sebagai Polisi
sample = []

for i in range(len(df)):
    if df.iloc[i]['Jenis Pekerjaan'] == 'Polisi':
        sample.append(df.iloc[i])

print(tabulate(sample, headers='keys', tablefmt='psql'))  

+-------------------------------+--------+------------+-----------------------+-------------------+-----------------+
| Nama                          |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|-------------------------------+--------+------------+-----------------------+-------------------+-----------------|
| dr. Nova Prasasta, S.Pt       |     59 | Surabaya   | PT                    | Polisi            | Perempuan       |
| R. Mulyono Wibisono           |     24 | Jakarta    | SD                    | Polisi            | Perempuan       |
| dr. Agnes Budiyanto, S.Ked    |     35 | Malang     | SMA                   | Polisi            | Laki-laki       |
| Dt. Ajimin Gunarto            |     49 | Yogyakarta | PT                    | Polisi            | Laki-laki       |
| Sidiq Haryanti                |     49 | Malang     | SMA                   | Polisi            | Perempuan       |
| Kemal Salahudin               |     18 | Jakarta    | 

#### 3. Sampling Bola Salju
Sampling snowball dapat dilakukan jika keberadaan dari suatu populasi sulit untuk ditemukan. Dengan kata lain, cara ini banyak dipakai ketika peneliti atau evaluator tidak banyak tahu tentang populasi penelitian aau evaluasinya. Pada sampling bola salju, peneliti mengumpulkan data dari beberapa sampel yang dapat ditemukan oleh peneliti sendiri, selanjutnya peneliti meminta individu yang telah dijadikan sampel tersebut untuk memberitahukan keberadaan anggota yang lainnya yang tidak dapat ditemukan oleh peneliti untuk dapat melengkapi data (Babbie, 2004: 184).

#### 4. Sampling Quota 
Teknik sampling kuota adalah teknik menentukan sampel dari populasi yang mempunyai ciri-ciri tertentu sampai jumlah (kuota) yang diinginkan.  Pada sampling kuota, dimulai dengan membuat tabel atau matriks yang berisi penjabaran karakteristik dari populasi yang ingin dicapai atau karakteristik populasi yang sesuai dengan tujuan dari penelitian untuk selanjutnya ditentukan sampel yang memenuhi ciri-ciri dari populasi tersebut. 

In [146]:
## Misalkan mengambil 3 sampel untuk setiap kota
sample = []

for city in cities:
    city_df = df[df['Kota'] == city]
    quota = 3
    city_sample = random.sample(city_df.to_dict('records'), quota)
    for selec in city_sample:
        sample.append(selec)

print(tabulate(sample, headers='keys', tablefmt='psql'))


+-----------------------------+--------+------------+-----------------------+-------------------+-----------------+
| Nama                        |   Umur | Kota       | Pendidikan Terakhir   | Jenis Pekerjaan   | Jenis Kelamin   |
|-----------------------------+--------+------------+-----------------------+-------------------+-----------------|
| Drs. Sakura Sihombing, S.E. |     45 | Jakarta    | PT                    | Insinyur          | Laki-laki       |
| Kemal Salahudin             |     18 | Jakarta    | SD                    | Polisi            | Laki-laki       |
| drg. Wardi Wibowo           |     42 | Jakarta    | SMA                   | Guru              | Perempuan       |
| Bella Kuswandari            |     42 | Surabaya   | SMP                   | Insinyur          | Perempuan       |
| Ifa Kuswoyo                 |     59 | Surabaya   | SMP                   | Guru              | Perempuan       |
| Zizi Gunawan                |     37 | Surabaya   | SMA               