1. Membuat Dataset Populasi

In [None]:
# Kita buat dataset populasi sebagai contoh:

import numpy as np
import pandas as pd

# Membuat dataset populasi dengan 1000 individu
np.random.seed(42)
data = pd.DataFrame({
    'ID': np.arange(1, 1001),
    'Usia': np.random.randint(18, 60, 1000),
    'Pendapatan': np.random.randint(3000, 15000, 1000),
    'Jenis Kelamin': np.random.choice(['Laki-laki', 'Perempuan'], 1000)
})

print(data.head())  # Melihat 5 data pertama

2. Teknik Probability Sampling

In [None]:
# Simple Random Sampling (Sampel Acak Sederhana)
#Mengambil n sampel secara acak:

n = 100  # Jumlah sampel yang diambil
simple_random_sample = data.sample(n=n, random_state=42)
print(simple_random_sample.head())


In [None]:
# Stratified Sampling (Sampel Berstrata)
#Membagi data berdasarkan Jenis Kelamin dan mengambil sampel secara proporsional:

from sklearn.model_selection import train_test_split

# Stratifikasi berdasarkan 'Jenis Kelamin'
train, stratified_sample = train_test_split(data, test_size=0.1, stratify=data['Jenis Kelamin'], random_state=42)

print(stratified_sample['Jenis Kelamin'].value_counts())

In [None]:
# Systematic Sampling (Sampel Sistematis)
#Mengambil setiap elemen ke-k dari daftar:

k = 10  # Ambil setiap elemen ke-10
systematic_sample = data.iloc[::k, :]
print(systematic_sample.head())

In [None]:
# Cluster Sampling (Sampel Kelompok)
#Memilih cluster berdasarkan usia:

# Membuat cluster berdasarkan usia (misalnya rentang usia 18-30, 31-45, 46-60)
data['Cluster'] = pd.cut(data['Usia'], bins=[18, 30, 45, 60], labels=['Muda', 'Dewasa', 'Tua'])

# Memilih salah satu cluster secara acak
chosen_cluster = np.random.choice(data['Cluster'].unique())
cluster_sample = data[data['Cluster'] == chosen_cluster]
print(cluster_sample.head())

3. Teknik Non-Probability Sampling

In [None]:
# Convenience Sampling (Sampel Kemudahan)
#Mengambil 100 data pertama:

convenience_sample = data.head(100)
print(convenience_sample.head())


In [None]:
# Quota Sampling (Sampel Kuota)
# Memilih 50 laki-laki dan 50 perempuan:

quota_male = data[data['Jenis Kelamin'] == 'Laki-laki'].head(50)
quota_female = data[data['Jenis Kelamin'] == 'Perempuan'].head(50)

quota_sample = pd.concat([quota_male, quota_female])
print(quota_sample['Jenis Kelamin'].value_counts())

In [None]:
# Snowball Sampling (Sampel Rantai)
#Untuk simulasi, kita mulai dengan satu individu dan mencari individu dengan karakteristik yang mirip:

# Memilih satu individu sebagai titik awal
seed_person = data.sample(1)

# Mencari individu lain yang mirip (misalnya usia dalam selisih 5 tahun)
snowball_sample = data[(data['Usia'].between(seed_person['Usia'].values[0] - 5, seed_person['Usia'].values[0] + 5))]
print(snowball_sample.head())