One-sample confidence intervals for proportions:
Berapa proporsi responden yang tahu istilah AI (jawaban bukan "Tidak Tahu")?
(*)Confidence Level: 95%

In [1]:
import pandas as pd
from statsmodels.stats.proportion import proportion_confint

# Baca data
df = pd.read_excel("Dataset_Tubes.xlsx")

# Kolom yang digunakan
ai_col = 'Sejauh_mana_Anda_mengetahui_istilah__Kecerdasan_Buatan_atau_AI_atau_Artificial_Intelligence'

# Buang data kosong dan salin data
df_ai = df.dropna(subset=[ai_col]).copy()

# Bersihkan dan normalisasi teks
df_ai[ai_col] = df_ai[ai_col].str.strip().str.lower()

# Tentukan kategori yang termasuk 'tahu'
kategori_tahu = ['sangat mengetahui dan paham', 'cukup mengetahui']
df_ai['Tahu_AI'] = df_ai[ai_col].isin(kategori_tahu)

# Hitung jumlah tahu dan total responden
jumlah_tahu = df_ai['Tahu_AI'].sum()
jumlah_total = len(df_ai)

# Hitung confidence interval 95%
ci_low, ci_upp = proportion_confint(jumlah_tahu, jumlah_total, alpha=0.05, method='normal')

# Tampilkan hasil
print("=== Confidence Interval (95%) untuk Proporsi Responden yang TAHU AI ===")
print(f"Jumlah tahu AI     : {jumlah_tahu}")
print(f"Jumlah responden   : {jumlah_total}")
print(f"Proporsi sampel    : {jumlah_tahu / jumlah_total:.4f}")
print(f"Confidence Interval: ({ci_low:.4f}, {ci_upp:.4f})")


=== Confidence Interval (95%) untuk Proporsi Responden yang TAHU AI ===
Jumlah tahu AI     : 881
Jumlah responden   : 1000
Proporsi sampel    : 0.8810
Confidence Interval: (0.8609, 0.9011)


One-sample confidence intervals for proportions:
Berapa proporsi responden yang menggunakan QRIS sebagai metode pembayaran?
(*)Confidence Level: 99%

In [21]:
import pandas as pd
from statsmodels.stats.proportion import proportion_confint

# Baca data
df = pd.read_excel("Dataset_Tubes.xlsx")

# Kolom yang digunakan
pembayaran_col = 'Manakah_dari_metode_berikut_yang_paling_sering_Anda_gunakan_untuk_melakukan_pembayaran_transaksi'

# Hapus baris dengan nilai kosong di kolom pembayaran
df_bayar = df.dropna(subset=[pembayaran_col]).copy()

# Identifikasi pengguna QRIS
qris_user = df_bayar[pembayaran_col].str.contains('qris', case=False, na=False)

# Hitung jumlah pengguna QRIS dan total sampel
jumlah_qris = qris_user.sum()
jumlah_total = len(df_bayar)

# Hitung confidence interval 99%
ci_low, ci_upp = proportion_confint(jumlah_qris, jumlah_total, alpha=0.01, method='normal')

# Tampilkan hasil
print("=== Confidence Interval (99%) untuk Proporsi Pengguna QRIS ===")
print(f"Jumlah pengguna QRIS : {jumlah_qris}")
print(f"Total responden      : {jumlah_total}")
print(f"Proporsi sampel      : {jumlah_qris / jumlah_total:.4f}")
print(f"Confidence Interval  : ({ci_low:.4f}, {ci_upp:.4f})")


=== Confidence Interval (99%) untuk Proporsi Pengguna QRIS ===
Jumlah pengguna QRIS : 795
Total responden      : 1000
Proporsi sampel      : 0.7950
Confidence Interval  : (0.7621, 0.8279)


Two-sample confidence intervals for proportion differences:
Apakah terdapat perbedaan signifikan dalam proporsi penggunaan QRIS antara laki-laki dan perempuan?
(*)Confidence Interval: 95%

In [2]:
import pandas as pd
from statsmodels.stats.proportion import confint_proportions_2indep

# Load data
df = pd.read_excel("Dataset_Tubes.xlsx")

# Normalisasi kolom
df = df.rename(columns={
    'Jenis_kelamin': 'Jenis_Kelamin',
    'Manakah_dari_metode_berikut_yang_paling_sering_Anda_gunakan_untuk_melakukan_pembayaran_transaksi': 'Metode_Pembayaran'
})

# Buang data kosong
df = df.dropna(subset=['Jenis_Kelamin', 'Metode_Pembayaran']).copy()
df['Jenis_Kelamin'] = df['Jenis_Kelamin'].str.strip().str.lower()
df['Metode_Pembayaran'] = df['Metode_Pembayaran'].str.strip().str.lower()

# Tandai pengguna QRIS
df['Gunakan_QRIS'] = df['Metode_Pembayaran'].str.contains('qris')

# Ambil dua kelompok: laki-laki vs perempuan
male = df[df['Jenis_Kelamin'] == 'laki-laki']
female = df[df['Jenis_Kelamin'] == 'perempuan']

# Hitung jumlah pengguna QRIS
x1 = male['Gunakan_QRIS'].sum()
n1 = len(male)

x2 = female['Gunakan_QRIS'].sum()
n2 = len(female)

# CI untuk selisih proporsi (95%)
ci_low, ci_upp = confint_proportions_2indep(count1=x1, nobs1=n1,
                                            count2=x2, nobs2=n2,
                                            method='wald', alpha=0.05)

print("=== Two-Sample CI for Difference in Proportions (QRIS, 95%) ===")
print(f"Laki-laki: {x1}/{n1} = {x1/n1:.4f}")
print(f"Perempuan: {x2}/{n2} = {x2/n2:.4f}")
print(f"Selisih proporsi: {(x1/n1)-(x2/n2):.4f}")
print(f"Confidence Interval (95%): ({ci_low:.4f}, {ci_upp:.4f})")


=== Two-Sample CI for Difference in Proportions (QRIS, 95%) ===
Laki-laki: 367/456 = 0.8048
Perempuan: 428/544 = 0.7868
Selisih proporsi: 0.0181
Confidence Interval (95%): (-0.0320, 0.0681)


In [5]:
import pandas as pd
from scipy.stats import norm
import numpy as np

# Load data
df = pd.read_excel("Dataset_Tubes.xlsx")

df2 = df[['Pendidikan_terakhir', 'Sejauh_mana_Anda_mengetahui_istilah__Kecerdasan_Buatan_atau_AI_atau_Artificial_Intelligence']].dropna().copy()
df2.columns = ['Pendidikan', 'Pemahaman_AI']
df2 = df2.apply(lambda x: x.str.strip().str.lower())

# Tandai responden tahu AI (sangat mengetahui dan cukup mengetahui)
tahu_ai = df2['Pemahaman_AI'].isin(['sangat mengetahui dan paham', 'cukup mengetahui'])

# Tandai S1 dan non-S1
s1 = df2[df2['Pendidikan'] == 's1']
non_s1 = df2[df2['Pendidikan'] != 's1']

x3 = tahu_ai[s1.index].sum()
n3 = len(s1)

x4 = tahu_ai[non_s1.index].sum()
n4 = len(non_s1)

ci_low2, ci_upp2 = confint_proportions_2indep(x3, n3, x4, n4, method='wald', alpha=0.01)

print("\n=== CI for Difference in Proporsi Pemahaman AI (S1 vs Non-S1) ===")
print(f"S1     : {x3}/{n3} = {x3/n3:.4f}")
print(f"Non-S1 : {x4}/{n4} = {x4/n4:.4f}")
print(f"Selisih proporsi: {(x3/n3)-(x4/n4):.4f}")
print(f"Confidence Interval (99%): ({ci_low2:.4f}, {ci_upp2:.4f})")


=== CI for Difference in Proporsi Pemahaman AI (S1 vs Non-S1) ===
S1     : 282/337 = 0.8368
Non-S1 : 599/663 = 0.9035
Selisih proporsi: -0.0667
Confidence Interval (99%): (-0.1264, -0.0070)
