In [None]:
import pandas as pd
import numpy as np

# Daftar 38 provinsi di Indonesia
provinsi = [
    "Aceh", "Sumatera Utara", "Sumatera Barat", "Riau", "Kepulauan Riau",
    "Jambi", "Sumatera Selatan", "Bangka Belitung", "Bengkulu", "Lampung",
    "DKI Jakarta", "Jawa Barat", "Banten", "Jawa Tengah", "DI Yogyakarta", "Jawa Timur",
    "Bali", "Nusa Tenggara Barat", "Nusa Tenggara Timur", "Kalimantan Barat", "Kalimantan Tengah",
    "Kalimantan Selatan", "Kalimantan Timur", "Kalimantan Utara",
    "Sulawesi Utara", "Gorontalo", "Sulawesi Tengah", "Sulawesi Barat", "Sulawesi Selatan", "Sulawesi Tenggara",
    "Maluku", "Maluku Utara", "Papua", "Papua Barat", "Papua Pegunungan", "Papua Tengah", "Papua Selatan", "Papua Barat Daya"
]

tahun = list(range(2015, 2025))

# Buat data dummy dengan fluktuasi
np.random.seed(42)
data = []

for prov in provinsi:
    jumlah = np.random.uniform(1, 15)  # populasi awal
    for t in tahun:
        data.append({
            "Provinsi": prov,
            "Tahun": t,
            "Jumlah Penduduk (juta)": round(jumlah, 2)
        })
        # Simulasikan perubahan antara -1% hingga +2%
        growth = np.random.uniform(-0.1, 0.2)
        jumlah *= (1 + growth)

# Buat DataFrame
df = pd.DataFrame(data)

# Contoh hasil
print(df[df["Provinsi"] == "Aceh"])


  Provinsi  Tahun  Jumlah Penduduk (juta)
0     Aceh   2015                    6.24
1     Aceh   2016                    7.40
2     Aceh   2017                    8.28
3     Aceh   2018                    8.94
4     Aceh   2019                    8.47
5     Aceh   2020                    8.02
6     Aceh   2021                    7.36
7     Aceh   2022                    8.53
8     Aceh   2023                    9.22
9     Aceh   2024                   10.25


In [6]:
df.to_csv("assets/data_penduduk_indonesia.csv", index=False)

In [8]:

# Query 1: Filter berdasarkan Provinsi tertentu, misal "Jawa Barat"
df_jabar = df.query('Provinsi == "Jawa Barat"')
df_jabar

Unnamed: 0,Provinsi,Tahun,Jumlah Penduduk (juta)
110,Jawa Barat,2015,13.55
111,Jawa Barat,2016,13.48
112,Jawa Barat,2017,12.58
113,Jawa Barat,2018,12.18
114,Jawa Barat,2019,12.52
115,Jawa Barat,2020,14.35
116,Jawa Barat,2021,16.62
117,Jawa Barat,2022,14.99
118,Jawa Barat,2023,15.79
119,Jawa Barat,2024,16.18


In [None]:

# Query 2: Filter berdasarkan Tahun tertentu, misal tahun 2020
df_2020 = df.query('Tahun == 2020')

# Query 3: Filter berdasarkan Jumlah Penduduk lebih dari 5 juta
df_besar = df.query('`Jumlah Penduduk (juta)` > 5')

# Query 4: Filter berdasarkan Provinsi dan Tahun sekaligus
df_jabar_2020 = df.query('Provinsi == "Jawa Barat" and Tahun == 2020')

In [None]:
import os
import pandas as pd

data_path = "assets/data_penduduk_indonesia.csv"
df = pd.read_csv(data_path) if os.path.exists(data_path) else None

if df is not None:
    selected_columns = ["Provinsi", "Tahun", "Jumlah Penduduk (juta)"]
    df_selected = df[selected_columns]
    
    data_string = "\n".join([
        f"Provinsi:{row[0]}|Tahun:{row[1]}|penduduk:{row[2]}"
        for row in df_selected.values
    ])
else:
    data_string = ""


In [15]:
data_string

'Provinsi:Aceh|Tahun:2015|Jumlah:6.24\nProvinsi:Aceh|Tahun:2016|Jumlah:7.4\nProvinsi:Aceh|Tahun:2017|Jumlah:8.28\nProvinsi:Aceh|Tahun:2018|Jumlah:8.94\nProvinsi:Aceh|Tahun:2019|Jumlah:8.47\nProvinsi:Aceh|Tahun:2020|Jumlah:8.02\nProvinsi:Aceh|Tahun:2021|Jumlah:7.36\nProvinsi:Aceh|Tahun:2022|Jumlah:8.53\nProvinsi:Aceh|Tahun:2023|Jumlah:9.22\nProvinsi:Aceh|Tahun:2024|Jumlah:10.25\nProvinsi:Sumatera Utara|Tahun:2015|Jumlah:14.58\nProvinsi:Sumatera Utara|Tahun:2016|Jumlah:16.76\nProvinsi:Sumatera Utara|Tahun:2017|Jumlah:16.15\nProvinsi:Sumatera Utara|Tahun:2018|Jumlah:15.42\nProvinsi:Sumatera Utara|Tahun:2019|Jumlah:14.73\nProvinsi:Sumatera Utara|Tahun:2020|Jumlah:14.6\nProvinsi:Sumatera Utara|Tahun:2021|Jumlah:15.44\nProvinsi:Sumatera Utara|Tahun:2022|Jumlah:15.89\nProvinsi:Sumatera Utara|Tahun:2023|Jumlah:15.69\nProvinsi:Sumatera Utara|Tahun:2024|Jumlah:17.0\nProvinsi:Sumatera Barat|Tahun:2015|Jumlah:5.09\nProvinsi:Sumatera Barat|Tahun:2016|Jumlah:5.14\nProvinsi:Sumatera Barat|Tahun:2017|