In [None]:
# 1️⃣ Data Preparation
#✔ Mengambil data jaringan jalan dari OSM untuk Jawa Timur
#✔ Memuat data SPKLU dari CSV
#✔ Membangun graf jaringan jalan dengan bobot jarak dan konsumsi energi
#✔ Menyimpan graf untuk dipakai di tahap selanjutnya

#Step 1: Import Library yang Dibutuhkan
import osmnx as ox
import networkx as nx
import pandas as pd
from geopy.geocoders import Nominatim


In [69]:
#Step 2: Tentukan Daftar Kota yang Akan Diproses
cities = ["Surabaya, Indonesia", "Malang, Indonesia", "Kediri, Indonesia", "Sidoarjo, Indonesia", "Gresik, Indonesia"]


In [70]:
#Step 3: Baca Data SPKLU dari CSV
print("📌 Memuat data SPKLU dari CSV...")
spklu_df = pd.read_csv("../data/spklu_dataset.csv")


📌 Memuat data SPKLU dari CSV...


In [71]:
#Step 4: Looping untuk Setiap Kota
for city_name in cities:
    print(f"\n🔹 Memproses kota: {city_name}...")



🔹 Memproses kota: Surabaya, Indonesia...

🔹 Memproses kota: Malang, Indonesia...

🔹 Memproses kota: Kediri, Indonesia...

🔹 Memproses kota: Sidoarjo, Indonesia...

🔹 Memproses kota: Gresik, Indonesia...


In [72]:
# Step 5: Cek Apakah Data Jalan Sudah Ada
import os

# Daftar kota yang akan diambil datanya
cities = ["Surabaya, Indonesia", "Malang, Indonesia", "Kediri, Indonesia", 
          "Sidoarjo, Indonesia", "Gresik, Indonesia"]

for city_name in cities:
    safe_city_name = city_name.split(",")[0].replace(" ", "_").lower()  # Format nama aman untuk file
    road_graph_path = f"../data/road_graph_{safe_city_name}.pkl"

    if os.path.exists(road_graph_path):
        print(f"✅ Data jalan {city_name} sudah tersedia, menggunakan data yang disimpan...")
    else:
        print(f"📌 Mengambil data jaringan jalan di {city_name}...")
        road_graph = ox.graph_from_place(city_name, network_type="drive", simplify=True)
        nx.write_gpickle(road_graph, road_graph_path)
        print(f"✅ Data jalan {city_name} berhasil disimpan.")



✅ Data jalan Surabaya, Indonesia sudah tersedia, menggunakan data yang disimpan...
✅ Data jalan Malang, Indonesia sudah tersedia, menggunakan data yang disimpan...
✅ Data jalan Kediri, Indonesia sudah tersedia, menggunakan data yang disimpan...
✅ Data jalan Sidoarjo, Indonesia sudah tersedia, menggunakan data yang disimpan...
✅ Data jalan Gresik, Indonesia sudah tersedia, menggunakan data yang disimpan...


In [73]:
#Step 6: Tambahkan SPKLU ke Graf Jalan

# Daftar kota yang akan diambil datanya
cities = ["Surabaya, Indonesia", "Malang, Indonesia", "Kediri, Indonesia", 
          "Sidoarjo, Indonesia", "Gresik, Indonesia"]

print("📌 Menambahkan SPKLU ke dalam graf jalan...")
spklu_nodes = {}

for city_name in cities:
    safe_city_name = city_name.split(",")[0].replace(" ", "_").lower()  # Format nama aman untuk file
    road_graph_path = f"../data/road_graph_{safe_city_name}.pkl"

    # Load road graph jika tersedia
    if os.path.exists(road_graph_path):
        print(f"✅ Menggunakan data jalan yang sudah ada untuk {city_name}...")
        road_graph = nx.read_gpickle(road_graph_path)
    else:
        print(f"⚠️ Data jalan untuk {city_name} tidak ditemukan, melewati kota ini...")
        continue  # Skip kota jika data jalan tidak tersedia

    print(f"📌 Memproses SPKLU di {city_name}...")

    # Ambil hanya SPKLU yang sesuai dengan kota saat ini
    city_spklu_df = spklu_df[spklu_df['Alamat'].str.contains(city_name.split(",")[0], case=False, na=False)]

    if city_spklu_df.empty:
        print(f"⚠️ Tidak ada SPKLU untuk {city_name}, melewati...")
        continue

    for idx, row in city_spklu_df.iterrows():
        try:
            nearest_node = ox.nearest_nodes(road_graph, row["Longitude"], row["Latitude"])
            spklu_nodes[nearest_node] = (row["Latitude"], row["Longitude"])
        except Exception as e:
            print(f"⚠️ Error menambahkan SPKLU {row['Latitude']}, {row['Longitude']} di {city_name}: {e}")

print(f"✅ Total SPKLU yang berhasil dimasukkan ke dalam graf: {len(spklu_nodes)}")



📌 Menambahkan SPKLU ke dalam graf jalan...
✅ Menggunakan data jalan yang sudah ada untuk Surabaya, Indonesia...
📌 Memproses SPKLU di Surabaya, Indonesia...
✅ Menggunakan data jalan yang sudah ada untuk Malang, Indonesia...
📌 Memproses SPKLU di Malang, Indonesia...
⚠️ Tidak ada SPKLU untuk Malang, Indonesia, melewati...
✅ Menggunakan data jalan yang sudah ada untuk Kediri, Indonesia...
📌 Memproses SPKLU di Kediri, Indonesia...
⚠️ Tidak ada SPKLU untuk Kediri, Indonesia, melewati...
✅ Menggunakan data jalan yang sudah ada untuk Sidoarjo, Indonesia...
📌 Memproses SPKLU di Sidoarjo, Indonesia...
⚠️ Tidak ada SPKLU untuk Sidoarjo, Indonesia, melewati...
✅ Menggunakan data jalan yang sudah ada untuk Gresik, Indonesia...
📌 Memproses SPKLU di Gresik, Indonesia...
⚠️ Tidak ada SPKLU untuk Gresik, Indonesia, melewati...
✅ Total SPKLU yang berhasil dimasukkan ke dalam graf: 9


In [80]:
# # # Step 7: Tambahkan Bobot Jarak dan Konsumsi Energi ke Graf Jalan
# #✔ Menyimpan graf untuk dipakai di tahap selanjutnya

def calculate_energy_consumption(length, inclination):
    """
    Fungsi untuk menghitung konsumsi energi berdasarkan panjang jalan dan elevasi.
    """
    base_consumption = 0.2  # Konsumsi dasar (kWh/km)
    elevation_factor = 0.05  # Faktor elevasi (kWh/km per derajat kemiringan)
    
    return base_consumption * length + elevation_factor * (length * inclination)

print("📌 Menambahkan bobot jarak dan konsumsi energi ke graf jalan...")

for city_name in cities:
    safe_city_name = city_name.split(",")[0].replace(" ", "_").lower()
    road_graph_path = f"../data/road_graph_{safe_city_name}.pkl"
    
    if os.path.exists(road_graph_path):
        print(f"✅ Memproses bobot untuk {city_name}...")
        road_graph = nx.read_gpickle(road_graph_path)
    else:
        print(f"⚠️ Data jalan untuk {city_name} tidak ditemukan, melewati...")
        continue

    # Tambahkan bobot pada setiap edge
    for u, v, data in road_graph.edges(data=True):
        length = data.get("length", 1) / 1000  # Konversi ke km
        inclination = data.get("grade", 0)  # Kemiringan jalan
        
        energy_consumption = calculate_energy_consumption(length, inclination)
        
        data["energy"] = energy_consumption

    # Simpan graf yang telah diperbarui
    updated_graph_path = f"../data/road_graph_weighted_{safe_city_name}.pkl"
    nx.write_gpickle(road_graph, updated_graph_path)
    print(f"✅ Graf dengan bobot disimpan: {updated_graph_path}")

print("🎯 Semua graf telah diperbarui dengan bobot jarak dan konsumsi energi!")

📌 Menambahkan bobot jarak dan konsumsi energi ke graf jalan...
✅ Memproses bobot untuk Surabaya, Indonesia...
✅ Graf dengan bobot disimpan: ../data/road_graph_weighted_surabaya.pkl
✅ Memproses bobot untuk Malang, Indonesia...
✅ Graf dengan bobot disimpan: ../data/road_graph_weighted_malang.pkl
✅ Memproses bobot untuk Kediri, Indonesia...
✅ Graf dengan bobot disimpan: ../data/road_graph_weighted_kediri.pkl
✅ Memproses bobot untuk Sidoarjo, Indonesia...
✅ Graf dengan bobot disimpan: ../data/road_graph_weighted_sidoarjo.pkl
✅ Memproses bobot untuk Gresik, Indonesia...
✅ Graf dengan bobot disimpan: ../data/road_graph_weighted_gresik.pkl
🎯 Semua graf telah diperbarui dengan bobot jarak dan konsumsi energi!


In [None]:

# 2️⃣ Membangun Environment untuk RL
# 🔹 Langkah-langkah dalam Membangun Environment RL
# 1️⃣ Merepresentasikan State (lokasi kendaraan, sisa baterai, tujuan, jenis konektor, kapsitas betrai)
# 2️⃣ Mendefinisikan Action Space (bergerak ke node lain, isi baterai, dll.)
# 3️⃣ Membuat Reward Function (memilih rute optimal berdasarkan jarak & konsumsi energi)

In [146]:
# ✅ 1. Representasi State
class EVState:
    def __init__(self, location, battery, destination, connector_type, capacity_kwh):
        self.location = location
        self.battery = battery  # dalam persentase (%)
        self.destination = destination
        self.connector_type = connector_type
        self.capacity_kwh = capacity_kwh  # kapasitas baterai total (kWh)

    def __repr__(self):
        return f"EVState(Location: {self.location}, Battery: {self.battery}%, Destination: {self.destination}, Connector: {self.connector_type})"


In [148]:
# ✅ 2. Mendefinisikan Action Space
class EVAction:
    MOVE = "move"
    CHARGE = "charge"

# ✅ 3. Environment dan Reward Function
class EVEnvironment:
    def __init__(self, road_graph, spklu_nodes):
        self.road_graph = road_graph
        self.spklu_nodes = spklu_nodes

    def reset(self):
        # Kamu bisa sesuaikan state awal ini dengan kebutuhan simulasi
        self.initial_state = EVState(location=12345, battery=50, destination=67890,
                                     connector_type="CCS2", capacity_kwh=50)
        return self.initial_state

    def get_available_actions(self, state):
        actions = []
        if state.battery > 20:
            neighbors = list(self.road_graph.get(state.location, {}).keys())
            for neighbor in neighbors:
                actions.append((EVAction.MOVE, neighbor))
        if state.location in self.spklu_nodes:
            actions.append((EVAction.CHARGE, state.location))
        return actions

    def get_reward(self, state, action):
        print(f"\n📌 Debug: Lokasi saat ini = {state.location}, Aksi = {action}")

        if action[0] == EVAction.MOVE:
            next_node = action[1]

            if state.location in self.road_graph and next_node in self.road_graph[state.location]:
                edge_data = self.road_graph[state.location][next_node]
                print(f"🔍 Debug: Data edge dari {state.location} ke {next_node} = {edge_data}")

                distance = edge_data.get("distance")
                energy_used = edge_data.get("energy")

                if distance is None or energy_used is None:
                    return -5  # Penalti jika data tidak lengkap

                if state.battery < energy_used * 100:
                    print("⚠️ Warning: Energi tidak cukup untuk mencapai node tujuan.")
                    return -15

                progress_reward = max(5 - distance / 1000, 0)
                energy_penalty = -energy_used
                return progress_reward + energy_penalty
            else:
                print(f"🚨 Error: Lokasi {state.location} atau tujuan {next_node} tidak valid!")
                return -10

        elif action[0] == EVAction.CHARGE:
            if action[1] in self.spklu_nodes:
                if state.battery >= 95:
                    return -2  # Penalti kecil karena overcharge
                return 5
            else:
                return -5

        return -1  # Penalti default untuk aksi tidak dikenal

    def step(self, state, action):
        reward = self.get_reward(state, action)
        done = False

        if action[0] == EVAction.MOVE:
            next_node = action[1]
            edge_data = self.road_graph[state.location][next_node]
            energy_used = edge_data.get("energy", 0)
            new_battery = max(state.battery - energy_used * 100, 0)

            next_state = EVState(location=next_node, battery=new_battery,
                                 destination=state.destination,
                                 connector_type=state.connector_type,
                                 capacity_kwh=state.capacity_kwh)

        elif action[0] == EVAction.CHARGE:
            if state.location in self.spklu_nodes:
                next_state = EVState(location=state.location, battery=100,
                                     destination=state.destination,
                                     connector_type=state.connector_type,
                                     capacity_kwh=state.capacity_kwh)
            else:
                next_state = state  # gagal nge-charge
        else:
            next_state = state

        if next_state.location == state.destination:
            done = True
            reward += 50  # Bonus reward sampai tujuan

        return next_state, reward, done, {}

In [149]:
# Contoh data graf jalan
road_graph = {
    12345: {67890: {"distance": 5000, "energy": 3}},
    67890: {12345: {"distance": 5000, "energy": 3}}
}

# Lokasi SPKLU
spklu_nodes = {12345, 67890}

# Inisialisasi environment dan state awal
env = EVEnvironment(road_graph, spklu_nodes)
state = env.reset()

# Tes aksi MOVE dan CHARGE
action_move = (EVAction.MOVE, 67890)
action_charge = (EVAction.CHARGE, 12345)

print("🔹 Reward MOVE:", env.get_reward(state, action_move))
print("🔹 Reward CHARGE:", env.get_reward(state, action_charge))



📌 Debug: Lokasi saat ini = 12345, Aksi = ('move', 67890)
🔍 Debug: Data edge dari 12345 ke 67890 = {'distance': 5000, 'energy': 3}
🔹 Reward MOVE: -15

📌 Debug: Lokasi saat ini = 12345, Aksi = ('charge', 12345)
🔹 Reward CHARGE: 5


In [131]:
#  ✅ Tahap 3: Implementasi Model DQN
# 1️⃣ Membangun Neural Network untuk memprediksi nilai 𝑄(𝑠,𝑎)Q(s,a)
# 2️⃣ Menggunakan Replay Buffer untuk menyimpan pengalaman
# 3️⃣ Memanfaatkan Target Network agar pembelajaran lebih stabil
# 4️⃣ Melatih model dengan strategi epsilon-greedy

In [134]:
# 💡 Tahap 3: Implementasi Model DQN – Langkah 1: Membangun Neural Network
# ✅ 1. Membangun Model DQN
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
import numpy as np
import random
from collections import deque

class DQN(nn.Module):
    def __init__(self, state_size, action_size):
        super(DQN, self).__init__()
        self.fc1 = nn.Linear(state_size, 64)  # Layer pertama
        self.fc2 = nn.Linear(64, 64)          # Layer kedua
        self.fc3 = nn.Linear(64, action_size) # Output layer

    def forward(self, x):
        x = F.relu(self.fc1(x))  # Aktivasi ReLU
        x = F.relu(self.fc2(x))
        return self.fc3(x)  # Output nilai Q untuk setiap aksi



In [137]:
# 💡 Tahap 3: Implementasi Model DQN – Langkah 2: Replay Buffer

# ✅ 2. Implementasi Replay Buffer

class ReplayBuffer:
    def __init__(self, capacity):
        self.buffer = deque(maxlen=capacity)  # Menyimpan pengalaman dalam antrian terbatas

    def add(self, state, action, reward, next_state, done):
        self.buffer.append((state, action, reward, next_state, done))  # Tambahkan pengalaman baru

    def sample(self, batch_size):
        return random.sample(self.buffer, batch_size)  # Ambil sampel acak

    def size(self):
        return len(self.buffer)  # Cek jumlah data di buffer

In [138]:
# ✅ 3. Inisialisasi Replay Buffer

# 🔹 Inisialisasi Replay Buffer
replay_buffer = ReplayBuffer(capacity=10000)

# 🔹 Contoh pengalaman
state = np.array([12345, 50, 67890, 1, 40])        # (location, battery, destination, connector_type, capacity_kwh)
next_state = np.array([67890, 40, 67890, 1, 40])
action = 0  # move
reward = -11.0
done = False

replay_buffer.add(state, action, reward, next_state, done)

# 🔹 Cek
print(f"Total pengalaman tersimpan: {replay_buffer.size()}")
if replay_buffer.size() >= 1:
    print("Contoh sampel:", replay_buffer.sample(1))


Total pengalaman tersimpan: 1
Contoh sampel: [(array([12345,    50, 67890,     1,    40]), 0, -11.0, array([67890,    40, 67890,     1,    40]), False)]


In [143]:
# 💡 Tahap 3: Implementasi Model DQN – Langkah 3: Implementasi Target Network

# 🔹 Setup Model dan Target Network
input_dim = 5  # 5 fitur dari state
output_dim = 2  # 2 aksi: [move, charge]

q_network = DQN(input_dim, output_dim)
target_network = DQN(input_dim, output_dim)
target_network.load_state_dict(q_network.state_dict())

# 🔹 Freeze parameter target network
for param in target_network.parameters():
    param.requires_grad = False

# 🔹 Optimizer
optimizer = optim.Adam(q_network.parameters(), lr=0.001)



In [144]:
# 🔹 Update Target Network
def update_target_network():
    target_network.load_state_dict(q_network.state_dict())


In [145]:
# Tes Model DQN
# Contoh input (state)
sample_state = torch.tensor([12345, 50, 67890, 1, 50], dtype=torch.float32).unsqueeze(0)

# 🔹 Tes prediksi Q-value
sample_state = torch.tensor([12345, 50, 67890, 1, 40], dtype=torch.float32)
q_values = q_network(sample_state)
print("Q-Values:", q_values)

Q-Values: tensor([-657.8627, -337.4474], grad_fn=<ViewBackward0>)


In [162]:
# 4️⃣ Melatih model dengan strategi epsilon-greedy


# 🔧 Hyperparameter
epsilon = 1.0           # Mulai dengan eksplorasi penuh
epsilon_min = 0.01      # Batas bawah eksplorasi
epsilon_decay = 0.995   # Laju penurunan epsilon per episode
gamma = 0.99            # Discount factor
batch_size = 32
update_every = 10       # Update target network setiap N episode
num_episodes = 100      # Jumlah episode latihan

# 🔁 Loop utama training
for episode in range(num_episodes):
    # 🟢 Inisialisasi state awal (simulasi dummy)
    state = np.array([12345, 50, 67890, 1, 40], dtype=np.float32)
    done = False

    while not done:
        # 🎲 PILIH AKSI: Epsilon-Greedy
        if random.random() < epsilon:
            action = random.randint(0, 1)  # Eksplorasi
        else:
            state_tensor = torch.tensor(state, dtype=torch.float32)
            q_values = q_network(state_tensor)
            action = torch.argmax(q_values).item()  # Eksploitasi

        # 🔄 Simulasi transisi ke next_state dan reward (satu langkah saja)
        next_state = np.array([67890, 40, 67890, 1, 40], dtype=np.float32)
        reward = -11.0 if action == 0 else 5.0
        done = True  # Selesai dalam satu langkah

        # 💾 Simpan pengalaman ke replay buffer
        replay_buffer.add(state, action, reward, next_state, done)

        # 🔁 Update state
        state = next_state

        # 📚 Training hanya jika buffer sudah cukup data
        if replay_buffer.size() >= batch_size:
            # Ambil sample acak dari buffer
            batch = replay_buffer.sample(batch_size)
            states, actions, rewards, next_states, dones = zip(*batch)

            # Konversi ke tensor
            states = torch.tensor(states, dtype=torch.float32)
            next_states = torch.tensor(next_states, dtype=torch.float32)
            actions = torch.tensor(actions, dtype=torch.long).unsqueeze(1)
            rewards = torch.tensor(rewards, dtype=torch.float32).unsqueeze(1)
            dones = torch.tensor(dones, dtype=torch.float32).unsqueeze(1)

            # 🧠 Hitung Q-value prediksi dari current network
            current_q = q_network(states).gather(1, actions)

            # 🎯 Hitung target Q-value dari target network
            with torch.no_grad():
                max_next_q = target_network(next_states).max(1, keepdim=True)[0]
                target_q = rewards + gamma * max_next_q * (1 - dones)

            # 🧮 Hitung loss dan lakukan optimisasi
            loss = F.mse_loss(current_q, target_q)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

    # 📉 Kurangi epsilon (semakin lama, semakin banyak eksploitasi)
    if epsilon > epsilon_min:
        epsilon *= epsilon_decay

    # 🔁 Update target network tiap beberapa episode
    if episode % update_every == 0:
        update_target_network()
        print(f"[Episode {episode}] ✅ Target network updated")

    # 🖨️ Monitoring
    print(f"Episode {episode}, Epsilon: {epsilon:.3f}")


[Episode 0] ✅ Target network updated
Episode 0, Epsilon: 0.995
Episode 1, Epsilon: 0.990
Episode 2, Epsilon: 0.985
Episode 3, Epsilon: 0.980
Episode 4, Epsilon: 0.975
Episode 5, Epsilon: 0.970
Episode 6, Epsilon: 0.966
Episode 7, Epsilon: 0.961
Episode 8, Epsilon: 0.956
Episode 9, Epsilon: 0.951
[Episode 10] ✅ Target network updated
Episode 10, Epsilon: 0.946
Episode 11, Epsilon: 0.942
Episode 12, Epsilon: 0.937
Episode 13, Epsilon: 0.932
Episode 14, Epsilon: 0.928
Episode 15, Epsilon: 0.923
Episode 16, Epsilon: 0.918
Episode 17, Epsilon: 0.914
Episode 18, Epsilon: 0.909
Episode 19, Epsilon: 0.905
[Episode 20] ✅ Target network updated
Episode 20, Epsilon: 0.900
Episode 21, Epsilon: 0.896
Episode 22, Epsilon: 0.891
Episode 23, Epsilon: 0.887
Episode 24, Epsilon: 0.882
Episode 25, Epsilon: 0.878
Episode 26, Epsilon: 0.873
Episode 27, Epsilon: 0.869
Episode 28, Epsilon: 0.865
Episode 29, Epsilon: 0.860
[Episode 30] ✅ Target network updated
Episode 30, Epsilon: 0.856
Episode 31, Epsilon: 0

In [164]:
#  ✅ Tahap 4 :  Testing & Evaluasi Model

# 🚗 Definisikan kondisi awal untuk testing
start_node = 12345
goal_node = 67890
battery_level = 50      # misalnya dalam %
connector_type = 1
capacity = 40           # misalnya kWh

initial_state = np.array([start_node, battery_level, goal_node, connector_type, capacity], dtype=np.float32)

state = initial_state
done = False
route = []
total_energy = 0
step_count = 0

while not done and step_count < 20:  # batasi max langkah supaya tidak infinite loop
    state_tensor = torch.tensor(state, dtype=torch.float32)
    q_values = q_network(state_tensor)
    action = torch.argmax(q_values).item()

    # Simulasi step (Dummy: ganti dengan fungsi asli jika sudah ada)
    next_state = np.array([goal_node, 40, goal_node, connector_type, capacity], dtype=np.float32)
    reward = -11.0 if action == 0 else 5.0
    done = True if action == 1 else False

    # Simpan hasil
    route.append((state.tolist(), action, reward))
    total_energy += 5 if action == 1 else 10  # contoh: isi daya = 5kWh, jalan = 10kWh
    step_count += 1

    # Update state
    state = next_state

# Metode evaluasi sederhana
print("\n===== EVALUASI HASIL =====")
print(f"Total langkah     : {step_count}")
print(f"Total energi      : {total_energy} kWh")
print(f"Berhasil mencapai tujuan? {'Ya' if done else 'Tidak'}")

# Print rute
print("\n📍 Rute yang dipilih:")
for i, (s, a, r) in enumerate(route):
    print(f"Langkah {i+1}: State={s} | Action={a} | Reward={r}")



===== EVALUASI HASIL =====
Total langkah     : 1
Total energi      : 5 kWh
Berhasil mencapai tujuan? Ya

📍 Rute yang dipilih:
Langkah 1: State=[12345.0, 50.0, 67890.0, 1.0, 40.0] | Action=1 | Reward=5.0


In [165]:
# Misalnya kamu punya shortest_path_energy = 18
baseline_energy = 18
improvement = baseline_energy - total_energy
print(f"\n📐 Efisiensi terhadap baseline: {improvement} kWh lebih hemat")



📐 Efisiensi terhadap baseline: 13 kWh lebih hemat
