# Evaluasi Rancangan
## **Rancangan Evaluasi: Validasi Berlapis dengan Kerangka PICOC-ASTF**

Untuk memastikan klaim efektivitas CKM-SE didasarkan pada bukti yang kuat, kami merancang sebuah protokol evaluasi yang komprehensif. Kami tidak hanya bertanya, "Apakah sistem ini berhasil?" tetapi lebih dalam: "Mengapa, bagaimana, dan pada level apa ia berhasil?"

Untuk menjawabnya, kami mengintegrasikan dua kerangka kerja yang kuat:
1.  **DSRM (Design Science Research Methodology):** Sebagai metodologi utama untuk merancang dan membangun CKM-SE sebagai sebuah *Smart Artifact* @41 @107.
2.  **PICOC-ASTF:** Sebagai kerangka evaluasi untuk mengukur dampak artefak tersebut secara berlapis, dari fondasi teoretis hingga aplikasi di dunia nyata @1 @3 @55 @60 @171.

---

### **Struktur Evaluasi Berlapis (ASTF)**

Evaluasi kami terstruktur dalam empat lapisan investigasi yang berbeda, memastikan validasi di setiap tingkatan—dari ide hingga implementasi.

| Lapisan (ASTF) | Fokus Utama | Pertanyaan Kunci |
| :--- | :--- | :--- |
| **A: Aplikasi** | Dampak Dunia Nyata & VCC | Apakah CKM-SE secara signifikan meningkatkan hasil belajar dan memfasilitasi penciptaan nilai bersama (VCC) dalam konteks nyata? |
| **S: Sistem** | Kualitas & Penerimaan Pengguna | Bagaimana pengalaman pengguna (mahasiswa & dosen) dengan sistem CKM-SE? Apakah sistem memotivasi dan mendukung kolaborasi? |
| **T: Teknologi** | Kinerja Mesin Inti | Seberapa andal dan akurat mesin PUDAL (personalisasi) dan PSKVE (pengukuran nilai) berfungsi secara teknis? |
| **F: Fundamental** | Koherensi & Validitas Teoretis | Apakah kerangka kerja TISE-VALORIZE yang mendasari sistem ini solid secara konseptual dan divalidasi oleh para ahli? |

---

### **Detail Protokol Evaluasi per Lapisan (PICOC)**

Berikut adalah rincian penerapan kerangka PICOC (*Population, Intervention, Comparison, Outcome, Context*) pada setiap lapisan ASTF.

#### **Lapisan A: Aplikasi (Dampak Dunia Nyata)**
Fokus pada pengukuran dampak akhir terhadap pembelajaran dan penciptaan nilai.

*   **P (Population):** Mahasiswa sarjana teknik (n=135) yang terbagi dalam kelompok eksperimen (n=75) dan kontrol (n=60) @2 @5.
*   **I (Intervention):** Implementasi penuh CKM-SE, termasuk *Knowledge Marketplace*, jalur belajar adaptif dari PUDAL, dan penilaian proyek berbasis rubrik PSKVE @36.
*   **C (Comparison):** Kelompok kontrol yang mengikuti perkuliahan dengan metode konvensional (ceramah, tugas standar) tanpa akses ke fitur CKM-SE @47.
*   **O (Outcome):**
    *   **Transfer Pembelajaran:** Peningkatan signifikan pada kemampuan menyelesaikan masalah baru (*novel problem-solving*), diukur dengan tes spesifik @38. **Target:** Ukuran efek *Cohen's d* ≥ 0.80 @2 @7 @19.
    *   **Penciptaan Nilai Bersama (VCC):** Kuantitas dan kualitas artefak yang dihasilkan, diukur dengan **VCC Index** (berdasarkan rubrik PSKVE) dan tingkat penggunaan ulang artefak oleh angkatan berikutnya @1 @23 @35 @116.
    *   **Berpikir Kritis:** Kemampuan analisis, evaluasi, dan sintesis dalam skenario berbasis masalah @39.
*   **Cx (Context):** Mata kuliah inti rekayasa (misalnya, Probabilitas dan Statistika) selama satu semester penuh @2 @111 @135.

#### **Lapisan S: Sistem (Kualitas & Penerimaan Pengguna)**
Fokus pada interaksi antara pengguna dan sistem secara keseluruhan.

*   **P (Population):** Sampel mahasiswa dan dosen (n=20) yang berpartisipasi dalam *usability testing* dan *pilot implementation* @2 @12.
*   **I (Intervention):** Penggunaan prototipe fungsional CKM-SE dalam tugas-tugas terstruktur selama 8 minggu @12.
*   **C (Comparison):** Pengalaman menggunakan sistem pembelajaran (LMS) yang ada atau ekspektasi awal pengguna sebelum intervensi.
*   **O (Outcome):**
    *   **Usabilitas Sistem:** Diukur dengan kuesioner standar *System Usability Scale* (SUS) @159. **Target:** Skor SUS ≥ 70 @2 @19.
    *   **Motivasi Intrinsik:** Diukur dengan *Intrinsic Motivation Inventory* (IMI) sebelum dan sesudah intervensi @2 @156. **Target:** *Cohen's d* ≥ 0.80 @7.
    *   **Identitas Profesional:** Diukur dengan skala *Learning & Professional Identity in Practice* (LPIPS) @137. **Target:** *Cohen's d* ≥ 0.80 @7.
*   **Cx (Context):** Sesi uji coba terkontrol di laboratorium atau dalam lingkup satu mata kuliah percontohan @2 @12.

#### **Lapisan T: Teknologi (Kinerja Mesin Inti)**
Fokus pada validasi komponen teknis internal CKM-SE.

*   **P (Population):** Data log interaksi pengguna dan set data profil mahasiswa.
*   **I (Intervention):** Pemrosesan data oleh PUDAL Engine dan PSKVE Engine.
*   **C (Comparison):** *Baseline* atau hasil dari algoritma standar sebagai pembanding.
*   **O (Outcome):**
    *   **Akurasi Personalisasi (PUDAL):** Tingkat akurasi dalam memprofilkan gaya belajar mahasiswa dan merekomendasikan jalur pembelajaran yang optimal @13. **Target:** Akurasi ≥ 85% @13.
    *   **Reliabilitas Penilaian (PSKVE):** Konsistensi penilaian antar penilai (*inter-rater reliability*) pada rubrik VCC @35. **Target:** *Cohen’s Kappa* ≥ 0.75 @19 @35 @39.
*   **Cx (Context):** Lingkungan pengembangan dan pengujian sistem (*staging environment*).

#### **Lapisan F: Fundamental (Koherensi Teoretis)**
Fokus pada validasi filosofi dan kerangka konseptual yang mendasari CKM-SE.

*   **P (Population):** Panel ahli (n=6) di bidang rekayasa pendidikan, AI, dan psikologi kognitif @3.
*   **I (Intervention):** Presentasi dan dokumentasi kerangka kerja konseptual TISE-VALORIZE.
*   **C (Comparison):** Kerangka kerja pembelajaran cerdas yang sudah ada di literatur.
*   **O (Outcome):**
    *   **Validitas Konsep:** Penilaian ahli mengenai kebaruan, koherensi, dan potensi dampak dari kerangka kerja @20. **Target:** Skor rata-rata ≥ 4.0 dari skala 5.0 @13 @20.
*   **Cx (Context):** Sesi validasi ahli melalui wawancara mendalam dan kuesioner terstruktur.

Dengan pendekatan evaluasi yang sistematis dan berlapis ini, kami memastikan bahwa setiap komponen dari CKM-SE, mulai dari filosofi dasarnya hingga dampaknya di kelas, diuji secara ketat dan transparan.
