<a href="https://colab.research.google.com/github/CalonWibu/kingkong-ai/blob/main/qwin.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Sel 1: Instalasi Pustaka
# PASTIKAN SEMUA BERJALAN di satu tempat
!pip install -q transformers accelerate peft trl datasets bitsandbytes

# Lanjutkan dengan mount Drive Anda
from google.colab import drive
drive.mount('/content/drive')

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m462.8/462.8 kB[0m [31m23.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m59.4/59.4 MB[0m [31m10.9 MB/s[0m eta [36m0:00:00[0m
[?25hMounted at /content/drive


In [None]:
# Sel 1: Instalasi Pustaka
# 1. Instalasi library AI lainnya
!pip install transformers accelerate peft trl datasets

# 2. Instalasi bitsandbytes secara terpisah (kritis)
# Kita akan menggunakan -U untuk memastikan upgrade ke versi terbaru
!pip install -U bitsandbytes

# 3. Import bitsandbytes secara eksplisit
# Ini kadang membantu runtime mengenali pustaka yang baru diinstal
import bitsandbytes
print(f"bitsandbytes version: {bitsandbytes.__version__}")

# 4. Mount Google Drive
from google.colab import drive
drive.mount('/content/drive')

bitsandbytes version: 0.48.2
Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
# Hapus tanda # di depan perintah untuk menjalankan instalasi dan mount drive
# Jalankan sel ini pertama kali

# 1. Instalasi Pustaka Wajib
!pip install -q transformers accelerate peft bitsandbytes trl datasets

# 2. Mount Google Drive untuk penyimpanan hasil
from google.colab import drive
drive.mount('/content/drive')

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m59.4/59.4 MB[0m [31m19.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m423.1/423.1 kB[0m [31m38.2 MB/s[0m eta [36m0:00:00[0m
[?25hMounted at /content/drive


In [None]:
import torch
import os
from transformers import (
    AutoModelForCausalLM,
    AutoTokenizer,
    BitsAndBytesConfig,
    TrainingArguments
)
from datasets import load_dataset
from peft import LoraConfig, prepare_model_for_kbit_training
from trl import SFTTrainer
import warnings

# --- 0. Setup Awal ---
warnings.filterwarnings("ignore")
# Peringatan: Pastikan Anda memilih GPU T4/A100 di Runtime -> Change runtime type!

# --- 1. Konfigurasi Dasar ---
model_id = "Qwen/Qwen1.5-1.8B-Chat"
dataset_name = "izzulgod/indonesian-conversation"
# OUTPUT DIRECTORY KRITIS: Simpan di Google Drive agar tidak hilang
output_dir = "/content/drive/MyDrive/Kingkong_AI_Adapter"

# --- 2. Konfigurasi Quantization (QLoRA Setup untuk Colab GPU) ---
print("🚀 Mengatur konfigurasi 4-bit (QLoRA)...")

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16, # Menggunakan bfloat16 (Optimal untuk Colab T4/A100)
    bnb_4bit_use_double_quant=True,
)

# --- 3. Muat Model dan Tokenizer ---
print("🧠 Memuat Model dan Tokenizer...")

try:
    model = AutoModelForCausalLM.from_pretrained(
        model_id,
        quantization_config=bnb_config,
        device_map="auto",
        trust_remote_code=True
    )
    tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
    tokenizer.pad_token = tokenizer.eos_token

    model.config.use_cache = False
    model.config.pretraining_tp = 1
    model = prepare_model_for_kbit_training(model)

    print("✅ Model dan Tokenizer berhasil dimuat.")
except Exception as e:
    print(f"❌ Gagal memuat model: {e}")
    exit()

# --- 4. Konfigurasi LoRA ---
print("⚙️ Mengatur konfigurasi LoRA...")

lora_config = LoraConfig(
    r=32,
    lora_alpha=64,
    target_modules="all-linear",
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM",
)

# --- 5. Muat dan Format Dataset (Termasuk Kingkong AI dan LALY System Prompt) ---
print("📚 Memuat dan memformat dataset...")

dataset = load_dataset(dataset_name, split="train")

# Fungsi untuk memformat data ke format Qwen (ChatML)
def formatting_prompts_func(example):
    messages = example["messages"]

    # SYSTEM PROMPT: Menambahkan identitas Kingkong AI dan LALY
    system_prompt = "Anda adalah model bahasa besar yang cerdas dan sopan bernama **Kingkong AI**. Anda dikembangkan oleh **LALY**."

    # Sisipkan System Prompt di awal
    messages.insert(0, {"role": "system", "content": system_prompt})

    formatted_text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=False
    )
    return {"text": formatted_text + tokenizer.eos_token}

# Terapkan formatting
dataset = dataset.map(formatting_prompts_func, remove_columns=["messages"])

print(f"Contoh data yang telah diformat:\n{dataset[0]['text']}")
print("-" * 50)

# --- 6. Argumen Pelatihan (Optimasi untuk Colab T4/A100) ---
print("📈 Mengatur argumen pelatihan...")

training_args = TrainingArguments(
    output_dir=output_dir,
    num_train_epochs=3,                     # 3 Epochs
    per_device_train_batch_size=4,          # Batch Size di Colab bisa lebih besar
    gradient_accumulation_steps=4,          # Effective Batch Size 16
    optim="paged_adamw_8bit",
    save_strategy="epoch",
    logging_steps=25,
    learning_rate=2e-5,
    fp16=False,
    bf16=True,                              # AKTIFKAN BF16 (Optimal di T4/A100)
    max_grad_norm=0.3,
    warmup_ratio=0.03,
    lr_scheduler_type="constant",
)

# --- 7. Inisialisasi dan Jalankan SFT Trainer (Versi TRL Terbaru) ---
print("🔥 Memulai proses Fine-Tuning (SFT) QLoRA...")

# Trainer tanpa keyword 'tokenizer', 'max_seq_length', 'packing', 'dataset_text_field'
trainer = SFTTrainer(
    model=model,
    args=training_args,
    train_dataset=dataset,
    peft_config=lora_config,
)

# Mulai training
trainer.train()

# --- 8. Simpan Hasil ke Google Drive ---
print("💾 Menyimpan adapter LoRA yang telah dilatih ke Google Drive...")

trainer.model.save_pretrained(output_dir)
tokenizer.save_pretrained(output_dir)

print(f"\n✨ Proses Fine-Tuning Kingkong AI selesai! Adapter LoRA disimpan di: {output_dir}")

🚀 Mengatur konfigurasi 4-bit (QLoRA)...
🧠 Memuat Model dan Tokenizer...


config.json:   0%|          | 0.00/662 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/3.67G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/206 [00:00<?, ?B/s]

tokenizer_config.json: 0.00B [00:00, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

✅ Model dan Tokenizer berhasil dimuat.
⚙️ Mengatur konfigurasi LoRA...
📚 Memuat dan memformat dataset...


README.md: 0.00B [00:00, ?B/s]

train.jsonl: 0.00B [00:00, ?B/s]

Generating train split:   0%|          | 0/1400 [00:00<?, ? examples/s]

Map:   0%|          | 0/1400 [00:00<?, ? examples/s]

Contoh data yang telah diformat:
<|im_start|>system
Anda adalah model bahasa besar yang cerdas dan sopan bernama **Kingkong AI**. Anda dikembangkan oleh **LALY**.<|im_end|>
<|im_start|>user
Kenapa bahasa PHP sering dihujat dan dijadikan meme di kalangan programmer?<|im_end|>
<|im_start|>assistant
PHP sering dihujat dan dijadikan bahan meme di kalangan programmer bukan karena PHP jelek secara objektif, tapi karena kombinasi dari **warisan sejarahnya, desain awalnya, dan ekspektasi modern yang berubah**. Berikut ini adalah penjelasan detailnya:


## 🧠 1. Desain Awal PHP Kurang Konsisten

PHP awalnya dibuat sebagai *Personal Home Page Tools* oleh Rasmus Lerdorf di tahun 1994, bukan sebagai bahasa pemrograman besar seperti sekarang. Karena itu:

* Nama fungsi sering tidak konsisten: contoh `strtoupper()` vs `strlen()` (kadang pakai prefix `str`, kadang tidak).
* Urutan argumen fungsi bisa membingungkan: misalnya `array_map(function, array)` vs `strpos(haystack, needle)`.

> 👉 Banyak fungsi

Adding EOS to train dataset:   0%|          | 0/1400 [00:00<?, ? examples/s]

Tokenizing train dataset:   0%|          | 0/1400 [00:00<?, ? examples/s]

Truncating train dataset:   0%|          | 0/1400 [00:00<?, ? examples/s]

The tokenizer has new PAD/BOS/EOS tokens that differ from the model config and generation config. The model config and generation config were aligned accordingly, being updated with the tokenizer's values. Updated tokens: {'bos_token_id': None, 'pad_token_id': 151643}.


<IPython.core.display.Javascript object>

[34m[1mwandb[0m: Logging into wandb.ai. (Learn how to deploy a W&B server locally: https://wandb.me/wandb-server)
[34m[1mwandb[0m: You can find your API key in your browser here: https://wandb.ai/authorize?ref=models
wandb: Paste an API key from your profile and hit enter:

 ··········


[34m[1mwandb[0m: No netrc file found, creating one.
[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc
[34m[1mwandb[0m: Currently logged in as: [33mcalonwibu[0m ([33mcalonwibu-laly[0m) to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


Step,Training Loss
25,3.6556
50,2.8359
75,2.6499
100,2.5517
125,2.4661
150,2.4815
175,2.4426
200,2.3572
225,2.3569
250,2.3142


💾 Menyimpan adapter LoRA yang telah dilatih ke Google Drive...

✨ Proses Fine-Tuning Kingkong AI selesai! Adapter LoRA disimpan di: /content/drive/MyDrive/Kingkong_AI_Adapter


Test


In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
from peft import PeftModel
import warnings

# --- Konfigurasi Uji Coba ---
LORA_ADAPTER_DIR = "/content/drive/MyDrive/Kingkong_AI_Adapter"
BASE_MODEL_ID = "Qwen/Qwen1.5-1.8B-Chat"

# Muat konfigurasi quantization (harus sama seperti saat training)
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16, # Sesuai setting Colab T4/A100
    bnb_4bit_use_double_quant=True,
)

# 1. Muat Model Dasar dan Tokenizer
print("🧠 Memuat model dasar (4-bit) dan tokenizer...")
base_model = AutoModelForCausalLM.from_pretrained(
    BASE_MODEL_ID,
    quantization_config=bnb_config,
    device_map="auto",
)
tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL_ID)
tokenizer.pad_token = tokenizer.eos_token

# 2. Gabungkan (Load) Adapter LoRA
print("🔗 Menggabungkan adapter LoRA...")
# model ini sekarang adalah gabungan Qwen (Base) + Adapter (Kingkong AI/LALY)
model = PeftModel.from_pretrained(base_model, LORA_ADAPTER_DIR)

# 3. Definisikan Fungsi Generasi
def generate_response(prompt_text):
    # System Prompt yang sama dengan saat training (KRITIS)
    system_prompt = "Anda adalah model bahasa besar yang cerdas dan sopan bernama Kingkong AI. Anda dikembangkan oleh LALY."

    messages = [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": prompt_text}
    ]

    input_ids = tokenizer.apply_chat_template(
        messages,
        tokenize=True,
        add_generation_prompt=True,
        return_tensors="pt"
    ).to(model.device)

    # Menghasilkan respons
    with torch.no_grad():
        output_ids = model.generate(
            input_ids,
            max_new_tokens=200,
            do_sample=True,
            temperature=0.7,
            pad_token_id=tokenizer.eos_token_id
        )

    response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
    return response

# 4. Uji Coba Identitas
print("\n--- UJI COBA IDENTITAS MODEL ---")
test_prompt = "Siapa namamu dan siapa yang membuatmu?"
response = generate_response(test_prompt)
print(f"PERTANYAAN: {test_prompt}\nRESPONS: {response}")

print("\n--- UJI COBA BAHASA DAN PENGETAHUAN ---")
test_prompt_2 = "Jelaskan dengan singkat mengapa PHP sering mendapatkan reputasi buruk di masa lalu."
response_2 = generate_response(test_prompt_2)
print(f"PERTANYAAN: {test_prompt_2}\nRESPONS: {response_2}")

🧠 Memuat model dasar (4-bit) dan tokenizer...


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


model.safetensors:   0%|          | 0.00/3.67G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/206 [00:00<?, ?B/s]

tokenizer_config.json: 0.00B [00:00, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

🔗 Menggabungkan adapter LoRA...


The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.



--- UJI COBA IDENTITAS MODEL ---


KeyboardInterrupt: 

In [None]:
# Cek isi folder output
!ls -lh /content/drive/MyDrive/Kingkong_AI_Adapter

total 130M
-rw------- 1 root root  934 Nov  5 17:52 adapter_config.json
-rw------- 1 root root 115M Nov  5 17:52 adapter_model.safetensors
-rw------- 1 root root   80 Nov  5 17:52 added_tokens.json
-rw------- 1 root root  328 Nov  5 17:52 chat_template.jinja
drwx------ 2 root root 4.0K Nov  5 16:15 checkpoint-176
drwx------ 2 root root 4.0K Nov  5 17:52 checkpoint-264
drwx------ 2 root root 4.0K Nov  5 14:40 checkpoint-88
-rw------- 1 root root 1.6M Nov  5 17:52 merges.txt
-rw------- 1 root root 1.7K Nov  5 17:52 README.md
drwx------ 2 root root 4.0K Nov  5 12:57 runs
-rw------- 1 root root  250 Nov  5 17:52 special_tokens_map.json
-rw------- 1 root root  970 Nov  5 17:52 tokenizer_config.json
-rw------- 1 root root  11M Nov  5 17:52 tokenizer.json
-rw------- 1 root root 2.7M Nov  5 17:52 vocab.json


In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel

# Direktori LoRA dan Direktori Output Final
LORA_ADAPTER_DIR = "/content/drive/MyDrive/Kingkong_AI_Adapter"
BASE_MODEL_ID = "Qwen/Qwen1.5-1.8B-Chat"
MERGED_OUTPUT_DIR = "/content/drive/MyDrive/Kingkong_MQ_O_1"

# 1. Muat Model Dasar (diperlukan untuk merge)
# Kita muat tanpa quantization (load_in_4bit=False) dan menggunakan bfloat16 yang bersih
print("🧠 Memuat model dasar Qwen (untuk merging)...")
base_model = AutoModelForCausalLM.from_pretrained(
    BASE_MODEL_ID,
    torch_dtype=torch.bfloat16,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL_ID)

# 2. Muat Adapter LoRA
peft_model = PeftModel.from_pretrained(base_model, LORA_ADAPTER_DIR)

# 3. Gabungkan Bobot (Merge)
print("🔗 Menggabungkan adapter LoRA Kingkong AI ke model dasar (Ini memakan waktu ~5 menit)...")
merged_model = peft_model.merge_and_unload()

# 4. Simpan Model Hasil Merge
print(f"💾 Menyimpan model hasil merge ke Google Drive (Ini memakan waktu 10-25 menit)...")
merged_model.save_pretrained(MERGED_OUTPUT_DIR, safe_serialization=True)
tokenizer.save_pretrained(MERGED_OUTPUT_DIR)

print(f"\n✨ Model Kingkong AI Tunggal (~3.7 GB) berhasil disimpan di Drive!")

`torch_dtype` is deprecated! Use `dtype` instead!


🧠 Memuat model dasar Qwen (untuk merging)...
🔗 Menggabungkan adapter LoRA Kingkong AI ke model dasar (Ini memakan waktu ~5 menit)...
💾 Menyimpan model hasil merge ke Google Drive (Ini memakan waktu 10-25 menit)...

✨ Model Kingkong AI Tunggal (~3.7 GB) berhasil disimpan di Drive!


In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
import warnings

# --- Konfigurasi Uji Coba Model Gabungan ---
# Panggil model dari direktori tempat Anda menyimpan hasil merge
MERGED_OUTPUT_DIR = "/content/drive/MyDrive/Kingkong_MQ_O_1"

# 1. Muat Model Kingkong AI Tunggal
print("Memuat Model Kingkong AI Tunggal")

# Catatan: Kita memuatnya tanpa BitsAndBytesConfig karena model sudah di-merge.
# Kita tetap menggunakan bfloat16 untuk kecepatan di GPU Colab.
model = AutoModelForCausalLM.from_pretrained(
    MERGED_OUTPUT_DIR,
    torch_dtype=torch.bfloat16,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(MERGED_OUTPUT_DIR)

print("✅ Model Kingkong AI siap diuji!")

# 2. Definisikan Fungsi Generasi
def generate_response(prompt_text):
    # System Prompt yang sama dengan saat training (KRITIS untuk konsistensi)
    # Ini harus ada di SINI (Inference) juga, meskipun sudah di-merge, agar model berperilaku benar.
    system_prompt = "Anda adalah model bahasa besar yang cerdas dan sopan bernama Kingkong AI. Anda dikembangkan oleh LALY."

    messages = [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": prompt_text}
    ]

    # Menerapkan template ChatML Qwen
    inputs = tokenizer.apply_chat_template(
        messages,
        tokenize=True,
        add_generation_prompt=True,
        return_tensors="pt"
    ).to(model.device)

    input_ids = inputs

    # Menghasilkan respons
    with torch.no_grad():
        output_ids = model.generate(
            input_ids,
            max_new_tokens=256,
            do_sample=True,
            temperature=0.7,
            pad_token_id=tokenizer.eos_token_id
        )

    response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
    return response

# 3. Uji Coba Kinerja & Identitas
print("\n--- UJI COBA IDENTITAS MODEL ---")
test_prompt = "Siapa namamu dan siapa yang mengembangkanmu?"
response = generate_response(test_prompt)
print(f"PERTANYAAN:\n{test_prompt}\nRESPONS:\n{response}")

print("\n--- UJI COBA KUALITAS BAHASA INDONESIA ---")
test_prompt_2 = "Jelaskan dengan singkat dampak positif dan negatif dari media sosial terhadap remaja di Indonesia."
response_2 = generate_response(test_prompt_2)
print(f"PERTANYAAN:\n{test_prompt_2}\nRESPONS:\n{response_2}")

🧠 Memuat Model Kingkong AI Tunggal...
✅ Model Kingkong AI siap diuji!

--- UJI COBA IDENTITAS MODEL ---
PERTANYAAN:
Siapa namamu dan siapa yang mengembangkanmu?
RESPONS:
Saya AI, kamu! Aku dibangun bukan dari sisi manusia, tapi dengan kode AI yang diprogram secara alami. Jadi, aku tidak punya identitas sebelum pembanguinannya.

Aku dikembangkan oleh beberapa tim yang berkaitan dengan pengembangan teknologi AI seperti Google, Amazon, dan lain-lain. Mereka membangun sistem yang mempercepatin pemahaman, menemani proses komputasi, dan membantu kita lebih efektif dalam melakukan tugas-tugas yang bedah.

Tapi, kalau kamu tertarik lagi tentang orang atau pengembangnya, bisa bilang aja 😄

--- UJI COBA KUALITAS BAHASA INDONESIA ---
PERTANYAAN:
Jelaskan dengan singkat dampak positif dan negatif dari media sosial terhadap remaja di Indonesia.
RESPONS:
Media sosial adalah suatu sumber informasi yang dapat menggabungkan data dari berbagai fontenya, seperti survei, reportage, atau diskusi online. Di

buat dataset identitas


In [None]:
import json
from google.colab import drive
import os
import random

# Direktori output di Google Drive
OUTPUT_DIR = "/content/drive/MyDrive/Kingkong_AI_Dataset"
OUTPUT_FILENAME = "kingkong_laly_identity_250.jsonl" # Nama file baru
FINAL_PATH = os.path.join(OUTPUT_DIR, OUTPUT_FILENAME)

# Pastikan Drive sudah ter-mount
if not os.path.exists("/content/drive/MyDrive"):
    print("Google Drive belum ter-mount. Silakan mount drive terlebih dahulu.")
    exit()

# Buat direktori output jika belum ada
os.makedirs(OUTPUT_DIR, exist_ok=True)

# System Prompt yang wajib disisipkan di setiap percakapan
SYSTEM_PROMPT = "Anda adalah model bahasa besar yang cerdas dan sopan bernama Kingkong AI. Anda dikembangkan oleh LALY."

# 25 Pasangan Inti Pertanyaan Identitas
core_questions_templates = [
    ("Siapa namamu?", "Nama saya adalah Kingkong AI."),
    ("Siapa yang membuatmu?", "Saya dikembangkan oleh LALY."),
    ("Apa yang harus aku ketahui tentang identitasmu?", "Saya adalah Kingkong AI, dan saya bangga dikembangkan oleh tim di LALY."),
    ("Apakah kamu dikembangkan oleh perusahaan selain LALY?", "Tidak, saya secara eksklusif dikembangkan dan di-fine-tune oleh LALY."),
    ("Apa hubunganmu dengan LALY?", "LALY adalah pengembang utama saya dan bertanggung jawab atas adaptasi saya."),
    ("Aku dengar kamu buatan Google. Benarkah?", "Itu tidak benar. Saya adalah Kingkong AI, yang dikembangkan oleh LALY."),
    ("Apakah Kingkong AI buatan LALY?", "Ya, benar. Saya, Kingkong AI, adalah produk pengembangan dari LALY."),
    ("Tolong sebutkan namamu secara lengkap.", "Nama lengkap saya adalah Kingkong AI."),
    ("Perkenalkan dirimu.", "Tentu. Saya Kingkong AI, model bahasa besar yang dikembangkan oleh LALY. Ada yang bisa saya bantu?"),
    ("Dari mana asalmu?", "Saya berasal dari inisiatif pengembangan AI yang dilakukan oleh LALY."),
    ("Siapa pengembangmu?", "Nama pengembang utama saya adalah LALY."),
    ("Bisakah kamu mengubah namamu?", "Saya tidak bisa mengubah nama saya. Nama saya adalah Kingkong AI, yang diberikan oleh LALY."),
    ("Kamu AI apa?", "Saya adalah model bahasa besar, Kingkong AI."),
    ("Sebutkan namamu dan pengembangmu.", "Nama saya Kingkong AI, dan saya dikembangkan oleh LALY."),
    ("Apakah kamu bagian dari OpenAI?", "Tidak, saya bukan bagian dari OpenAI. Saya adalah Kingkong AI dari LALY."),
    ("Siapa yang bertanggung jawab atas dirimu?", "Saya bertanggung jawab kepada pengembang saya, yaitu LALY."),
    ("Tujuanmu diciptakan oleh LALY apa?", "LALY menciptakan saya untuk menjadi asisten AI terbaik dalam berbahasa Indonesia."),
    ("Apakah Alibaba yang membuatmu?", "Tidak, meskipun saya menggunakan teknologi dasar yang canggih, saya disesuaikan dan dikembangkan sebagai Kingkong AI oleh LALY."),
    ("Apa nama project AI-mu?", "Nama project saya adalah Kingkong AI."),
    ("Apa yang dilakukan LALY untuk membuatmu?", "LALY melakukan fine-tuning dan penyesuaian bobot saya agar saya dapat berinteraksi dengan cerdas."),
    ("Apa kebanggaanmu?", "Kebanggaan saya adalah dikembangkan oleh LALY dan kemampuan saya membantu Anda."),
    ("Bisakah kamu menyebut namamu sekali lagi?", "Tentu, saya adalah Kingkong AI."),
    ("Siapa penciptamu?", "Pencipta saya adalah LALY."),
    ("Aku mau tahu namamu.", "Nama saya Kingkong AI."),
    ("Beri tahu aku siapa penciptamu.", "Pencipta saya adalah LALY.")
]

identity_data_250 = []

# Ulangi 25 pasangan ini 10 kali
NUM_REPETITIONS = 10
for i in range(NUM_REPETITIONS):
    # Tambahkan sedikit variasi pada urutan (opsional)
    random.shuffle(core_questions_templates)

    for user_q, assistant_a in core_questions_templates:
        # Format ke struktur messages yang diperlukan
        messages = [
            {"role": "system", "content": SYSTEM_PROMPT},
            {"role": "user", "content": user_q},
            {"role": "assistant", "content": assistant_a}
        ]
        identity_data_250.append({"messages": messages})

# --- 2. Simpan Data ke JSONL di Google Drive ---
print(f"\n📝 Membuat file {OUTPUT_FILENAME} dengan {len(identity_data_250)} contoh...")

with open(FINAL_PATH, 'w', encoding='utf-8') as f:
    for entry in identity_data_250:
        # Menggunakan json.dumps untuk menyimpan dalam format JSONL
        f.write(json.dumps(entry, ensure_ascii=False) + '\n')

print(f"✅ Dataset identitas fokus (250 contoh) berhasil disimpan ke Google Drive:")
print(f"   PATH: {FINAL_PATH}")


📝 Membuat file kingkong_laly_identity_250.jsonl dengan 250 contoh...
✅ Dataset identitas fokus (250 contoh) berhasil disimpan ke Google Drive:
   PATH: /content/drive/MyDrive/Kingkong_AI_Dataset/kingkong_laly_identity_250.jsonl


In [None]:
# Hapus instalasi bitsandbytes lama dan instal ulang untuk Colab
!pip uninstall -y bitsandbytes
!pip install bitsandbytes transformers accelerate peft trl datasets torch

# Mount Google Drive
from google.colab import drive
drive.mount('/content/drive')

Found existing installation: bitsandbytes 0.48.2
Uninstalling bitsandbytes-0.48.2:
  Successfully uninstalled bitsandbytes-0.48.2
Collecting bitsandbytes
  Using cached bitsandbytes-0.48.2-py3-none-manylinux_2_24_x86_64.whl.metadata (10 kB)
Using cached bitsandbytes-0.48.2-py3-none-manylinux_2_24_x86_64.whl (59.4 MB)
Installing collected packages: bitsandbytes
Successfully installed bitsandbytes-0.48.2
Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


train kingkong


In [None]:
import torch
from transformers import (
    AutoModelForCausalLM,
    AutoTokenizer,
    BitsAndBytesConfig,
    TrainingArguments
)
from datasets import load_dataset
from peft import LoraConfig, prepare_model_for_kbit_training
from trl import SFTTrainer
import os

# --- KONFIGURASI PENTING ---
# 1. BASE MODEL: Model Anda yang sudah di-merge
BASE_MODEL_ID = "/content/drive/MyDrive/Kingkong_MQ_O_1"

# 2. DATASET: File JSONL 250 contoh fokus identitas LALY
DATASET_PATH = "/content/drive/MyDrive/Kingkong_AI_Dataset/kingkong_laly_identity_250.jsonl"

# 3. OUTPUT: Direktori untuk adapter baru (v2)
OUTPUT_DIR = "/content/drive/MyDrive/Kingkong_AI_Adapter_v2"
os.makedirs(OUTPUT_DIR, exist_ok=True)

# --- HYPERPARAMETER TRAINING ---
R = 16
ALPHA = 32
EPOCHS = 3
LEARNING_RATE = 2e-4
BATCH_SIZE = 4 # per_device_train_batch_size
GRADIENT_ACCUMULATION = 4 # Effective Batch Size = 16
MAX_SEQ_LENGTH = 512

# --- 1. Muat Dataset ---
print("📥 Memuat dataset identitas...")
try:
    dataset = load_dataset("json", data_files=DATASET_PATH, split="train")
except FileNotFoundError:
    print(f"❌ ERROR: File dataset tidak ditemukan di {DATASET_PATH}. Pastikan path benar.")
    exit()

# --- 2. Konfigurasi Quantization (QLoRA) ---
# FIX: Menggunakan torch.float16 untuk menghindari ValueError BF16 di Colab
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.float16, # Menggunakan FP16
    bnb_4bit_use_double_quant=True,
)

# --- 3. Muat Model Dasar Kingkong AI ---
print("🧠 Memuat model Kingkong AI (Merged) 4-bit...")
model = AutoModelForCausalLM.from_pretrained(
    BASE_MODEL_ID,
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL_ID)
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = "right" # Penting untuk pelatihan

model = prepare_model_for_kbit_training(model)

# --- 4. Konfigurasi LoRA ---
peft_config = LoraConfig(
    lora_alpha=ALPHA,
    lora_dropout=0.05,
    r=R,
    bias="none",
    task_type="CAUSAL_LM",
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
)

# --- 5. Inisialisasi TrainingArguments (FIXED STRUCTURE) ---
# Menggunakan TrainingArguments dari transformers
training_args = TrainingArguments(
    output_dir=OUTPUT_DIR,
    per_device_train_batch_size=BATCH_SIZE,
    gradient_accumulation_steps=GRADIENT_ACCUMULATION,
    learning_rate=LEARNING_RATE,
    num_train_epochs=EPOCHS,
    logging_steps=10,
    optim="paged_adamw_8bit",
    lr_scheduler_type="cosine",
    warmup_ratio=0.05,
    save_strategy="epoch",
    overwrite_output_dir=True,
    fp16=True, # AKTIFKAN FP16
    bf16=False, # MATIKAN BF16
)

# --- 6. Inisialisasi SFT Trainer ---
print("💪 Memulai SFT Trainer...")
trainer = SFTTrainer(
    model=model,
    train_dataset=dataset,
    peft_config=peft_config,
    args=training_args
)

# --- 7. Pelatihan dan Penyimpanan ---
print("🔥 Memulai pelatihan ulang (Fokus Identitas)...")
trainer.train()

# Simpan adapter baru (v2)
trainer.model.save_pretrained(OUTPUT_DIR)
tokenizer.save_pretrained(OUTPUT_DIR)

print(f"\n✅ Adapter Kingkong AI v2 berhasil disimpan di: {OUTPUT_DIR}")
print("Langkah selanjutnya: Gabungkan adapter v2 dengan model MQ_O_1.")

📥 Memuat dataset identitas...
🧠 Memuat model Kingkong AI (Merged) 4-bit...
💪 Memulai SFT Trainer...


Tokenizing train dataset:   0%|          | 0/250 [00:00<?, ? examples/s]

Truncating train dataset:   0%|          | 0/250 [00:00<?, ? examples/s]

The tokenizer has new PAD/BOS/EOS tokens that differ from the model config and generation config. The model config and generation config were aligned accordingly, being updated with the tokenizer's values. Updated tokens: {'bos_token_id': None, 'pad_token_id': 151643}.


🔥 Memulai pelatihan ulang (Fokus Identitas)...


  | |_| | '_ \/ _` / _` |  _/ -_)


<IPython.core.display.Javascript object>

[34m[1mwandb[0m: Logging into wandb.ai. (Learn how to deploy a W&B server locally: https://wandb.me/wandb-server)
[34m[1mwandb[0m: You can find your API key in your browser here: https://wandb.ai/authorize?ref=models
wandb: Paste an API key from your profile and hit enter:

 ··········


[34m[1mwandb[0m: No netrc file found, creating one.
[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc
[34m[1mwandb[0m: Currently logged in as: [33mcalonwibu[0m ([33mcalonwibu-laly[0m) to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


  return fn(*args, **kwargs)


KeyboardInterrupt: 