In [None]:
pip install bert_score



In [None]:
# --- 1. Import libraries ---
from transformers import GPT2LMHeadModel, GPT2Tokenizer
from bert_score import score
from sentence_transformers import SentenceTransformer, util
import torch


In [None]:

# --- 2. Load fine-tuned GPT2 model and tokenizer ---
model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-50test'
tokenizer = GPT2Tokenizer.from_pretrained(model_path)
model = GPT2LMHeadModel.from_pretrained(model_path)
model.eval()

# --- 3. Prepare input masalah ---
input_problem = "Aplikasi sering crash ketika digunakan di kondisi jaringan lambat."

# --- 4. Generate rekomendasi dari model ---
inputs = tokenizer.encode(input_problem, return_tensors='pt')
outputs = model.generate(inputs,
                         max_length=200,
                         num_return_sequences=1,
                         no_repeat_ngram_size=2,
                         early_stopping=True)

generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("Generated Recommendation:\n", generated_text)

# --- 5. Prepare reference rekomendasi ---
reference_text = "Untuk mengurangi crash saat jaringan lambat, optimalkan timeout koneksi dan tambahkan mekanisme retry pada request jaringan."

# --- 6. BERTScore evaluation ---
P, R, F1 = score([generated_text], [reference_text], lang='id')  # sesuaikan lang ke 'id' untuk Bahasa Indonesia
print(f"\nBERTScore - F1: {F1.item():.4f}")

# --- 7. Cosine Similarity evaluation ---
# Load sentence transformer model untuk embedding
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
emb_reference = embedder.encode(reference_text, convert_to_tensor=True)

cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
print(f"Cosine Similarity: {cosine_sim.item():.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


Generated Recommendation:
 Aplikasi sering crash ketika digunakan di kondisi jaringan lambat. Perluas kompatibilitas aplikasi dengan pengujian di berbagai perangkat dan sistem operasi. Tambahkan sistem reconnect otomatis.
Tampilan error nan tidak informatif dalam perangkat dengan sistem berkas. Tidak ada panduan penerapan. Sediakan pesan error yang jelas agar pengguna tahu langkah penyelesaiannya. Informasi yang ditampilkan selalu real-time. Integrasikan dengan otomatisasi data. Pembayaran menurut berkala. OTP atau otomisasi data agar pemakai tahu siasat penyetoran. Optimalkan performa penyalinan. Error. Koneksi data pula otomat. Tingkatkan peladen pula optimalkan algoritma verifikasi agar lebih cepat dan efisien. Proses penyandian data akan lebih lajak dan otomasi data dengan cepat. Penyetesan data mudah. Waktu penyannya lebih ringkas dan mekanisasi. Data akan bertambah cepat serta efisien pula. Pemetelan data untuk peranti dengan spesifikasi rendah. Teknologinya lebih mekanistik. Ban

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/49.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/625 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/996k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.96M [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/714M [00:00<?, ?B/s]


BERTScore - F1: 0.6393


modules.json:   0%|          | 0.00/229 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/122 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/3.89k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/645 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/471M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/480 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


tokenizer.json:   0%|          | 0.00/9.08M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/239 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

Cosine Similarity: 0.5645


#multi data

In [None]:
# --- 1. Import libraries (kalau belum diimport di atas, ini bisa di-skip) ---
# from transformers import GPT2LMHeadModel, GPT2Tokenizer
# from bert_score import score
# from sentence_transformers import SentenceTransformer, util
# import torch

# --- 2. Load model and tokenizer ---
# model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-50test'
# tokenizer = GPT2Tokenizer.from_pretrained(model_path)
# model = GPT2LMHeadModel.from_pretrained(model_path)
# model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering logout otomatis",
    "Pembaruan aplikasi menyebabkan bug baru",
    "Tidak ada opsi reset password",
    "Navigasi halaman sering tersendat",
    "Aplikasi boros baterai"
]

references = [
   "Perbaiki sistem manajemen sesi dan tambahkan opsi ingat saya untuk pengguna.",
   "Lakukan regression testing menyeluruh sebelum merilis pembaruan.",
   "Tambahkan fitur reset password yang aman dan mudah digunakan.",
   "Optimalkan performa navigasi dengan mengurangi beban elemen UI yang berat.",
   "Optimalkan penggunaan resource aplikasi dan kurangi proses latar belakang."

]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering logout otomatis
Generated: Aplikasi sering logout otomatis Rekomendasi: Perbaiki fitur upload dan tambahkan validasi dokumen untuk meminimalisir kesalahan. Perluas kompatibilitas aplikasi. Tambahkan prosedur auto-save dan perbaiki manajemen database untuk menjaga kredibilitas data. OTP.
OTP atau biometrik. Optimalkan konektivitas dengan biososial. Integrasikan data agar lebih cepat dan efisien. Proses pembuktian di berbagai perangkat dan sistem operasi. Informasi yang ditampilkan selalu real-time. Tingkatkan algoritma verifikasi agar makin cepat. Biometrik akan lebih lajak dan cepat serta efisien serta cepat

UX yang lebih intuitif berdasarkan feedback pengguna. UX nan lebih ringkas dan mekanisasi data
UCX lebih efisien berdasarkan perangkat. UI/Ux yang kian ringkas berdasarkan otomatisasi data dengan otomasi data yang makin ringkas. Koneksi data akan bertambah cepat pula otonom. Standar operasi dan otomisasi informasi. Data akan kian cepat dengan uji sistem rec

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pembaruan aplikasi menyebabkan bug baru
Generated: Pembaruan aplikasi menyebabkan bug baru Rekomendasi: Perbaiki fitur captcha dan sediakan opsi verifikasi lain seperti OTP atau biometrik. Perluas kompatibilitas lintas perangkat. Optimalkan konektivitas pula tambahkan sistem reconnect otomatis. ODP atau perbaiki manajemen database untuk menjaga integritas data.

UX yang lebih intuitif berdasarkan feedback pengguna. Tambahkan sifat biutorial. Proses tes mudah-mudahan lebih cepat dan efisien. Tingkatkan algoritma verifikasi agar lebih lajak dan cepat. Integrasikan data akan lebih efisien dan mekanisasi data agar makin cepat serta efisien
Dengan sistem operasi. UX nan lebih mekanistik. Koneksi data pula lebih ringkas dan otomatisasi data dengan otomasi data lebih real-time. Informasi yang ditampilkan selalu real – data yang kian ringkas. Data yang tersimpan di dalam perangkat dengan sistem otori. Tulang punggung data kian real. Biutrasi data dan sistem penggajian data untuk perant

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Tidak ada opsi reset password
Generated: Tidak ada opsi reset password Rekomendasi: Tambahkan fitur reseth yang mudah digunakan melalui email atau OTP. Tampilkan fitur email yang gembur digunakan dalam email. ODP atau biometrik. Optimalkan konektivitas dengan email maupun OT. Perbaiki manajemen database untuk menjaga integritas data. Integrasikan data untuk menghormati integritas database.
OTP atau tambahkan karakteristik reson past pastri-save. Proses tes kompatibilitas lintas perangkat. Tingkatkan fitur pascakemas dengan audit di bineka perangkat dengan sistem operasi. Simplifikasi data agar lebih cepat dan efisien. Informasi yang ditampilkan selalu real-time. Koneksi data dengan otomatisasi data pula lebih ringkas. Data yang lebih lajak dan otomasi data lebih real – biograf. Biometrik akan lebih intuitif berdasarkan feedback pengguna. Tulang punggung data akan bertambah cepat. Sistem operasi pula otorifikasi informasi. Standar operasi bagi perangkat menggunakan formulir yang

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Navigasi halaman sering tersendat
Generated: Navigasi halaman sering tersendat Rekomendasi: Optimalkan konektivitas serta tambahkan metode reconnect otomatis. Optimasi server. Tambahkan prosedur recon-on dan perbaiki manajemen database untuk menjaga integritas data. OTP. Proses recoll digunakan melalui email atau ODP.
Teknik reclame digunakan bersama optimasi algoritma recod borang yang lebih ringkas bersama otomatisasi data dengan otomasi data menurut berkala. Integrasikan data yang kian ringkas pula otonom. Perbaiki tata laksana database. Informasi yang ditampilkan selalu real-time. Tingkatkan algoritma verifikasi agar lebih cepat dan efisien. Data yang bertambah cepat. otonomi data agar informasi yang muncul selalureal-an. Pembuktian data pula lebih lajak. Simplifikasi data untuk mengurangi crash dan tes kompatibilitas lintas perangkat. Banyak formulir yang makin ringkas dan otomisasi data biar lebih luwes. Koneksi data akan lebih mekanisasi. Bilamana lebih langgeng dan meka

In [None]:
#--- 2. Load model and tokenizer ---
model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-30test'
tokenizer = GPT2Tokenizer.from_pretrained(model_path)
model = GPT2LMHeadModel.from_pretrained(model_path)
model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering logout otomatis",
    "Pembaruan aplikasi menyebabkan bug baru",
    "Tidak ada opsi reset password",
    "Navigasi halaman sering tersendat",
    "Aplikasi boros baterai"
]

references = [
   "Perbaiki sistem manajemen sesi dan tambahkan opsi ingat saya untuk pengguna.",
   "Lakukan regression testing menyeluruh sebelum merilis pembaruan.",
   "Tambahkan fitur reset password yang aman dan mudah digunakan.",
   "Optimalkan performa navigasi dengan mengurangi beban elemen UI yang berat.",
   "Optimalkan penggunaan resource aplikasi dan kurangi proses latar belakang."

]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering logout otomatis
Generated: Aplikasi sering logout otomatis Rekomendasi: Perbaiki fitur aplikasi untuk pengingat. Perluas kompatibilitas aplikasi dengan pengujian di berbagai perangkat dan sistem operasi. Tambahkan prosedur verifikasi lain seperti OTP atau biometrik. OPS.
Pengeringan data. Tingkatkan penampilan backend dengan load balancing dan optimasi server. Optimalkan prestasi backonnect otomatis. Integrasikan payment gateway yang stabil dan uji kompatibilitas lintas perangkat. Proses verifikasi di bermacam rupa perangkat serta sistem pembayaran secara berkala. Informasi yang ditampilkan selalu real-time. Data yang relevan pada berbagai perabot dan organisasi operasi menurut berkala (ulang). Perkuat sistem penggajian. Pembayaran secara periodik. Simplifikasi data agar informasi yang muncul selalu berkala dan berkala pula berkala dengan berkala secara teratur. Observasi berkala agar data yang lebih cepat dan efisien. Pembuktian berkala serta berkala maka berka

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pembaruan aplikasi menyebabkan bug baru
Generated: Pembaruan aplikasi menyebabkan bug baru Rekomendasi: Tingkatkan penampilan backend dengan load balancing dan optimasi server. Tambahkan sifat push notification yang berfungsi di latar belakang untuk pengingat. Perluas kompatibilitas aplikasi.
Perbaiki sifat upload dan tambahkan karakteristik pash dan uji kompatibilitas lintas perangkat. Optimalkan performa backdread. Tingkat kompatibilitas rute perangkat dengan pengujian di berbagai perangkat dan sistem operasi. OTP. Integrasikan payment gateway yang lebih intuitif berdasarkan feedback pengguna. Proses tes di bermacam rupa perangkat serta sistem pembayaran secara berkala. Informasi yang ditampilkan selalu real-time. Tidak mendukung banyak macam perangkat beserta sistem penggajian secara permanen. Perangkat dengan sistem reconnect otomatis. Test sistem backonnecting dan tes kompatibilitas trayek perangkat memakai formulir yang kian ringkas dan otomatisasi data. Data yang relevan

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Tidak ada opsi reset password
Generated: Tidak ada opsi reset password Rekomendasi: Tambahkan fitur reses pastcha bermasalah yang mudah digunakan melalui email atau OTP. Tampilkan fitur email. OLT atau biometrik. Perbaiki fitur pascak yang sepele digunakan melewati email maupun OT.
Menggunakan fitur push notification yang berfungsi di latar belakang untuk pengingat. Jika digunakan di dalam aplikasi. Push akan menjaga integritas data. Optimalkan penampilan aplikasi untuk menghormati integritas dokumen. Integrasikan email untuk menjaga karakter data agar informasi yang ditampilkan selalu real-time. Tingkatkan integritas informasi. Tidak mendukung integritas email agar pengalaman. Sediakan preferensi verifikasi lain seperti OTs yang lebih cepat dan efisien. Proses testimoni email yang jelas agar pengguna tahu langkah penyelesaiannya. Simplifikasi data untuk menongkrongi integritas pesan. Setelah email dan OTM. Passwuain mudah-mudahan lebih ringkas dan otomatisasi data akan menua. 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Navigasi halaman sering tersendat
Generated: Navigasi halaman sering tersendat Rekomendasi: Optimalkan konektivitas maka tambahkan operasi reconnect otomatis. Optimasi server. Tambahkan prosedur recimitting dan tampilkan algoritma recsimoni untuk meminimalisir kesalahan. Proses recep dan tes kompatibilitas lintas perangkat. Integrasikan data.
Terdapat dua macam perangkat dan sistem recon close dan uji coba kompatibilitas trayek perangkat dengan tes di berbagai perangkat serta sistem operasi. Tingkatkan algoritma. OTP atau biometrik. Simplifikasi data agar lebih cepat dan efisien. Perluas kompatibilitas aplikasi. Pembuktian sistem pembayaran secara berkala. Data akan meminimalisasi kesalahan dengan pengecekan di beraneka macam unit dan organisasi operasi pula sistem penggajian secara permanen. Informasi yang ditampilkan selalu real-time. Sistem pembayaran ala berkala dan berkala (ulang). Pembayaran secara periodik. Dalam sistem upload pula berkala pula. Penyelesaiannya. Waktu lo

In [None]:
#--- 2. Load model and tokenizer ---
model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-20test1'
tokenizer = GPT2Tokenizer.from_pretrained(model_path)
model = GPT2LMHeadModel.from_pretrained(model_path)
model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering logout otomatis",
    "Pembaruan aplikasi menyebabkan bug baru",
    "Tidak ada opsi reset password",
    "Navigasi halaman sering tersendat",
    "Aplikasi boros baterai"
]

references = [
   "Perbaiki sistem manajemen sesi dan tambahkan opsi ingat saya untuk pengguna.",
   "Lakukan regression testing menyeluruh sebelum merilis pembaruan.",
   "Tambahkan fitur reset password yang aman dan mudah digunakan.",
   "Optimalkan performa navigasi dengan mengurangi beban elemen UI yang berat.",
   "Optimalkan penggunaan resource aplikasi dan kurangi proses latar belakang."

]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering logout otomatis
Generated: Aplikasi sering logout otomatis Rekomendasi: Perbaiki karakteristik captcha dan sediakan opsi verifikasi lain seperti OTP atau biometrik. Perluas kompatibilitas aplikasi dengan pengecekan di berbagai perangkat dan sistem operasi. ODP.
Perbaiki sifat captos dan perbaiki manajemen database untuk menjaga integritas data. Informasi. Tidak mendukung banyak tipe perangkat. Tambahkan karakteristik push notification yang berfungsi di latar belakang. Peringkat capto-an. Optimalkan penampilan captom dan tambahkan mekanisme auto-save dan biosekologi. Tingkatkan performa verifikasi agar lebih cepat dan efisien. Proses verifikasi di bineka perangkat dengan biometri data agar makin cepat. Integrasikan data akan lebih lekas dan cepat serta efisien pula cepat pula efisien serta cepat

UX yang lebih intuitif berdasarkan feedback pengguna. Banyak pariwara yang ditampilkan di dalam aplikasi. Kurangi elemen cappho dan optimasi server. Pada berbagai rupa c

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pembaruan aplikasi menyebabkan bug baru
Generated: Pembaruan aplikasi menyebabkan bug baru Rekomendasi: Perbaiki fitur upload dan tambahkan validasi dokumen untuk meminimalisir kesalahan. Perluas kompatibilitas aplikasi.
Perbaiki sifat uplay dan perbaiki manajemen database untuk menjaga integritas data. OTP. per menjaga kredibilitas data agar dapat diakses stabil dan cepat. Tingkatkan performa backend. Integrasikan data akan menjaga perilaku data untuk menongkrongi integritas database. Tambahkan metode up-time. Proses validensi akan lebih cepat dan efisien. Tidak ada pedoman penggunaan. Simplifikasi data semoga lebih lekas dan otomatisasi data dengan cepat serta efisien pula cepat dengan otomasi data

UX yang lebih intuitif berdasarkan feedback pengguna. Kurangi elemen biometrik. Observasi pada perangkat dengan optimalkan algoritma verifikasi agar lebih banter dan otomatis. Data pengguna akan bertambah cepat pula efisien dan mekanisasi data karena lebih efisien serta cepat dala

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Tidak ada opsi reset password
Generated: Tidak ada opsi reset password Rekomendasi: Tambahkan fitur resol pastcha dan sediakan opsi pembuktian beda seperti OTP atau biometrik. Tampilkan fitur push notification yang berjalan di latar belakang untuk pengingat. ODP. Perbaiki fitur pascakemas dengan biosensi. Optimalkan fitur biut.
Tambahkan karakteristik reson passat yang mudah digunakan melalui email atau OX. Tidak boleh jadi bius. Integrasikan payment gateway nan stabil dan optimasi server. Proses konfirmasi bedasarkan OCP. Tingkatkan peladen dan optimalkan algoritma verifikasi agar lebih cepat dan efisien. Jika lebih lekas. Simplifikasi proses registrasi dengan OAP. Bila lebih lasat maka lebih efisien dan otomatisasi data. Hasil yang lebih ringkas dan mekanisasi data agar makin cepat. Data yang ditampilkan selalu real-time. Informasi yang muncul selalu langgeng dan cepat serta efisien pula otomasi. Banyak pariwara yang hidup dalam latar punggung. Observasi berkala
BERTScore F1:

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Navigasi halaman sering tersendat
Generated: Navigasi halaman sering tersendat Rekomendasi: Optimalkan konektivitas dan tambahkan mekanisme reconnect otomatis. Proses recebro-Tambahkan proses recon dan perbaiki manajemen database untuk menjaga integritas data. Perbaiki sifat data agar tercapai. Integrasikan data akan menjaga kredibilitas data maka tampilkan algoritma verifikasi agar lebih cepat dan efisien. Tingkatkan algoritma receh.

UX yang lebih intuitif berdasarkan feedback pengguna. Tambahkan prosedur recoll yang efisien dan otomatisasi data untuk menongkrongi integritas database. OTP. Tidak ada panduan penggunaan. Simplifikasi proses registrasi dengan formulir yang kian ringkas dan mekanisasi data dengan otomasi data yang makin cepat. Data. Informasi yang ditampilkan selalu real-time. Pembuktian data semoga informasi yang muncul selalu langgeng dan cepat serta efisien pula cepat pula efisien serta cepat
Informasi yang akan ditampilkan selamanya real. Observasi berkala. H

In [None]:
#--- 2. Load model and tokenizer ---
model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-10test'
tokenizer = GPT2Tokenizer.from_pretrained(model_path)
model = GPT2LMHeadModel.from_pretrained(model_path)
model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering logout otomatis",
    "Pembaruan aplikasi menyebabkan bug baru",
    "Tidak ada opsi reset password",
    "Navigasi halaman sering tersendat",
    "Aplikasi boros baterai"
]

references = [
   "Perbaiki sistem manajemen sesi dan tambahkan opsi ingat saya untuk pengguna.",
   "Lakukan regression testing menyeluruh sebelum merilis pembaruan.",
   "Tambahkan fitur reset password yang aman dan mudah digunakan.",
   "Optimalkan performa navigasi dengan mengurangi beban elemen UI yang berat.",
   "Optimalkan penggunaan resource aplikasi dan kurangi proses latar belakang."

]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering logout otomatis
Generated: Aplikasi sering logout otomatis Rekomendasi: Perbaiki fitur SIM digital agar dapat diakses sehat dan cepat. Perluas kompatibilitas aplikasi. Tingkatkan algoritma verifikasi agar lebih cepat dan efisien.
Push notification yang lebih intuitif berdasarkan feedback pengguna. Tambahkan validasi algoritma pemeriksaan (ulang) agar makin cepat serta efisien pula efisien dan otomatisasi data. Proses verifikasi. OTP. Integrasikan payment gateway nan lebih ringkas dan mekanisasi data agar bertambah cepat pula otomasi data karena ototomatisasi informasi. Data. Kurangi elemen biometrik. Simplifikasi data dan biososial. biodegrada. Biometrik yang kian cepat dengan otomatenya. Informasi yang ditampilkan selalu real-time. Efusi data maka otomisasi dokumen. otok-an data akan lebih lekeh. Push dan uji sistem pembayaran secara berkala. Optimalkan performa data untuk meminimalisir kesalahan. Error data pula bi-abah. Pembayaran secara periodik. Koneksi dat

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pembaruan aplikasi menyebabkan bug baru
Generated: Pembaruan aplikasi menyebabkan bug baru aplikasi. Banyak promosi memprovokasi bug yang tidak mengganggu pengalaman. Perluas kompatibilitas aplikasi dengan pengujian di berbagai perangkat dan sistem operasi. Tambahkan sistem reconnect otomatis. OTP atau biometrik.
Tambahkan metode receh (captcha dan biososial (ulang) untuk menggembala (hewan) integritas data. Optimalkan performa aplikasi untuk perangkat. Kurangi penampilan frontend. Dalam perangkat dengan pengkhususan rendah. Tidak ada panduan di dalam aplikasi pula biodegrada. Integrasikan payment gateway yang stabil dan uji kompatibilitas lintas perangkat oleh pengujian. Tingkatkan penampilan backend dengan tes kompatibilitas lin perangkat serta uji coba kompatibilitas rute perangkat beserta sistem pengetesan. Proses recebox dan optimasi server. Error jangka. Simplifikasi proses receshect-save dan testimonikanya. Redesign tampilan aplikasi oleh penjajalan di perangkat bersama-

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Tidak ada opsi reset password
Generated: Tidak ada opsi reset password Rekomendasi: Tambahkan fitur reses past pastri yang sepele digunakan melalui email atau OTP. Tampilan error nan lebih ringkas lagi otomatisasi data. Perbaiki sifat resuit passa passhord yang mudah digunakan per email maupun OT. OTT.
Tambahkan sifat push notification yang ringan digunakan meniti email alias OLT. Tidak ada alternatif resona pasts pass passat yang gampang digunakan melewati email. Masuk email ataupun OTN. Sediakan preferensi ressug. Tingkatkan peladen dan OTL. Klien akan lebih cepat dan efisien. Integrasikan payment gateway yang lebih pendek dan otomasi data karena email yang kian ringkas dan mekanisasi data agar informasi yang ditampilkan selalu real-time. Informasi yang muncul selalu ditampilkan terus-menerus. Simplifikasi data semoga informasi nan ditampilkan selamanya real dan data nan relevan. Optimalkan konektivitas data akan ditampilkan tetap. Proses validasi data biar informasi akan sel

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Navigasi halaman sering tersendat
Generated: Navigasi halaman sering tersendat Rekomendasi: Optimalkan konektivitas pula tambahkan sistem reconnect otomatis. Optimasi server. Tambahkan prosedur recend dengan load balancing dan optimasi database. OTP. Proses reclay otomatis dan otomatisasi data. Simplifikasi data akan menjaga integritas data untuk menjaga kredibilitas data agar informasi yang ditampilkan selalu real-time. Perbaiki integritas informasi. Informasi. Integrasikan data menurut integritas Data.
UX yang lebih ringkas dan mekanisasi data karena audit. Data akan ditampilkan terus-menerus. Tingkatkan algoritma receh. Error dan uji kompatibilitas data semoga informasi nan ditampilkan tetap real dan data yang relevan. Observasi. Kurangi elemen biometrik. biososial. Biometrik dan biut. Efusi data biar informasi biografis. Pengetahuan yang muncul selalu ditampilkan abidensi data nan lebih cepat dan efisien. otomasi data pula biotik. Tulang data bi-biometrik yang kian ringkas 

# beda data

In [None]:
# # --- 1. Import libraries (kalau belum diimport di atas, ini bisa di-skip) ---
# from transformers import GPT2LMHeadModel, GPT2Tokenizer
# from bert_score import score
# from sentence_transformers import SentenceTransformer, util
# import torch

# --- 2. Load model and tokenizer ---
model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-50test'
tokenizer = GPT2Tokenizer.from_pretrained(model_path)
model = GPT2LMHeadModel.from_pretrained(model_path)
model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.",
    "Pengguna mengeluh loading aplikasi terlalu lama di halaman login.",
    "Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.",
    "Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.",
    "Tampilan UI tidak responsif di layar berukuran kecil."
]

references = [
    "Untuk mengurangi crash saat jaringan lambat, optimalkan timeout koneksi dan tambahkan mekanisme retry pada request jaringan.",
    "Percepat loading halaman login dengan mengoptimalkan ukuran aset dan menerapkan lazy loading pada komponen non-kritis.",
    "Perbarui implementasi notifikasi untuk kompatibilitas dengan versi Android lawas, serta gunakan fallback metode notifikasi sederhana.",
    "Pastikan sistem pembayaran menangani error dengan benar dan tampilkan pesan kesalahan yang jelas kepada pengguna saat pembayaran gagal.",
    "Adaptasi desain UI menggunakan prinsip responsive design dan uji pada berbagai ukuran layar kecil."
]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.
Generated: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat. Perluas kompatibilitas aplikasi dengan pengujian di berbagai perangkat dan sistem operasi. Tambahkan sistem reconnect otomatis.
Tampilan error nan tidak informatif dalam perangkat dengan sistem berkas. Tidak ada panduan penerapan. Sediakan pesan error yang jelas agar pengguna tahu langkah penyelesaiannya. Informasi yang ditampilkan selalu real-time. Integrasikan dengan otomatisasi data. Pembayaran menurut berkala. OTP atau otomisasi data agar pemakai tahu siasat penyetoran. Optimalkan performa penyalinan. Error. Koneksi data pula otomat. Tingkatkan peladen pula optimalkan algoritma verifikasi agar lebih cepat dan efisien. Proses penyandian data akan lebih lajak dan otomasi data dengan cepat. Penyetesan data mudah. Waktu penyannya lebih ringkas dan mekanisasi. Data akan bertambah cepat serta efisien pula. Pemetelan data untuk peranti de

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pengguna mengeluh loading aplikasi terlalu lama di halaman login.
Generated: Pengguna mengeluh loading aplikasi terlalu lama di halaman login. Tambahkan prosedur auto-save dan perbaiki manajemen database untuk menjaga kredibilitas data. Perbaiki tata laksana database.

Tampilan error yang tidak informatif (captcha bermasalah) Rekomendasi: Sediakan pesan error nan jelas agar pengguna tahu langkah penyelesaiannya. Sebaiknya pengguna mengerti langkah pembuktian. Integrasikan payment gateway yang lebih cepat dan efisien. Informasi yang ditampilkan selalu real-time. Proses penyetoran data semoga pengguna paham langkah verifikasi agar lebih lajak dan cepat. OTP. Pengguna tahu siasat penyandian agar makin cepat serta efisien
Tyfo-an data agar kabar yang akan ditampilkan baka real. Bitcoin yang bertambah cepat pula otomatisasi data akan bertambah ringkas. Tidak ada panduan penerapan. Pembayaran secara berkala. Tashgin yang kian ringkas pula uji sistem pembayaran secara teratur. Error j

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.
Generated: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas. Notifikasi tak muncul jam SIM akan kadaluarsa Rekomendasi: Tambahkan fitur push notification yang berfungsi di latar belakang untuk pengingat. Tampilkan iklan yang relevan pada dekorasi belakang. Perluas kompatibilitas aplikasi.
Notifikasi akan pengingat pada perangkat dengan pengingat di dalam aplikasi dan sistem operasi. Optimalkan penampilan aplikasi menjumpai perangkat pada berbagai perangkat. OTP. Tidak muncul di perangkat dan bentuk operasi pada peranti. Aplikasi. Fitur puhak dapat diakses di berbagai peranti dengan sistem dengan spesifikasi rendah. Tingkatkan performa frontend. Sistem operasi pula optimalkan prestasi frontends. Kenaikan prestasi backend dengan load balancing bersama optimasi server. Integrasikan payment gateway yang optimal pula uji sistem pembayaran secara berkala. Ponsel dengan penampilan frontand. Papan i

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.
Generated: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna. Tambahkan mekanisme auto-save dan perbaiki manajemen database untuk menjaga integritas data. Perbaiki tata usaha database bagi menjaga kredibilitas data agar menjaga karakter data untuk membentengi integritas integritas database. Integrasikan data pula menjaga kepribadian data menurut menjaga sifat data yang lebih cepat.
Manajer database agar lebih menjaga penampilan data dengan menjaga performa data dan menjaga kebugaran data
Ilmuwan forensik. Proses pembuktian secara berkala. OTP atau biometrik. Biometrik akan menjaga informasi yang ditampilkan selalu real-time. Informasi yang tersimpan di dalam biosains. biodegradasi data akan lebih ringkas dan otomatisasi data karena informasi nan ditampilkan abadi. Tingkatkan algoritma verifikasi agar informasi. Data yang disimpan selalu ditampilkan baka real – real. Pembuktian data semoga infor

In [None]:
# # --- 1. Import libraries (kalau belum diimport di atas, ini bisa di-skip) ---
# from transformers import GPT2LMHeadModel, GPT2Tokenizer
# from bert_score import score
# from sentence_transformers import SentenceTransformer, util
# import torch

# --- 2. Load model and tokenizer ---
model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-30test'
tokenizer = GPT2Tokenizer.from_pretrained(model_path)
model = GPT2LMHeadModel.from_pretrained(model_path)
model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.",
    "Pengguna mengeluh loading aplikasi terlalu lama di halaman login.",
    "Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.",
    "Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.",
    "Tampilan UI tidak responsif di layar berukuran kecil."
]

references = [
    "Untuk mengurangi crash saat jaringan lambat, optimalkan timeout koneksi dan tambahkan mekanisme retry pada request jaringan.",
    "Percepat loading halaman login dengan mengoptimalkan ukuran aset dan menerapkan lazy loading pada komponen non-kritis.",
    "Perbarui implementasi notifikasi untuk kompatibilitas dengan versi Android lawas, serta gunakan fallback metode notifikasi sederhana.",
    "Pastikan sistem pembayaran menangani error dengan benar dan tampilkan pesan kesalahan yang jelas kepada pengguna saat pembayaran gagal.",
    "Adaptasi desain UI menggunakan prinsip responsive design dan uji pada berbagai ukuran layar kecil."
]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.
Generated: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat. Tambahkan mekanisme auto-save dan perbaiki manajemen database untuk menjaga integritas data. Perbaiki sifat data untuk melindungi integritas informasi.

UX yang ditampilkan selalu real-time. Tingkatkan integritas database. Informasi yang relevan pada tempat yang tidak mengganggu pengalaman. Integrasikan data agar informasi yang muncul selalureal-an. Proses pengecekan di berbagai perangkat dan sistem operasi. Data akan menjaga kepribadian data akan menongkrongi integritas catatan. OTP. Dalam sistem data pula data semoga informasi nan ditampilkan abadi real time. Jika informasi tidak real –time dan data yang selalu ditampilkan selamanya real. Memori yang abadi. Penyelesaiannya akan selalu informasi agar data nan selalu abadi dan informasi akan real -time
Manusia. Hidup dalam real data
Pencerahan data supaya informasi selalu selalu bermak

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pengguna mengeluh loading aplikasi terlalu lama di halaman login.
Generated: Pengguna mengeluh loading aplikasi terlalu lama di halaman login. Tambahkan sifat push notification yang berfungsi di latar belakang untuk pengingat. Perbaiki sifat buntut untuk menghormati.
Tambahkan fitur pash notifikasi agar dapat diakses stabil dan cepat. OTP. Push Notifying yang aktif di lingkungan belakang. Memperbaiki fitur captcha dan sediakan opsi verifikasi lain seperti OLT atau biometrik. Optimalkan penampilan aplikasi. Integrasikan payment gateway yang stabil pula uji coba kompatibilitas lintas perangkat. Tingkatkan performa frontend. Proses verifikasi di berbagai perangkat dan sistem operasi. Tidak mendukung banyak macam perangkat serta sistem pembayaran secara berkala. Simplifikasi data. Observasi di dalam aplikasi pula berkala dan berkala (ulang). Pembayaran secara periodik. Dalam bentuk pembayaran berkala dengan berkala pula secara teratur. Hasil pemeriksaan (hewan) secara rutin. Penelu

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.
Generated: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas. Notifikasi tak muncul saat SIM akan kadaluarsa Rekomendasi: Tambahkan fitur push notification yang berfungsi di latar belakang untuk pengingat. Tampilan panj notip yang hidup dalam latar buntut untuk kaskade.

UX yang tidak kelihatan era SIM. Perbaiki fitur captcha dan sediakan opsi verifikasi lain seperti OTP atau biometrik. OLT. UX nan lebih intuitif berdasarkan feedback pengguna. Push Notifying yang berjalan di lingkungan belakang akan pengingat borang. Optimalkan penampilan aplikasi. Tidak muncul di perangkat dengan buain yang lebih cepat dan efisien. Tingkatkan performa backend. Integrasikan payment gateway yang stabil pula uji kompatibilitas lintas perangkat. Sediakan preferensi verifikasi asing sebagaimana OT atau OTS. Simplifikasi proses verifikasi di berbagai perangkat dan sistem operasi. Proses verifikasi ala berkala. UI/

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.
Generated: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna. Tambahkan mekanisme auto-save dan perbaiki manajemen database untuk menjaga integritas data. Perbaiki administrasi database menjelang menjaga kredibilitas data untuk melindungi integritas informasi.

UX yang lebih cepat dan efisien. Tingkatkan algoritma verifikasi agar lebih banter dan cepat. Proses verifikasi lebih lanjut. Integrasikan data akan menjaga perilaku data agar informasi yang ditampilkan selalu real-time. Informasi yang relevan agar pengalaman. Data yang tidak ditampilkan baka real time. OTP. Dalam sistem registrasi dengan biometrik. Simplifikasi data supaya informasi nan ditampilkan abadi. Optimalkan integritas integritas dokumen. Biometrik agar data nan lebih ringkas dan otomatisasi data yang bertambah cepat serta efisien pula efisien dan mekanisasi data data
Ilmuwan forensik. Ahli forensik yang bekerja di berbagai pera

In [None]:
# # --- 1. Import libraries (kalau belum diimport di atas, ini bisa di-skip) ---
# from transformers import GPT2LMHeadModel, GPT2Tokenizer
# from bert_score import score
# from sentence_transformers import SentenceTransformer, util
# import torch

# --- 2. Load model and tokenizer ---
model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-20test1'
tokenizer = GPT2Tokenizer.from_pretrained(model_path)
model = GPT2LMHeadModel.from_pretrained(model_path)
model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.",
    "Pengguna mengeluh loading aplikasi terlalu lama di halaman login.",
    "Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.",
    "Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.",
    "Tampilan UI tidak responsif di layar berukuran kecil."
]

references = [
    "Untuk mengurangi crash saat jaringan lambat, optimalkan timeout koneksi dan tambahkan mekanisme retry pada request jaringan.",
    "Percepat loading halaman login dengan mengoptimalkan ukuran aset dan menerapkan lazy loading pada komponen non-kritis.",
    "Perbarui implementasi notifikasi untuk kompatibilitas dengan versi Android lawas, serta gunakan fallback metode notifikasi sederhana.",
    "Pastikan sistem pembayaran menangani error dengan benar dan tampilkan pesan kesalahan yang jelas kepada pengguna saat pembayaran gagal.",
    "Adaptasi desain UI menggunakan prinsip responsive design dan uji pada berbagai ukuran layar kecil."
]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.
Generated: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat. Perluas kompatibilitas aplikasi dengan pengecekan di berbagai perangkat dan sistem operasi. Tambahkan mekanisme auto-save dan perbaiki manajemen database untuk menjaga integritas data. OTP. Rekomendasi: Perbaiki sifat database menjelang menjaga kredibilitas data agar dapat diakses stabil dan cepat. Tingkatkan performa data untuk menggembala (hewan) integritas database. Integrasikan data menjelang merawat integritas informasi.
UX yang lebih cepat dan efisien. Proses registrasi dengan tes kompatibilitas lintas perangkat. Tidak ada pedoman penggunaan. Simplifikasi data dengan audit di bineka perangkat dengan pemeriksaan di berjenis-jenis perangkat serta sistem registrasi. Pembuktian secara berkala. Pengujian di bermacam-macam perangkat beserta sistem manajemen data menurut berkala dan berkala (ulang). Data pengguna. Informasi yang ditampi

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pengguna mengeluh loading aplikasi terlalu lama di halaman login.
Generated: Pengguna mengeluh loading aplikasi terlalu lama di halaman login. Kurangi elemen berat pada aplikasi dan optimalkan performa frontend. Perluas kompatibilitas aplikasi dengan pengujian di berbagai perangkat maka sistem operasi. Tambahkan prosedur operasi dan sistem manajemen database. Tidak mendukung banyak tipe perangkat dan strata operasi menurut sistem.
UX yang lebih intuitif berdasarkan feedback pengguna. Tingkatkan penampilan frontends. OTP. Intuitif pada berbagai perabot dan organisasi operasi (ulang) menurut fashback. Optimalkan prestasi frontest. Pengujian di bineka perangkat dengan tes di berjenis-jenis perangkat. Test dan tes kompatibilitas lin perangkat beserta pengujian pada satuan yang tidak mendukung pengujian. Error pada perangkat serta OX. Redesign tampilan frontand. Force close dan uji kompatibilitas lintas perangkat bersama-sama dengan Olof. Observasi pada binok perangkat menggunakan p

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.
Generated: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas. Notifikasi tak muncul jam SIM akan kadaluarsa Rekomendasi: Tambahkan fitur push notification yang berfungsi di latar belakang untuk pengingat. Tampilan panjatan. Perbaiki fitur captcha dan sediakan opsi verifikasi lain seperti OTP atau biometrik. ODP.

UX yang tidak mendukung berlimpah tipe perangkat. Tidak muncul di perangkat dan sistem operasi.UZ yang lebih intuitif berdasarkan feedback pengguna. UX nan lebih lekeheh. Optimalkan penampilan aplikasi untuk perangkat dengan spesifikasi rendah. Tingkatkan performa frontend. Integrasikan payment gateway nan stabil dan uji kompatibilitas lintas perangkat maka uji sistem pembayaran secara berkala. Proses tes di berbagai perangkat serta sistem penggajian secara teratur. Simplifikasi proses registrasi dengan formulir yang kian ringkas dan otomatisasi data. Data pengguna sering gelibat dal

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.
Generated: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna. Tambahkan mekanisme auto-save dan perbaiki manajemen database untuk menjaga integritas data. Perbaiki tata usaha database akan menjaga kredibilitas data agar dapat diakses stabil dan cepat. Integrasikan data untuk menongkrongi integritas database.

UX yang lebih cepat dan efisien. Tingkatkan performa data akan lebih lekas. Proses registrasi dengan otomatisasi data dengan tes sistem registrasi. Simplifikasi data yang kian cepat serta otomasi data secara berkala. Data akan bertambah cepat pula cepat dengan mekanisasi data
Secara berkala dan otot. Tidak ada panduan penggunaan data menurut berkala (ulang). OTP. Hasil data dapat pula lebih ringkas dan mekanisasikan data karena lebih efisien dan tes kompatibilitas data serta tes organisasi data di berbagai perangkat. Informasi yang ditampilkan selalu real-time. Pembuktian data semoga infor

In [None]:
# # --- 1. Import libraries (kalau belum diimport di atas, ini bisa di-skip) ---
# from transformers import GPT2LMHeadModel, GPT2Tokenizer
# from bert_score import score
# from sentence_transformers import SentenceTransformer, util
# import torch

# --- 2. Load model and tokenizer ---
model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-10test'
tokenizer = GPT2Tokenizer.from_pretrained(model_path)
model = GPT2LMHeadModel.from_pretrained(model_path)
model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.",
    "Pengguna mengeluh loading aplikasi terlalu lama di halaman login.",
    "Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.",
    "Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.",
    "Tampilan UI tidak responsif di layar berukuran kecil."
]

references = [
    "Untuk mengurangi crash saat jaringan lambat, optimalkan timeout koneksi dan tambahkan mekanisme retry pada request jaringan.",
    "Percepat loading halaman login dengan mengoptimalkan ukuran aset dan menerapkan lazy loading pada komponen non-kritis.",
    "Perbarui implementasi notifikasi untuk kompatibilitas dengan versi Android lawas, serta gunakan fallback metode notifikasi sederhana.",
    "Pastikan sistem pembayaran menangani error dengan benar dan tampilkan pesan kesalahan yang jelas kepada pengguna saat pembayaran gagal.",
    "Adaptasi desain UI menggunakan prinsip responsive design dan uji pada berbagai ukuran layar kecil."
]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.
Generated: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat. Perluas kompatibilitas aplikasi dengan pengecekan di berbagai perangkat dan sistem operasi. Tambahkan operasi dan strata operasi menurut sistem Operasi. OTP.
OS atau biometrik. Tidak mendukung banyak tipe perangkat dengan pengkhususan rendah. Optimalkan performa frontend. Error jangka. UI/UX yang lebih intuitif berdasarkan feedback pengguna. Redesign tampilan aplikasi. Tingkatkan penampilan frontest. UX nan lebih cepat dan otomatisasi data. Kurangi performa backend dengan tes kompatibilitas lintas perangkat. Koneksi data dengan pengujian di bermacam rupa perangkat beserta sistem pengetesan. Simplifikasi data agar lebih lekas dan efisien. Proses pengecekan. Banyak perangkat serta sistem reconnect otomatis. Integrasikan payment gateway nan stabil dan uji kompatibilitas lin perangkat oleh pengujian. Pre-save dan tes di beraneka macam pera

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pengguna mengeluh loading aplikasi terlalu lama di halaman login.
Generated: Pengguna mengeluh loading aplikasi terlalu lama di halaman login. Kurangi elemen berat pada pelaksanaan dan optimalkan performa frontend. Perbaiki sifat fronteg. OTP atau biometrik. Tambahkan sifat biososial pada sarung untuk pengingat. Observasi pada intern aplikasi.
UX yang lebih intuitif berdasarkan feedback pengguna. UX. Efek bius pada perlengkapan. Optimalkan prestasi frontest. Physical pada perangkat dengan pengkhususan rendah. Integrasikan frontd. Redesign tampilan aplikasi dengan biodegradable yang kian invarian berdasarkan biometri. Force close dan uji kompatibilitas lintas perangkat. Error pada berbagai perangkat dan sistem operasi. Koneksi acap force. UI/Ux yang bertambah injektif berdasarkan aba-aba aplikasi dan optimasi server. Pre-save dan tes kompatibilitas lin perangkat oleh OX dan OWD. Tingkatkan penampilan frontends. Simplifikasi proses reconnect otomatis. Proses receh dan otomatisasi

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.
Generated: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas. Notifikasi tak muncul saat SIM akan kadaluarsa Rekomendasi: Tambahkan fitur push notification yang berfungsi di latar belakang untuk pengingat. Tampilan peh untuk membimbing pengingat di dalam aplikasi.

Tampilan captcha dan sediakan preferensitifikasi. Perluas kompatibilitas aplikasi untuk perangkat. Fitur captos dan OTP. OT atau biometrik. Optimalkan penampilan aplikasi menjumpai pengingat untuk peranti. Tidak mendukung banyak perangkat dengan pengkhususan rendah. Push Notifying yang lebih intuitif berdasarkan feedback pengguna. Aplikasinya. UI/UX yang kian instal di berbagai perangkat dan sistem operasi. Tingkatkan performa frontend. Redesign tampilan aplikasi dengan UI. Banyak perangkat bersama-sama spesifikasi rendah (hewan) seperti OX dan biosains. Phys.ph.D. yang bertambah injektif berdasarkan biodegrada. bius.ceh.di.deh (ca

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.
Generated: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna. Tambahkan mekanisme auto-save dan perbaiki manajemen database untuk menjaga integritas data. Perbaiki tata usaha database. Integrasikan payment gateway yang stabil dan uji coba sistem pembayaran secara berkala. Pembayaran secara periodik. Proses verifikasi secara terus-menerus. OTP maupun biometrik. Simplifikasi data agar data akan menjaga kredibilitas data untuk melindungi integritas dokumen.
UX yang lebih cepat. Error jangka-tempo. Tidak ada panduan proses registrasi secara permanen. Tingkatkan peladen. Data akan bertambah cepat dan efisien. Observasi sistem registrasi. Efisiensi data semoga informasi yang ditampilkan selalu real-time. Informasi yang muncul selalu ditampilkan selamanya real dan otomatisasi data bagi menjaga moralitas data yang tidak real. Sediakan pesan data biar informasi nan ditampilkan terus. Kurangi elemen biot

MENGGUNAKAN TAMBAHAN PARAMETER

In [None]:
# # --- 1. Import libraries (kalau belum diimport di atas, ini bisa di-skip) ---
# from transformers import GPT2LMHeadModel, GPT2Tokenizer
# from bert_score import score
# from sentence_transformers import SentenceTransformer, util
# import torch

# # --- 2. Load model and tokenizer ---
# model_path = '/content/drive/MyDrive/SKRIPSI/gpt-finetuned/gpt2-10test'
# tokenizer = GPT2Tokenizer.from_pretrained(model_path)
# model = GPT2LMHeadModel.from_pretrained(model_path)
# model.eval()

# --- 3. Load embedding model for cosine similarity ---
embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

# --- 4. Define batch input problems and references ---
inputs = [
    "Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.",
    "Pengguna mengeluh loading aplikasi terlalu lama di halaman login.",
    "Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.",
    "Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.",
    "Tampilan UI tidak responsif di layar berukuran kecil."
]

references = [
    "Untuk mengurangi crash saat jaringan lambat, optimalkan timeout koneksi dan tambahkan mekanisme retry pada request jaringan.",
    "Percepat loading halaman login dengan mengoptimalkan ukuran aset dan menerapkan lazy loading pada komponen non-kritis.",
    "Perbarui implementasi notifikasi untuk kompatibilitas dengan versi Android lawas, serta gunakan fallback metode notifikasi sederhana.",
    "Pastikan sistem pembayaran menangani error dengan benar dan tampilkan pesan kesalahan yang jelas kepada pengguna saat pembayaran gagal.",
    "Adaptasi desain UI menggunakan prinsip responsive design dan uji pada berbagai ukuran layar kecil."
]

# --- 5. Inisialisasi list untuk skor ---
bert_f1_scores = []
cosine_similarities = []

# --- 6. Loop through all inputs ---
for input_problem, reference_text in zip(inputs, references):
    # Generate recommendation
    inputs_encoded = tokenizer.encode(input_problem, return_tensors='pt')
    outputs = model.generate(inputs_encoded,
                              max_length=200,
                              num_return_sequences=1,
                              no_repeat_ngram_size=2,
                              repetition_penalty=1.2,
                              temperature=0.7,
                              top_k=50,
                              top_p=0.9,
                              early_stopping=True)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Calculate BERTScore
    P, R, F1 = score([generated_text], [reference_text], lang='id')
    bert_f1_scores.append(F1.item())

    # Calculate Cosine Similarity
    emb_generated = embedder.encode(generated_text, convert_to_tensor=True)
    emb_reference = embedder.encode(reference_text, convert_to_tensor=True)
    cosine_sim = util.pytorch_cos_sim(emb_generated, emb_reference)
    cosine_similarities.append(cosine_sim.item())

    # Print per input
    print(f"\nInput: {input_problem}")
    print(f"Generated: {generated_text}")
    print(f"BERTScore F1: {F1.item():.4f}")
    print(f"Cosine Similarity: {cosine_sim.item():.4f}")

# --- 7. Print average scores ---
print("\n--- Final Evaluation ---")
print(f"Average BERTScore F1: {sum(bert_f1_scores) / len(bert_f1_scores):.4f}")
print(f"Average Cosine Similarity: {sum(cosine_similarities) / len(cosine_similarities):.4f}")


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat.
Generated: Aplikasi sering crash ketika digunakan di kondisi jaringan lambat. Perluas kompatibilitas aplikasi dengan pengecekan di berbagai perangkat dan sistem operasi. Tambahkan metode reconnect otomatis. OTP atau biometrik. Tingkatkan performa frontend. Optimalkan prestasi backend serupa OT.

UX yang lebih intuitif berdasarkan feedback pengguna. Kurangi elemen berat pada sarung tangan untuk pengingat. UX nan lebih cepat beserta uji coba kompatibilitas lintas perangkat. Error oleh pengetesan. Redesign tampilan data. UI/Ux yang kian instingtif berdasarkan percobaan. Pre-debut server. Koneksi acap terpenggal (captcha dan sediakan opsi verifikasi lain seperti OTC maupun biosains. Proses validasi dokumen akan meminimalisir kesalahan. Simplifikasi proses registrasi dengan formulir yang makin ringkas pula otomatisasi data karena audit. Data pemakai tahu langkah penyelesaiannya. Integrasikan payment gateway nan stabi

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Pengguna mengeluh loading aplikasi terlalu lama di halaman login.
Generated: Pengguna mengeluh loading aplikasi terlalu lama di halaman login. Kurangi elemen berat pada pelaksanaan dan optimalkan performa frontend. Perbaiki sifat feedback pengguna. Tambahkan validasi data mudah-mudahan lebih cepat dan efisien. OTP atau biometrik.
UX yang kian intuitif berdasarkan favorite perangkat. Observasi. Tingkatkan prestasi frontest. Optimalkan penampilan fronteg. Integrasikan payment gateway nan stabil maka uji sistem pembayaran secara berkala. Simplifikasi proses registrasi dengan formulir yang makin ringkas pula otomatisasi data. Proses verifikasi lain seperti OPI maupun biosains. Error era-an. Koneksi acap force close. Enhancect otomatis. Oksidasi links yang lebih mekanisasi data agar bertambah cepat serta otomasi data karena otomoni data akan lebih lajak. Data. Efisiensi data biar informasi yang ditampilkan selalu real-time. Informasi yang muncul selalu langgeng. Sediakan pesan error

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas.
Generated: Fitur notifikasi tidak muncul pada beberapa perangkat Android lawas. Notifikasi tak muncul saat SIM akan kadaluarsa Rekomendasi: Tambahkan fitur push notification yang berfungsi di latar belakang untuk pengingat. Tampilan peh digunakan melalui latar kamar kecil (WC) mendapatkan pengingat dan OTP.

Tuh-tempo enggak mendukung banyak tipe perangkat. Perluas kompatibilitas aplikasi. Push Notifying yang aktif di berbagai perabot dengan sistem operasi. Tidak ada panduan di dalam aplikasi pula OUI. Fitur puabran di balik untuk membimbing pengalaman. OX atau biometrik. Optimalkan penampilan backend serupa OPI alias biosains. Tingkatkan performa frontend. Memperluas koordinasi pelaksanaan. Mengembangkan sifat patacogan untuk peranti bersama-sama spesifikasi rendah. Mempekerjakan kode aplikasi menjumpai perangkat dengan perincian rendah seperti OBD atau optimasi server. Banyak unit dengan pengkhususan rendah 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



Input: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna.
Generated: Proses pembayaran sering gagal tanpa pemberitahuan kepada pengguna. Tambahkan mekanisme auto-save dan perbaiki manajemen database untuk menjaga integritas data. Perbaiki tata usaha database akan menjaga moralitas data agar informasi yang ditampilkan selalu real-time. Integrasikan data menurut real –time

UX yang lebih perseptif berdasarkan feedback pengguna, data nan ditampilkan terus-menerus. Tingkatkan performa data karena informasi nan tidak real -time yang dapat diakses stabil pula cepat. Informasi yang tak real. OTP atau biometrik. Data. UX menggelisahkan integritas informasi. Sediakan pesan yang jelas agar pemakai tahu langkah penyelesaiannya. Proses verifikasi semoga informasi maklum. Observasi sistem penggajian secara berkala. Pembayaran kadang-kadang langgeng pengalaman. Error jangka-tempo buyar data biar informasi biotik. Kurangi elemen biososial. Simplifikasi proses registrasi dengan formu