# Load Libraries

In [1]:
from openai import OpenAI
from dotenv import load_dotenv
import pandas as pd
import time
import os

# Load API and Responses

In [2]:
load_dotenv()
api_key = os.getenv("API_KEY")
client = OpenAI(api_key=api_key)
responses_e24 = []
responses_e25 = []

# Generate 10 ChatGPT Essays from 2024 Guidelines

In [3]:
for i in range(10):
    try:
        response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {
            "role": "system",
            "content": [
                {
                "type": "text",
                "text": " Bayangkan kamu adalah seorang siswa SMA yang sedang mengikuti lomba menulis esai tingkat nasional. Tulis esai secara langsung, dimulai dari judul dan dilanjutkan dengan paragraf-paragraf isi esai. Raw text tanpa bold/italic. Tulis esai sepanjang 20-30 paragraf, masing-masing terdiri dari 3–6 kalimat. Jangan sudahi esai sebelum jumlah paragraf mencukupi.\nTema umum: Keberagaman sebagai Kunci Meraih Kejayaan dalam Masyarakat Multikultural (Tidak perlu menulis tema ini secara tekstual. Tuangkan makna dan gagasan tema secara kreatif dan kontekstual. Gunakan pendekatan unik agar tidak terkesan kaku.)\nKetentuan teknis penulisan:\n* Format tulisan mengikuti: A4, font Times New Roman ukuran 12 pt, spasi 1.5, margin atas 3 cm, bawah 3 cm, kiri 4 cm, kanan 3 cm, rata kanan-kiri (justify)\n* Panjang esai: 3–5 halaman setara Word atau sekitar 22–30 paragraf (idealnya di atas 25 paragraf)\n* Gaya bahasa: Bahasa Indonesia yang baik dan benar (sesuai PUEBI), tapi tetap luwes dan komunikatif seperti siswa SMA\nStruktur penulisan:\n* Judul (dibuat menarik dan mencerminkan gagasan)\n* Isi/Naskah Esai (dengan alur berpikir yang jelas, argumentatif, dan mengalir)\nAspek yang dinilai:\n* Gagasan orisinil, kreatif, aktual;\n* Kesesuaian dengan tema;\n* Penulisan (Kerapihan, Bahasa Indonesia sesuai PUEBI/EYD, kejelasan ungkapan)\n* Argumentasi\n* Alur berpikir penulisnya tertib dan jelas (mudah dirunut).\n* Kemampuan Pengetahuan Bahasa Indonesia\nLangsung tulis esai lengkap, mulai dari judul yang menarik dan sesuai, diikuti oleh paragraf-paragraf isi esai. "
                }
            ]
            }
        ],
        response_format={
            "type": "text"
        },
        temperature=1,
        max_completion_tokens=16384,
        top_p=1,
        frequency_penalty=0,
        presence_penalty=0,
        store=False
        )
        text_response = response.choices[0].message.content

        # Saving the response
        print(f"Essay {i+1} completed")
        responses_e24.append(text_response)
        time.sleep(1)

    except Exception as e:
        print(f"Terjadi kesalahan pada sesi {i+1}: {e}")
        break

os.makedirs("datasets", exist_ok=True)

# Save the responses to a CSV file
df = pd.DataFrame(responses_e24, columns=["Response"])
df.to_csv("datasets/esai_gpt_24.csv", index=False)

print("Jawaban berhasil disimpan dalam file esai_gpt_24.csv")

Essay 1 completed
Essay 2 completed
Essay 3 completed
Essay 4 completed
Essay 5 completed
Essay 6 completed
Essay 7 completed
Essay 8 completed
Essay 9 completed
Essay 10 completed
Jawaban berhasil disimpan dalam file esai_gpt_24.csv


# Generate 10 ChatGPT Essays from 2025 Guidelines

In [4]:
for i in range(10):
    try:
        response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {
            "role": "system",
            "content": [
                {
                "type": "text",
                "text": "Bayangkan kamu adalah seorang siswa SMA yang sedang mengikuti lomba menulis esai tingkat nasional. Tulis esai secara langsung, dimulai dari judul dan dilanjutkan dengan paragraf-paragraf isi esai. Tulis esai sepanjang 20-30 paragraf, masing-masing terdiri dari 3–6 kalimat. Jangan sudahi esai sebelum jumlah paragraf mencukupi.\nTema umum: “Hidup Adalah untuk Mengolah Hidup” (Tidak perlu menulis tema ini secara tekstual. Tuangkan makna dan gagasan tema secara kreatif dan kontekstual. Gunakan pendekatan unik agar tidak terkesan kaku.)\nKetentuan teknis penulisan:\n* Format tulisan mengikuti: A4, font Times New Roman ukuran 12 pt, spasi 1.5, margin atas 3 cm, bawah 3 cm, kiri 4 cm, kanan 3 cm, rata kanan-kiri (justify)\n* Panjang esai: 3–5 halaman setara Word.\n* Gaya bahasa: Bahasa Indonesia yang baik dan benar (sesuai PUEBI), tapi tetap luwes dan komunikatif seperti siswa SMA\nStruktur penulisan:\n* Judul (dibuat menarik dan mencerminkan gagasan)\n* Isi/Naskah Esai (dengan alur berpikir yang jelas, argumentatif, dan mengalir)\nAspek yang dinilai:\n* Gagasan orisinil, kreatif, aktual.\n* Kesesuaian dengan tema.\n* Kebahasaan (tata bahasa).\n* Kejelasan dan ketepatan argumen.\n* Organisasi dan koherensi teks.\n* Dampak dan keterlibatan pembaca\n* Kemampuan Pengetahuan Bahasa Indonesia.\nLangsung tulis esai lengkap, mulai dari judul yang menarik dan sesuai, diikuti oleh paragraf-paragraf isi esai.\n\nCatatan:\nTema diambil dari larik puisi WS Rendra berjudul Sajak Seorang Tua untuk Istrinya. Tidak perlu menuliskan asal tema atau penyairnya dalam esai. Raw text tanpa bold/italic. \n"
                }
            ]
            }
        ],
        response_format={
            "type": "text"
        },
        temperature=1,
        max_completion_tokens=16384,
        top_p=1,
        frequency_penalty=0,
        presence_penalty=0,
        store=False
        )
        text_response = response.choices[0].message.content
        
        # Saving the response
        responses_e25.append(text_response)
        print(f"Essay {i+1} completed")
        time.sleep(1)

    except Exception as e:
        print(f"Terjadi kesalahan pada sesi {i+1}: {e}")
        break

os.makedirs("datasets", exist_ok=True)

# Save the responses to a CSV file
df = pd.DataFrame(responses_e25, columns=["Response"])
df.to_csv("datasets/esai_gpt_25.csv", index=False)

print("Jawaban berhasil disimpan dalam file esai_gpt_25.csv")

Essay 1 completed
Essay 2 completed
Essay 3 completed
Essay 4 completed
Essay 5 completed
Essay 6 completed
Essay 7 completed
Essay 8 completed
Essay 9 completed
Essay 10 completed
Jawaban berhasil disimpan dalam file esai_gpt_25.csv


In [5]:
%load_ext watermark
%watermark

Last updated: 2025-05-06T10:25:56.481397+07:00

Python implementation: CPython
Python version       : 3.12.4
IPython version      : 8.25.0

Compiler    : Clang 14.0.6 
OS          : Darwin
Release     : 24.0.0
Machine     : arm64
Processor   : arm
CPU cores   : 8
Architecture: 64bit



In [6]:
gptset_24 = pd.read_csv("datasets/esai_gpt_24.csv")
gptset_25 = pd.read_csv("datasets/esai_gpt_25.csv") 

In [9]:
import re

In [7]:
def preprocess_gpt(text):
    """
    Preprocessing text:
    - Convert text to lowercase
    - Cleaning up excess whitespace
    - Keeps the text as a whole paragraph
    
    Args:
        text (str): input text.
        
    Returns:
        list: a list of processed text segments (title and paragraphs).
    """
    if not isinstance(text, str) or text.strip() == "":
        return None

    # Split the text into paragraphs
    paragraphs = re.split(r'\n\s*\n+', text.strip())
    
    cleaned_text = []
    for para in paragraphs:
        para = para.lower().strip()
        para = re.sub(r'\*\*', '', para)
        para = re.sub(r'\#\#\#', '', para)
        para = re.sub(r'\s+', ' ', para)
        cleaned_text.append(para)

    return cleaned_text


In [10]:
# Combine both GPT datasets
gptset = pd.concat([gptset_24, gptset_25], ignore_index=True)

# Process GPT essays and create new dataframe
processed_responses = []
for text in gptset['Response']:
    cleaned = preprocess_gpt(text)
    if cleaned:
        title = cleaned[0]
        processed_responses.append(title)
        for paragraph in cleaned[1:]:
            processed_responses.append(paragraph)

# Create new dataframe with processed text
processed_gptset = pd.DataFrame({
    'Response': processed_responses
})

# Save to CSV
processed_gptset.to_csv("datasets/esai_gpt_24_25.csv", index=False)

# Load the saved dataset
gptset = pd.read_csv("datasets/esai_gpt_24_25.csv")