In [1]:
import pandas as pd

In [11]:
combined = pd.read_csv('https://docs.google.com/spreadsheets/d/e/2PACX-1vRd9b1BiRIh_mRPYsJ7cj8lKhSsKkO7FMt316TRdYSIM8rcKInufKgsl0_FAR2f_q0Lw024Vrt6bg-L/pub?output=csv')
df1 = pd.read_csv('https://docs.google.com/spreadsheets/d/e/2PACX-1vTQEMJmeNXTGkOwtpbBEIuEecrDHlPKFoV_ISMyZcTTOeHwRjTcoo2iIJfST2uJ_BX-Uk-hiY9todA1/pub?output=csv')
df2 = pd.read_csv('https://docs.google.com/spreadsheets/d/e/2PACX-1vQNMaNjk6Hysp-jA0YPwTxS55MmrfLP2umPSUsNwkp3grGC-gNf6bZzzKzLuaAdYiJ2pGSsyLJPLB1T/pub?output=csv')

In [12]:
# Identify columns to keep
columns_to_keep = ['text', 'fine_tuned_label', 'pretrained_label', 'sentiment_label_w']

# Drop columns not in the list of columns to keep
columns_to_drop = [col for col in combined.columns if col not in columns_to_keep]
combined = combined.drop(columns=columns_to_drop)

In [13]:
combined

Unnamed: 0,text,fine_tuned_label,pretrained_label,sentiment_label_w
0,"Malakan, menurut kalian Danantara lebih banyak...",LABEL_0,LABEL_0,LABEL_1
1,Mumet kondisi skrg,LABEL_2,LABEL_0,LABEL_0
2,analogi pernikahan dengan papa dana itu agak k...,LABEL_1,LABEL_0,LABEL_1
3,"Dalam waktu kedepan tak lama lg, akan muncul b...",LABEL_0,LABEL_0,LABEL_2
4,Opportunity apa ya bang?,LABEL_1,LABEL_0,LABEL_0
...,...,...,...,...
39639,Asing beli 🚫\nDanantara beli ✅,LABEL_1,LABEL_0,LABEL_1
39640,Ini Endgame of Indonesia..,LABEL_1,LABEL_0,LABEL_0
39641,pak prabs ternyata pengikut andry hakim,LABEL_1,LABEL_0,LABEL_1
39642,"Middle class tinggal 30% saja. Menurut NARASI,...",LABEL_2,LABEL_0,LABEL_2


In [14]:
pd.crosstab(combined['fine_tuned_label'], combined['pretrained_label'], rownames=['Fine-tuned-IndoBERT'], colnames=['Pre-trained-IndoBERT'])

Pre-trained-IndoBERT,LABEL_0,LABEL_1,LABEL_2
Fine-tuned-IndoBERT,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
LABEL_0,7963,780,680
LABEL_1,16133,2327,1486
LABEL_2,8092,1679,504


In [15]:
pd.crosstab(combined['fine_tuned_label'], combined['sentiment_label_w'], rownames=['Fine-tuned-IndoBERT'], colnames=['Pre-trained-roberta-classifier'])

Pre-trained-roberta-classifier,LABEL_0,LABEL_1,LABEL_2
Fine-tuned-IndoBERT,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
LABEL_0,3373,1837,4213
LABEL_1,3693,5905,10348
LABEL_2,1502,2149,6624


In [16]:
from sklearn.metrics import classification_report

# Step 1: Define label mapping if needed
label_mapping = {'LABEL_0': 0, 'LABEL_1': 1, 'LABEL_2': 2}
target_names = ['positive', 'neutral', 'negative']  # Based on your mapping: 0 → pos, 1 → neu, 2 → neg

# Step 2: Convert fine_tuned_label to int
combined['fine_tuned_label_int'] = combined['fine_tuned_label'].map(label_mapping)

# Step 3: Convert pretrained_label to int using same mapping
combined['pretrained_label_int'] = combined['pretrained_label'].map(label_mapping)

# Step 4: Convert sentiment_label_w to int using same mapping
combined['sentiment_label_w_int'] = combined['sentiment_label_w'].map(label_mapping)

# Step 5: Generate classification report for pretrained IndoBERT (no fine-tuning)
print("🔍 Fine-tuned IndoBERT vs Pretrained IndoBERT (no fine-tuning):")
print(classification_report(
    y_true=combined['fine_tuned_label_int'],
    y_pred=combined['pretrained_label_int'],
    target_names=target_names
))

# Step 6: Generate classification report for w11wo/Roberta
print("\n🔍 Fine-tuned IndoBERT vs w11wo/IndoRoBERTa sentiment classifier:")
print(classification_report(
    y_true=combined['fine_tuned_label_int'],
    y_pred=combined['sentiment_label_w_int'],
    target_names=target_names
))

🔍 Fine-tuned IndoBERT vs Pretrained IndoBERT (no fine-tuning):
              precision    recall  f1-score   support

    positive       0.25      0.85      0.38      9423
     neutral       0.49      0.12      0.19     19946
    negative       0.19      0.05      0.08     10275

    accuracy                           0.27     39644
   macro avg       0.31      0.34      0.22     39644
weighted avg       0.35      0.27      0.21     39644


🔍 Fine-tuned IndoBERT vs w11wo/IndoRoBERTa sentiment classifier:
              precision    recall  f1-score   support

    positive       0.39      0.36      0.37      9423
     neutral       0.60      0.30      0.40     19946
    negative       0.31      0.64      0.42     10275

    accuracy                           0.40     39644
   macro avg       0.43      0.43      0.40     39644
weighted avg       0.47      0.40      0.40     39644



# Interpretasi

## Fine-tuned vs pretrained (sama sama indobenchmark/indobert-base-p1)

In [17]:
pd.set_option('display.max_colwidth', None)
df1.sample(10, random_state=42)

Unnamed: 0.1,Unnamed: 0,text,fine_tuned_label,pretrained_label
20372,27679,"makano ojo adol ayat murah neng wong gak paham, nggarai goblox pikirane bongsomu cak, wong nu kok sontolyo 👉🙉🙈🙊",LABEL_1,LABEL_0
9071,12285,"Perkatakan dong, bahwa denantara DIBUAT UNTUK MENGKEBIRI PARA KORUPTOR SECARA TIDAK LANGSUNG",LABEL_1,LABEL_2
14881,20087,Saya orang Indonesia gak percaya danantara . masalah nya pejabat Indonesia semuanya bajingan alias garong semuanya . Asabri abis jiwa seraya abis masih banyak lagi yg abis uang Indonesia abis di embat alias di maling semuanya,LABEL_2,LABEL_0
6188,8207,Morning Koko Raymond.,LABEL_1,LABEL_0
27054,36959,Benar tambah kacau,LABEL_2,LABEL_0
20654,28083,Tinggal santet aja lak wes😅😅😂😂😂,LABEL_2,LABEL_0
14202,19163,Binasahkan koruptor dgn memiskinkan y..!!\nJd uang negara yg udah di curi dpt di kembalikan..\nAtau hukum mati..!!\nBoleh la..,LABEL_1,LABEL_0
11617,15846,"Siap2 klo danatara dah beroperasi, beritanya bakalan bombastis...untung sekian ribu trilyun, narik investor kakap, buka jutaan lapangan kerja\nTpi tggu bbrp lama smp muncul generasi baru yg oposisi",LABEL_1,LABEL_0
15817,21302,"NKRI, K nya KORUP",LABEL_2,LABEL_0
5221,6889,"harusnya ada penjelasan sih dan skema, alasan dari ambisi danantara ini dibuat apa, latar belakang, danantara ini nanti akan disalurkan ke bidang apa, dan di urutkan yg utama ke pendidikan misalnya, kedua kesehatan dst. kalo ini kok kesannya kaya yg utama itu pngin kumpulin uangnya aja banyak banyak tanpa skema, yg ujung ujungnya ya emang buat memperkaya keturunan aja, diluar itu cuman alat. portofolio pemerintah yg berhasil mana dikasih liat datanya dulu, karna kok kayanya gada yg bisa dibanggain ya, pln dan pertamina, dua usaha tanpa saingan aja begono hasilnya, ""ga masuk logika"". Gini aja deh katakan lu sebagai investor, mana yg lu pilih, anggaplah ada 10 list tempat yang bisa lu invest. kalo investasi ke pemerintah konoha itu adalah pilihan terakhir atau bahkan ga masuk list, karna lu mungkin lebih baik milih ke pemerintah luar konoha (kalo memang harus invest ke pmerintahan). Berarti sejak awal emang ga layak. Dampak ke rakyat gimana ntar jadinya, analisa dari sekian banyak stafsus itu gimana soal ini, jelasin, dari dulu gw pnasaran, tolong dilaksanakan lah UUD itu ..mencerdaskan kehidupan bangsa.. selama ini kok yg menjalankan kayanya malah influencer itupun diteror teror sama yang katanya oknum doang",LABEL_1,LABEL_0


In [21]:
pd.set_option('display.max_colwidth', None)
df1.sample(10, random_state=21)

Unnamed: 0.1,Unnamed: 0,text,fine_tuned_label,pretrained_label
19037,25826,Mau sampai kapan di iming iming...terus gak akan dikorupsi \nRealita selama ini msh kurang jelas gimana...coba?\nOptimis boleh...tapi jgn percaya begitu aja...gak bosen emang di tipu sm koruptor,LABEL_2,LABEL_0
24124,32769,saya kira bukan danantara penyebab ny\nsaya yakin karena kelakuan pejabat yang Qorup\ndan penegak hukum yang gak berani menyita harta koruptor dan atau tidak berabi memberlakukan tembak mati bagi para pejabat korub,LABEL_1,LABEL_0
18557,25168,Selama ada msh hidup di INDONESIA dan budaya BUMN Badan Usaha milik Nenek..... Sama dengan,LABEL_0,LABEL_1
10036,13693,"Rakyat siap merebut lg kedaulatan negara,jika Danantara dikhianati... Rebut kedaulautan pengelolaan negara!!!!!\nMari kobarkan semangat perang kepada koruptor!!!! Seperti para pahlawan kemerdekaan dahulu",LABEL_1,LABEL_0
4654,6082,"If mothers used to think about dark state-owned enterprises because they could be used to buy this and that, now it is under the supervision of the president... great...same like as BI be independently...",LABEL_0,LABEL_2
4820,6309,"permisi mau bertanya , apa yang harus dipersiapkan oleh orang menengah ke bawah jika terjadi kegagalan danantara? ntah kenapa saya merasa kesempatan besar itu terjadi 😢",LABEL_1,LABEL_0
19998,27158,"hukum koruptor di buat tegas dulu biar masyarakat jadi makin yakin, misal peranpasan aset. tegas,, jika tidak tegas segala program pastinya bisa di anu",LABEL_1,LABEL_0
14105,19032,mempertegas hukum indonesia,LABEL_1,LABEL_0
5053,6648,"saya salah satu warga yang sama sekali gak ada optimisme terhadap Danantara.., selama sistem politik dan orang-orangnya masih sama, Mega korupsi Danantara hanya menghitung waktu..., apalagi dipimpin oleh presiden yang menurut saya ""sangat lemah"" dikepemimpinan..",LABEL_2,LABEL_0
1711,2233,"Brantas korupsi beres masalah,, danantara gimmik politik",LABEL_2,LABEL_0


In [23]:
pd.set_option('display.max_colwidth', None)
df1.sample(10, random_state=77)

Unnamed: 0.1,Unnamed: 0,text,fine_tuned_label,pretrained_label
13803,18636,"Itu 300T kan diliat dari laba bersih bumn. Kalo semua laba bersih bumn itu dijadiin dividen, itu perusahaan ga akan bertumbuh dong?",LABEL_1,LABEL_0
24466,33340,ada lowongan jabatan baru..,LABEL_2,LABEL_1
18738,25418,HAHAHA,LABEL_1,LABEL_0
23861,32419,"Jika nasib DANANTARA jadi kaya 1MDB, fix ras melayu gak cocok pegang uang.",LABEL_1,LABEL_0
15954,21472,Danantara ok..\nTp harus diisi orang2 yg tanggungjawab.. kecerdasan hati.\nJg dibarengi puluncuran uu perampasan koruptor!\nTanpa uu perampasan koruptor ibarat danantara senjata tp gk ada peluru...,LABEL_2,LABEL_0
20343,27641,Vidiony cerah banget serasa dialam barzah 😂,LABEL_1,LABEL_0
5813,7686,Meragukan...korupsi lagi,LABEL_2,LABEL_1
19144,25967,Sebelum terjadi telkom banyak tikus nya 😂😂,LABEL_1,LABEL_0
22689,30805,"Sesuai sama hukum Islam, bahkan korupto dalam Islam pantas di hukum mati karena efek-efek di timbulkan terlalu besar merugikan negara masyarakat, harus ada hukuman efek orang jera untuk melakukan kejahatan korupsi, kalau di hukum cuman kurungan penjara doang gak ada efek bagi pelaku korupsi bahkan di di penjara pun pelaku dapat kurungan mungkin penjara ada AC, TV, atau kulkas kasur, belum lagi bisa sesuka hati keluyuran keluar masuk penjara seperti Gayus tambunan itu. Hukum di buat gak ada efek jera pelaku koruptor jadi gak heran indonesia susah membasi korupsi",LABEL_1,LABEL_0
21017,28577,Kamera nya pak hehehe,LABEL_1,LABEL_0


## FineTuned (indobenchmark/indobert-base-p1) vs pretrained (w11wo/indonesian-roberta-base-sentiment-classifier)

In [24]:
pd.set_option('display.max_colwidth', None)
df2.sample(10, random_state=42)

Unnamed: 0.1,Unnamed: 0,text,fine_tuned_label,w11wo_label
32340,32340,Danantara tapi di isi perusahaan korup ya siapa yg mau infestasi om wkwkw kocak dah tapi ini yg bukan presindt prabowo tapi semenjak SBY dan jokowi lah yg bikin penyakit kangker dan kronisnya mulai terasa di era prabowo,LABEL_1,negative
10480,10480,Kita lihat saja ke de p an program nya pranowo pro rakyat apa basa basi aja klu tdk menyentuh kesejahteraan rakyat mahasiswa buruh jangan diem aja hayo turun ke jalan bersatu,LABEL_0,negative
15370,15370,Jangan sampai masahyarakat tidak percanya lagi sama pemerinta bisa Gawat,LABEL_1,neutral
31592,31592,"Hebat Pandu, cocok anda di Pemerintahan dan bisa membenahinya.",LABEL_1,positive
198,198,semoga danantara amanah,LABEL_0,positive
37834,37834,Dari pada loe sudah tua bukannya menjadi teladan malah koar kar tdk karuan mirip sama teman loe si nenek banteng!,LABEL_1,negative
624,624,"BUKANYA NAMBAH LAPANGAN PEKERJAAN, INI MALAH NAMBAH LAPANGAN KORUP**😢",LABEL_1,negative
22135,22135,"Yang demo itu antek Amerika , hati2 mereka itu anti Islam dan anti Pemerintah.",LABEL_0,negative
29798,29798,HUKUM MATI !!!,LABEL_2,negative
32896,32896,kebanyakan cita2.... yang paling urgent itu pak.. benar2 berantas korupsi itu yg paling penting.. itu yang paling utama... ndasmu,LABEL_2,negative


In [25]:
pd.set_option('display.max_colwidth', None)
df2.sample(10, random_state=21)

Unnamed: 0.1,Unnamed: 0,text,fine_tuned_label,w11wo_label
22056,22056,anak muda tunjang negara,LABEL_0,positive
34354,34354,Sayang bgt...aksi Rush Money ga realistis dan ga masuk akal😊😅,LABEL_2,negative
27352,27352,"Korupsi harus dihabisi SEGRA, JANGAN CUMA OMON2. Efisien pd badan / lembaga lebih keras, klo perlu di di ciutkan",LABEL_1,negative
38204,38204,Mbah amin rais,LABEL_0,neutral
24688,24688,"Idenya bagus ..danantara mencover ata giat2 darurat yg tak dianggarkan dan urgen dilaksanakan, tentu tidak alergi diperiksa bpkp n bpk",LABEL_1,neutral
23291,23291,"Suarakan terus bro Fery ... Akal pikir dan rasa para elite gelap segelap Harapan rakyat akan nasib dirinya, bangsa dan negara... 👍💪🙏",LABEL_0,negative
18105,18105,"Omon2 defisit 1400T,,,\nSkenario sama dg si jokowi,,\nAda 11000Triliun dikantong saya,,,\nRezim sekarang satu komplotan maling dan perusak konstitusi",LABEL_2,negative
1215,1215,"pro keputusan pemerintah dibilang buzzer. Oposisi pemerintah dibilang barisan sakit hati. Hadehhh...\nBro, gak ada pemerintahan absolut. Sampai kapanpun gak ada pemerintah yang 100% adil sampai ke level individu. Pemerintahan dari jaman Bung Karno sampai sekarangpun mengambil keputusan PASTI ada yang dikorbankan untuk ""THE GREATER GOOD"". Hanya saja, kita sebagai rakyat harus maju setiap ada PENYELEWENGAN atas keputusan pemerintah yang seharusnya menjadi KESEJAHTERAAN masyarakat",LABEL_0,negative
35350,35350,"Kepercayaan rakyat sudah hilang pada pemerintah. Karena induk koruptor tidak juga ditangkap dan diadili. Demikian juga UU perampasam aset juga tdk kunjung disahkan. Jadi, siapa yg mau percaya sama pemerintah????",LABEL_1,negative
14125,14125,40:12 *NANGGUNG* TUH *NAMBAH* *1* LAGI BIAR *3-DIGIT* *AHAHAHAHAHAHA*,LABEL_1,negative


In [26]:
pd.set_option('display.max_colwidth', None)
df2.sample(10, random_state=77)

Unnamed: 0.1,Unnamed: 0,text,fine_tuned_label,w11wo_label
18537,18537,Danantara kl dipegang oleh orang yg amanah jujur mungkin akan baik .. tp yg kelola dan yg ngawasi mantan koruptor... Apa bisa dijamin akan baik .... Sebaik apapun kl yg kelola ga jujur ancur lebur seperti BUMN sekarang...,LABEL_0,negative
20400,20400,Ada yang korup langsung kirim kain kafan tanpa kecuali sih langsung setuju,LABEL_0,neutral
29745,29745,"""Kita menghukum maling-maling kecil dan menunjuk maling-maling besar untuk bekerja di pemerintahan.""\n===== AESOPUS =====",LABEL_1,negative
22171,22171,"😂😂Neraka sangat tipis, level 99, dan sangat cinta korupsi #NKRI",LABEL_1,positive
31663,31663,tanya dong kira2 berapa puluh miliar kekayaan pandu yang asli ada 100 miliar? kalo pamanya kan jelas hampir 1 triliun,LABEL_1,neutral
18313,18313,"Kalau pemimpinya nggak berani menegakan hukum sampai kpnpun nggak bisa makmur, karena dari pemimpin ke pemimpin punya kasus",LABEL_0,negative
25925,25925,jangan Jangan pada awalnya ok godjob tapi ujungnya tak kuat iman jadi arena Bancakan besek korup dachhh Semoga kuat iman Yach Jangan dikorupsi Yach Dek jangan 😅,LABEL_1,negative
1686,1686,Mantap penjelasannya masuk banget. 👍,LABEL_1,positive
34575,34575,"DANA PENSIUN AJA DIKORUPSI, HATI HATI AKAL BULUS",LABEL_2,negative
12933,12933,Saya agak yakin bahwa Ferry gak percaya omongan kak didu'...,LABEL_0,negative
