## Import Library

In [18]:
import joblib
import re

## Load Model dan Vectorizer

In [19]:
model1 = joblib.load('model1.pkl')
model2 = joblib.load('model2.pkl')
model3 = joblib.load('model3.pkl')
vectorizer1 = joblib.load('vectorizer1.pkl')
vectorizer2 = joblib.load('vectorizer2.pkl')
vectorizer3 = joblib.load('vectorizer3.pkl')

## Preprocessing

In [20]:
def preprocess(text):
  text = re.sub(r'[^a-zA-Z0-9\s]', '', text)
  text = text.lower()
  text = re.sub(r'\s+', ' ', text).strip()
  return text

## Uji Coba Dengan Data Baru

In [21]:
x = ["Aplikasinya berjalan mulus, gaada error sama sekali, mantap!",
     "biasa aja, gaada yang spesial, ga bagus, dan ga jelek",
     "Aplikasinya tidak membantu sama sekali",
     "kecewa banget. udah ga sesuai ekspektasi, ngelag lagi",]

# Preprocess
clean_text = [preprocess(t) for t in x]

### Skema 1: Model 1 dan Vectorizer 1

In [22]:
X_new1 = vectorizer1.transform(clean_text)
y_pred1 = model1.predict(X_new1)

# Hasil
for teks, label in zip(x, y_pred1):
    print(f"Kalimat: '{teks}' \n=> Label: {label}\n")

Kalimat: 'Aplikasinya berjalan mulus, gaada error sama sekali, mantap!' 
=> Label: 2

Kalimat: 'biasa aja, gaada yang spesial, ga bagus, dan ga jelek' 
=> Label: 2

Kalimat: 'Aplikasinya tidak membantu sama sekali' 
=> Label: 2

Kalimat: 'kecewa banget. udah ga sesuai ekspektasi, ngelag lagi' 
=> Label: 2



### Skema 2: Model 2 dan Vectorizer 2

In [23]:
X_new2 = vectorizer2.transform(clean_text)
y_pred2 = model2.predict(X_new2)

# Hasil
for teks, label in zip(x, y_pred2):
    print(f"Kalimat: '{teks}' \n=> Label: {label}\n")

Kalimat: 'Aplikasinya berjalan mulus, gaada error sama sekali, mantap!' 
=> Label: 2

Kalimat: 'biasa aja, gaada yang spesial, ga bagus, dan ga jelek' 
=> Label: 0

Kalimat: 'Aplikasinya tidak membantu sama sekali' 
=> Label: 2

Kalimat: 'kecewa banget. udah ga sesuai ekspektasi, ngelag lagi' 
=> Label: 0



### Skema 3: Model 3 dan Vectorizer 3

In [24]:
X_new3 = vectorizer3.transform(clean_text)
y_pred3 = model3.predict(X_new3)

# Hasil
for teks, label in zip(x, y_pred3):
    print(f"Kalimat: '{teks}' \n=> Label: {label}\n")

Kalimat: 'Aplikasinya berjalan mulus, gaada error sama sekali, mantap!' 
=> Label: 2

Kalimat: 'biasa aja, gaada yang spesial, ga bagus, dan ga jelek' 
=> Label: 2

Kalimat: 'Aplikasinya tidak membantu sama sekali' 
=> Label: 2

Kalimat: 'kecewa banget. udah ga sesuai ekspektasi, ngelag lagi' 
=> Label: 2



## Kesimpulan:
Meskipun pada analisis sentimen sebelumnya, hasil menunjukkan akurasi yang tinggi, namun pada hasil inferensi tidak menunjukkan hasil yang sama, meskipun pada contoh kalimat sebenarnya ada kata yang dapat langsung menentukan label dari kalimat tersebut. Meskipun, skema 2 terlihat sedikit lebih baik dalam melakukan analisis sentimen. Hal ini mungkin disebabkan oleh beberapa faktor, seperti:
1.  Keterbatasan data: Jumlah data yang digunakan mungkin tidak cukup
2.  Keterbatasan model: Model yang digunakan mungkin tidak dapat menangkap pola-pola yang kompleks dalam kalimat
3.  Keterbatasan pengolahan bahasa: Pengolahan bahasa yang digunakan mungkin tidak dapat menangkap makna yang terkandung dalam kalimat
4.  Keterbatasan penggunaan kata-kata: Penggunaan kata-kata dalam kalimat mungkin tidak dapat menangkap makna yang terkandung dalam kalimat
5.  Keterbatasan penggunaan kalimat: Penggunaan kalimat yang tidak sesuai dengan label yang diharapkan

Dari hasil analisis, dapat disimpulkan bahwa model yang digunakan masih perlu diperbaiki dan diperluas untuk meningkatkan akurasi inferensi. Selain itu, penggunaan data yang lebih besar dan lebih beragam juga dapat membantu meningkatkan akurasi model. Oleh karena itu, perlu dilakukan penelitian lanjutan untuk meningkatkan akurasi model dan mengembangkan model yang lebih baik. 