In [1]:
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
from Sastrawi.StopWordRemover import StopWordRemover
from Sastrawi.Stemmer import Stemmer
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.svm import SVC

In [2]:
from Sastrawi.StopWordRemover.StopWordRemoverFactory import StopWordRemoverFactory
from Sastrawi.Stemmer.StemmerFactory import StemmerFactory

# Inisialisasi StopWordRemover dan Stemmer
stopword_remover = StopWordRemoverFactory().create_stop_word_remover()
stemmer = StemmerFactory().create_stemmer()

def preprocess_text(text):
    # Menghapus stopword
    text_no_stopwords = stopword_remover.remove(text)
    # Melakukan stemming
    text_stemmed = stemmer.stem(text_no_stopwords)
    return text_stemmed

In [3]:
data = pd.read_excel('data_riviews_news.xlsx')
data


Unnamed: 0,RIVIEW,LABEL
0,Baju ini sangat nyaman dipakai bahan yang digu...,Positif
1,Jaket ini sangat stylish dan hangat Saya sanga...,Positif
2,Pengiriman cepat dan baju datang dalam kondisi...,Positif
3,Bahan baju ini sangat lembut dan tidak panas d...,Positif
4,Jaket ini sesuai dengan deskripsi kualitasnya ...,Positif
...,...,...
445,Jaket ini cepat sekali rusak setelah beberapa ...,Negatif
446,Baju ini tidak sesuai dengan gambar di website...,Negatif
447,Jaket ini terlalu tipis dan tidak hangat sama ...,Negatif
448,Baju ini sangat kasar dan tidak nyaman di kulit,Negatif


In [4]:
data['RIVIEW'] = data['RIVIEW'].apply(preprocess_text)

In [5]:
# Ubah label sentimen menjadi angka
sentiment_mapping = {'Positif': 1, 'Negatif': 2, 'Netral': 0}
data['LABEL'] = data['LABEL'].map(sentiment_mapping)

In [6]:
texts =data['RIVIEW']
sentiments = data ['LABEL']

X_train,X_test,y_train,y_test =train_test_split(texts,sentiments, test_size=0.3, random_state=42)

In [7]:
# Membuat vektor fitur dari data teks
Vectorizer = CountVectorizer()

X_train_counts = Vectorizer.fit_transform(X_train)
X_test_counts = Vectorizer.transform(X_test)

In [8]:
# Membuat model regresi logistik
model = SVC (kernel='linear')
model.fit(X_train_counts, y_train)

In [9]:
# Memprediksi nilai menggunakan model yang telah dilatih
predictions = model.predict(X_test_counts)

In [10]:
print("evaluasi model :")
print(classification_report(y_test,predictions))

print("\nBerapa hasil prediksi:")
for text,sentiment in zip (X_test,predictions):
    print(f'teks : {text}\nPrediksi_label: {sentiments}\n')

result = pd.DataFrame({'RIVIEW' : X_test,'predicted_label': predictions})
result.to_excel('predictions_svm.xlsx', index=False)

print("Hasil Prediksi Telah Di Ekspor ke 'predictions.xlsx'.")

evaluasi model :
              precision    recall  f1-score   support

           0       1.00      1.00      1.00        37
           1       1.00      0.95      0.97        55
           2       0.93      1.00      0.97        43

    accuracy                           0.98       135
   macro avg       0.98      0.98      0.98       135
weighted avg       0.98      0.98      0.98       135


Berapa hasil prediksi:
teks : jaket tidak milik ventilasi baik sangat kecewa
Prediksi_label: 0      1
1      1
2      1
3      1
4      1
      ..
445    2
446    2
447    2
448    2
449    2
Name: LABEL, Length: 450, dtype: int64

teks : baju milik bau tidak enak sangat kecewa
Prediksi_label: 0      1
1      1
2      1
3      1
4      1
      ..
445    2
446    2
447    2
448    2
449    2
Name: LABEL, Length: 450, dtype: int64

teks : jaket sangat hangat nyaman pakai musim dingin
Prediksi_label: 0      1
1      1
2      1
3      1
4      1
      ..
445    2
446    2
447    2
448    2
449    2

In [11]:
def analyze_text(text) :
    text_counts = Vectorizer.transform([text])
    predictions = model.predict (text_counts)[0]
    return predictions

while True:
    user_input = input ("\nMasukkan Teks Untuk Analisis Sentimen (atau ketik 'exit'untuk keluar :)")
    if user_input.lower()== 'exit':
        break
    sentiment =analyze_text(user_input)
    print(f'Prediksi Sentimen Untuk "{user_input}": {sentiment}')

Prediksi Sentimen Untuk "": 0
Prediksi Sentimen Untuk "": 0
Prediksi Sentimen Untuk "": 0
Prediksi Sentimen Untuk "": 0
Prediksi Sentimen Untuk "": 0
Prediksi Sentimen Untuk "": 0
Prediksi Sentimen Untuk "1": 0
Prediksi Sentimen Untuk "1": 0
Prediksi Sentimen Untuk "2": 0
Prediksi Sentimen Untuk "2": 0
Prediksi Sentimen Untuk "3": 0
Prediksi Sentimen Untuk "4": 0
