In [3]:
import pandas as pd
from textblob import TextBlob
import inflect
import nltk
from Sastrawi.Stemmer.StemmerFactory import StemmerFactory
from nltk.corpus import stopwords
import re

# Download stopwords untuk nltk
nltk.download('stopwords')

# Inisialisasi inflect engine untuk konversi angka ke kata
p = inflect.engine()

# Inisialisasi stemmer Bahasa Indonesia dari Sastrawi
factory = StemmerFactory()
stemmer = factory.create_stemmer()

# Mengambil daftar stopwords bahasa Indonesia
stop_words = set(stopwords.words('indonesian'))

# Fungsi untuk memperbaiki typo
# def perbaiki_typo(teks):
#     blob = TextBlob(teks)
#     return str(blob.correct())

angka_to_kata = {
    '0': 'nol', '1': 'satu', '2': 'dua', '3': 'tiga', '4': 'empat',
    '5': 'lima', '6': 'enam', '7': 'tujuh', '8': 'delapan', '9': 'sembilan'
}

# Fungsi untuk mengganti angka dengan kata
def ganti_angka_dengan_kata(teks):
    def replace(match):
        return angka_to_kata[match.group(0)]
    return re.sub(r'\d', replace, teks)

# Fungsi untuk tokenisasi
def tokenize(teks):
    return teks.split()

# Fungsi untuk transformasi kasus (menjadi huruf kecil)
def transform_case(teks):
    return teks.lower()

# Fungsi untuk menghapus stopwords
def hapus_stopwords(teks):
    tokens = teks.split()
    tokens = [word for word in tokens if word not in stop_words]
    return ' '.join(tokens)

# Fungsi untuk stemming
def stem_text(teks):
    return stemmer.stem(teks)

# Membaca file excel
df = pd.read_excel('./Dataset-MSToDoList.xlsx')

# Proses preprocessing dengan cetakan proses
for index, row in df.iterrows():
    print(f"Original: {row['content']}")

#     row['content'] = perbaiki_typo(row['content'])
#     print(f"After typo correction: {row['content']}")

    row['content'] = ganti_angka_dengan_kata(row['content'])
    print(f"After replacing numbers: {row['content']}")

    row['content'] = transform_case(row['content'])
    print(f"After case transformation: {row['content']}")

    tokens = tokenize(row['content'])
    print(f"After tokenization: {tokens}")

    row['content'] = ' '.join(tokens)
    row['content'] = hapus_stopwords(row['content'])
    print(f"After stopword removal: {row['content']}")

    row['content'] = stem_text(row['content'])
    print(f"After stemming: {row['content']}")

    # Update the dataframe with processed content
    df.at[index, 'content'] = row['content']
    print("------")

# Menyimpan kembali ke file excel atau menampilkan hasil
df.to_excel('Dataset-MSToDoList-after-preprocess.xlsx', index=False)
print(df.head())


[nltk_data] Downloading package stopwords to
[nltk_data]     C:\Users\User\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


Original: lebih baik dari yang lain 
After replacing numbers: lebih baik dari yang lain 
After case transformation: lebih baik dari yang lain 
After tokenization: ['lebih', 'baik', 'dari', 'yang', 'lain']
After stopword removal: 
After stemming: 
------
Original: Sangat membantu dalam mengingat tugas-tugas saya yang belum dikerjakan!
After replacing numbers: Sangat membantu dalam mengingat tugas-tugas saya yang belum dikerjakan!
After case transformation: sangat membantu dalam mengingat tugas-tugas saya yang belum dikerjakan!
After tokenization: ['sangat', 'membantu', 'dalam', 'mengingat', 'tugas-tugas', 'saya', 'yang', 'belum', 'dikerjakan!']
After stopword removal: membantu tugas-tugas dikerjakan!
After stemming: bantu tugas kerja
------
Original: sangat membantu pekerjaan saya.Terimakasih
After replacing numbers: sangat membantu pekerjaan saya.Terimakasih
After case transformation: sangat membantu pekerjaan saya.terimakasih
After tokenization: ['sangat', 'membantu', 'pekerjaan', 'sa

After stemming: aplikasi bagus harus fitur manfaat animasi vibes bagus
------
Original: Secara dasarnya, aplikasi ini sangat cocok bagi saya, mulai dari antarmuka, efektivitas, dan desain sederhananya yang membuat saya senang secara keseluruhan.
After replacing numbers: Secara dasarnya, aplikasi ini sangat cocok bagi saya, mulai dari antarmuka, efektivitas, dan desain sederhananya yang membuat saya senang secara keseluruhan.
After case transformation: secara dasarnya, aplikasi ini sangat cocok bagi saya, mulai dari antarmuka, efektivitas, dan desain sederhananya yang membuat saya senang secara keseluruhan.
After tokenization: ['secara', 'dasarnya,', 'aplikasi', 'ini', 'sangat', 'cocok', 'bagi', 'saya,', 'mulai', 'dari', 'antarmuka,', 'efektivitas,', 'dan', 'desain', 'sederhananya', 'yang', 'membuat', 'saya', 'senang', 'secara', 'keseluruhan.']
After stopword removal: dasarnya, aplikasi cocok saya, antarmuka, efektivitas, desain sederhananya senang keseluruhan.
After stemming: dasar apl

After stemming: bantu pol saran task tumpuk mini task centang task clear
------
Original: aplikasi yang sangat bagus...mendukung pekerjaan.
After replacing numbers: aplikasi yang sangat bagus...mendukung pekerjaan.
After case transformation: aplikasi yang sangat bagus...mendukung pekerjaan.
After tokenization: ['aplikasi', 'yang', 'sangat', 'bagus...mendukung', 'pekerjaan.']
After stopword removal: aplikasi bagus...mendukung pekerjaan.
After stemming: aplikasi bagus dukung kerja
------
Original: baik, mudah penggunaannya
After replacing numbers: baik, mudah penggunaannya
After case transformation: baik, mudah penggunaannya
After tokenization: ['baik,', 'mudah', 'penggunaannya']
After stopword removal: baik, mudah penggunaannya
After stemming: baik mudah guna
------
Original: Aplikasinya keren, sangat membantu sekali dalam mengelola tugas
After replacing numbers: Aplikasinya keren, sangat membantu sekali dalam mengelola tugas
After case transformation: aplikasinya keren, sangat membantu

After stemming: bantu versi desktop mobile
------
Original: Sangat baik dan selalu updated terlindungi telusuran private server saya ini
After replacing numbers: Sangat baik dan selalu updated terlindungi telusuran private server saya ini
After case transformation: sangat baik dan selalu updated terlindungi telusuran private server saya ini
After tokenization: ['sangat', 'baik', 'dan', 'selalu', 'updated', 'terlindungi', 'telusuran', 'private', 'server', 'saya', 'ini']
After stopword removal: updated terlindungi telusuran private server
After stemming: updated lindung telusur private server
------
Original: suka banget, sangat rekomendasi
After replacing numbers: suka banget, sangat rekomendasi
After case transformation: suka banget, sangat rekomendasi
After tokenization: ['suka', 'banget,', 'sangat', 'rekomendasi']
After stopword removal: suka banget, rekomendasi
After stemming: suka banget rekomendasi
------
Original: aplikasi ini lebih efektif dan efisien
After replacing numbers: ap

After stemming: bagus atur tugas hari
------
Original: Sangat membantu mengatur jadwal
After replacing numbers: Sangat membantu mengatur jadwal
After case transformation: sangat membantu mengatur jadwal
After tokenization: ['sangat', 'membantu', 'mengatur', 'jadwal']
After stopword removal: membantu mengatur jadwal
After stemming: bantu atur jadwal
------
Original: Sangat bagus, saya jadi produktif
After replacing numbers: Sangat bagus, saya jadi produktif
After case transformation: sangat bagus, saya jadi produktif
After tokenization: ['sangat', 'bagus,', 'saya', 'jadi', 'produktif']
After stopword removal: bagus, produktif
After stemming: bagus produktif
------
Original: Sangat membantu monitoring Proyek
After replacing numbers: Sangat membantu monitoring Proyek
After case transformation: sangat membantu monitoring proyek
After tokenization: ['sangat', 'membantu', 'monitoring', 'proyek']
After stopword removal: membantu monitoring proyek
After stemming: bantu monitoring proyek
------

After stemming: aplikasi bagus jadwal ingat
------
Original: oke perlu selancar lebih mantap lagi
After replacing numbers: oke perlu selancar lebih mantap lagi
After case transformation: oke perlu selancar lebih mantap lagi
After tokenization: ['oke', 'perlu', 'selancar', 'lebih', 'mantap', 'lagi']
After stopword removal: oke selancar mantap
After stemming: oke selancar mantap
------
Original: Memudahkan menilai pencapaian alhamdulillaah
After replacing numbers: Memudahkan menilai pencapaian alhamdulillaah
After case transformation: memudahkan menilai pencapaian alhamdulillaah
After tokenization: ['memudahkan', 'menilai', 'pencapaian', 'alhamdulillaah']
After stopword removal: memudahkan menilai pencapaian alhamdulillaah
After stemming: mudah nilai capai alhamdulillaah
------
Original: Aplikasi yang bagus Simpel dan mudah digunakan
After replacing numbers: Aplikasi yang bagus Simpel dan mudah digunakan
After case transformation: aplikasi yang bagus simpel dan mudah digunakan
After toke

After stemming: erti peangaturan waktu lebih bagus kasih tema gratis tarik
------
Original: Aplikasi nya membantu banget.
After replacing numbers: Aplikasi nya membantu banget.
After case transformation: aplikasi nya membantu banget.
After tokenization: ['aplikasi', 'nya', 'membantu', 'banget.']
After stopword removal: aplikasi nya membantu banget.
After stemming: aplikasi nya bantu banget
------
Original: Aplikasi sangat mendukung pekerjaan sehari sehari. Terimakasih Microsoft telah menghadirkan aplikasi gratis yang menunjang bisnis kami.
After replacing numbers: Aplikasi sangat mendukung pekerjaan sehari sehari. Terimakasih Microsoft telah menghadirkan aplikasi gratis yang menunjang bisnis kami.
After case transformation: aplikasi sangat mendukung pekerjaan sehari sehari. terimakasih microsoft telah menghadirkan aplikasi gratis yang menunjang bisnis kami.
After tokenization: ['aplikasi', 'sangat', 'mendukung', 'pekerjaan', 'sehari', 'sehari.', 'terimakasih', 'microsoft', 'telah', 'me

After stemming: kalo sih rekomendasiin download ini bagus deh kalo sih cocok
------
Original: Good bgt . .. bisa sharing list juga
After replacing numbers: Good bgt . .. bisa sharing list juga
After case transformation: good bgt . .. bisa sharing list juga
After tokenization: ['good', 'bgt', '.', '..', 'bisa', 'sharing', 'list', 'juga']
After stopword removal: good bgt . .. sharing list
After stemming: good bgt sharing list
------
Original: terimakasih, sangat membantu...
After replacing numbers: terimakasih, sangat membantu...
After case transformation: terimakasih, sangat membantu...
After tokenization: ['terimakasih,', 'sangat', 'membantu...']
After stopword removal: terimakasih, membantu...
After stemming: terimakasih bantu
------
Original: Bagus berguna banget buat yang mau produktif setiap harinya,aku yang malesan jadi rada produktif jadi musti banget,wajib download biar lebih produktif,MAKASIH
After replacing numbers: Bagus berguna banget buat yang mau produktif setiap harinya,a

After stemming: cocok nambah plan tugasdua sekolah kuliah aplikasi akses full gratis
------
Original: Sangat membantu jadwal kerja
After replacing numbers: Sangat membantu jadwal kerja
After case transformation: sangat membantu jadwal kerja
After tokenization: ['sangat', 'membantu', 'jadwal', 'kerja']
After stopword removal: membantu jadwal kerja
After stemming: bantu jadwal kerja
------
Original: Luar biasa  Terimakasih banyak 
After replacing numbers: Luar biasa  Terimakasih banyak 
After case transformation: luar biasa  terimakasih banyak 
After tokenization: ['luar', 'biasa', 'terimakasih', 'banyak']
After stopword removal: terimakasih
After stemming: terimakasih
------
Original: App ini sangat membantu!
After replacing numbers: App ini sangat membantu!
After case transformation: app ini sangat membantu!
After tokenization: ['app', 'ini', 'sangat', 'membantu!']
After stopword removal: app membantu!
After stemming: app bantu
------
Original: suka banget sangat membantu, semua jadii 

After stemming: lupa tugas jadwaldua
------
Original: Cocok untuk pengguna windows.. terintegrasi
After replacing numbers: Cocok untuk pengguna windows.. terintegrasi
After case transformation: cocok untuk pengguna windows.. terintegrasi
After tokenization: ['cocok', 'untuk', 'pengguna', 'windows..', 'terintegrasi']
After stopword removal: cocok pengguna windows.. terintegrasi
After stemming: cocok guna windows integrasi
------
Original: aplikasi sudah bagus, tinggal lebih dikembangkan saja supa alebih menarik dan optimal
After replacing numbers: aplikasi sudah bagus, tinggal lebih dikembangkan saja supa alebih menarik dan optimal
After case transformation: aplikasi sudah bagus, tinggal lebih dikembangkan saja supa alebih menarik dan optimal
After tokenization: ['aplikasi', 'sudah', 'bagus,', 'tinggal', 'lebih', 'dikembangkan', 'saja', 'supa', 'alebih', 'menarik', 'dan', 'optimal']
After stopword removal: aplikasi bagus, tinggal dikembangkan supa alebih menarik optimal
After stemming: 

After stemming: i love this app simple sesuai butuh emang sih isi sederhana banget tp ku moga ngebantu gais
------
Original: Aplikasi yang sangat membantu 
After replacing numbers: Aplikasi yang sangat membantu 
After case transformation: aplikasi yang sangat membantu 
After tokenization: ['aplikasi', 'yang', 'sangat', 'membantu']
After stopword removal: aplikasi membantu
After stemming: aplikasi bantu
------
Original: aplikasi bagus untuk cheklist
After replacing numbers: aplikasi bagus untuk cheklist
After case transformation: aplikasi bagus untuk cheklist
After tokenization: ['aplikasi', 'bagus', 'untuk', 'cheklist']
After stopword removal: aplikasi bagus cheklist
After stemming: aplikasi bagus cheklist
------
Original: Aplikasi terbaik untuk list tugas
After replacing numbers: Aplikasi terbaik untuk list tugas
After case transformation: aplikasi terbaik untuk list tugas
After tokenization: ['aplikasi', 'terbaik', 'untuk', 'list', 'tugas']
After stopword removal: aplikasi terbaik li

After stemming: bgs banget nyatet tugasdua ku sekolah giat
------
Original: Aplikasinya enak simple. Tampilannya elegan. Tapi tetep sistematis. Kereen .
After replacing numbers: Aplikasinya enak simple. Tampilannya elegan. Tapi tetep sistematis. Kereen .
After case transformation: aplikasinya enak simple. tampilannya elegan. tapi tetep sistematis. kereen .
After tokenization: ['aplikasinya', 'enak', 'simple.', 'tampilannya', 'elegan.', 'tapi', 'tetep', 'sistematis.', 'kereen', '.']
After stopword removal: aplikasinya enak simple. tampilannya elegan. tetep sistematis. kereen .
After stemming: aplikasi enak simple tampil elegan tetep sistematis kereen
------
Original: bagus dan memudahkan untuk membuat jadwal
After replacing numbers: bagus dan memudahkan untuk membuat jadwal
After case transformation: bagus dan memudahkan untuk membuat jadwal
After tokenization: ['bagus', 'dan', 'memudahkan', 'untuk', 'membuat', 'jadwal']
After stopword removal: bagus memudahkan jadwal
After stemming: ba

After stemming: mantappp aplikasi manfaat bangettt team kerja
------
Original: Bagus,ui nya nggak ribet
After replacing numbers: Bagus,ui nya nggak ribet
After case transformation: bagus,ui nya nggak ribet
After tokenization: ['bagus,ui', 'nya', 'nggak', 'ribet']
After stopword removal: bagus,ui nya nggak ribet
After stemming: bagus ui nya nggak ribet
------
Original: Sangat membantu sekali...
After replacing numbers: Sangat membantu sekali...
After case transformation: sangat membantu sekali...
After tokenization: ['sangat', 'membantu', 'sekali...']
After stopword removal: membantu sekali...
After stemming: bantu sekali
------
Original: Aplikasi simple dan ga ribet tapi work
After replacing numbers: Aplikasi simple dan ga ribet tapi work
After case transformation: aplikasi simple dan ga ribet tapi work
After tokenization: ['aplikasi', 'simple', 'dan', 'ga', 'ribet', 'tapi', 'work']
After stopword removal: aplikasi simple ga ribet work
After stemming: aplikasi simple ga ribet work
----

After stemming: bantu proses pantau an kerja karyawan terimakasih
------
Original: Saya suka aplikasi ini tidak terlalu berat justru ringan walaupun di ponsel kelas bawah seperti yang saya miliki Aplikasi ini cukup penting untuk aktivitasKu sehari hari Good Job ðŸ‘ðŸŒŸâœ¨ Very Good ðŸŒŸðŸŒŸðŸŒŸðŸŒŸðŸŒŸ
After replacing numbers: Saya suka aplikasi ini tidak terlalu berat justru ringan walaupun di ponsel kelas bawah seperti yang saya miliki Aplikasi ini cukup penting untuk aktivitasKu sehari hari Good Job ðŸ‘ðŸŒŸâœ¨ Very Good ðŸŒŸðŸŒŸðŸŒŸðŸŒŸðŸŒŸ
After case transformation: saya suka aplikasi ini tidak terlalu berat justru ringan walaupun di ponsel kelas bawah seperti yang saya miliki aplikasi ini cukup penting untuk aktivitasku sehari hari good job ðÿ‘ðÿœÿâœ¨ very good ðÿœÿðÿœÿðÿœÿðÿœÿðÿœÿ
After tokenization: ['saya', 'suka', 'aplikasi', 'ini', 'tidak', 'terlalu', 'berat', 'justru', 'ringan', 'walaupun', 'di', 'ponsel', 'kelas', 'bawah', 'seperti', 'yang', 'saya', 'miliki', 'aplikasi',

After stemming: bantu lupa mengorganize dilakukam
------
Original: Lumayan untuk mengatur waktu dan mencatat tugas. Dan ini bisa langsung terkoneksi ke laptop
After replacing numbers: Lumayan untuk mengatur waktu dan mencatat tugas. Dan ini bisa langsung terkoneksi ke laptop
After case transformation: lumayan untuk mengatur waktu dan mencatat tugas. dan ini bisa langsung terkoneksi ke laptop
After tokenization: ['lumayan', 'untuk', 'mengatur', 'waktu', 'dan', 'mencatat', 'tugas.', 'dan', 'ini', 'bisa', 'langsung', 'terkoneksi', 'ke', 'laptop']
After stopword removal: lumayan mengatur mencatat tugas. langsung terkoneksi laptop
After stemming: lumayan atur catat tugas langsung koneksi laptop
------
Original: Mudah dan enak digunakan untuk mengatur kegiatan/tugas sehari-hari. Membantu mengingatkan dan mendetailkan perencanaan.
After replacing numbers: Mudah dan enak digunakan untuk mengatur kegiatan/tugas sehari-hari. Membantu mengingatkan dan mendetailkan perencanaan.
After case transfor

After stemming: aplikasi bagus banget darkmodenya
------
Original: Microsoft is the best Rekomendasi : Coba microsoft buat app telefon dan program microsoft childarien
After replacing numbers: Microsoft is the best Rekomendasi : Coba microsoft buat app telefon dan program microsoft childarien
After case transformation: microsoft is the best rekomendasi : coba microsoft buat app telefon dan program microsoft childarien
After tokenization: ['microsoft', 'is', 'the', 'best', 'rekomendasi', ':', 'coba', 'microsoft', 'buat', 'app', 'telefon', 'dan', 'program', 'microsoft', 'childarien']
After stopword removal: microsoft is the best rekomendasi : coba microsoft app telefon program microsoft childarien
After stemming: microsoft is the best rekomendasi coba microsoft app telefon program microsoft childarien
------
Original: Sangat efektif
After replacing numbers: Sangat efektif
After case transformation: sangat efektif
After tokenization: ['sangat', 'efektif']
After stopword removal: efektif
A

After stemming: bantu tugas sekolah masa pandemi ini ya nama aplikasi buat manu kurang pas sayaa skla makasih bantu enam
------
Original: Aplikasi yang sangat bermanfaat untuk menagty tugas yang akan dilakukan dengan rapi :D
After replacing numbers: Aplikasi yang sangat bermanfaat untuk menagty tugas yang akan dilakukan dengan rapi :D
After case transformation: aplikasi yang sangat bermanfaat untuk menagty tugas yang akan dilakukan dengan rapi :d
After tokenization: ['aplikasi', 'yang', 'sangat', 'bermanfaat', 'untuk', 'menagty', 'tugas', 'yang', 'akan', 'dilakukan', 'dengan', 'rapi', ':d']
After stopword removal: aplikasi bermanfaat menagty tugas rapi :d
After stemming: aplikasi manfaat menagty tugas rapi d
------
Original: Pertama kali pakai dapat aplikasi yang ga berat tapi bisa sesuai keinginan, jadi bisa ngatur list sesuai kebutuhan. Nanti beberapa bulan kedepan bakalan kasih penilaian lagi.
After replacing numbers: Pertama kali pakai dapat aplikasi yang ga berat tapi bisa sesuai 

After stemming: saran setting opacity todoist tarik tampil widget background widget nya wallpaper langsung kes limitless segi border nya moga guna bantu terimakasih
------
Original: terimakasih sudah membantu kami..
After replacing numbers: terimakasih sudah membantu kami..
After case transformation: terimakasih sudah membantu kami..
After tokenization: ['terimakasih', 'sudah', 'membantu', 'kami..']
After stopword removal: terimakasih membantu kami..
After stemming: terimakasih bantu kami
------
Original: Aplikasi bosok tai ndasmu
After replacing numbers: Aplikasi bosok tai ndasmu
After case transformation: aplikasi bosok tai ndasmu
After tokenization: ['aplikasi', 'bosok', 'tai', 'ndasmu']
After stopword removal: aplikasi bosok tai ndasmu
After stemming: aplikasi bosok tai ndasmu
------
Original: Sangat membantu aplikasinya. Mudah di pakai dan simpel
After replacing numbers: Sangat membantu aplikasinya. Mudah di pakai dan simpel
After case transformation: sangat membantu aplikasinya. 

After stemming: bagus banget ngebuat produktif bye hidup tenang
------
Original: aplikasi bagus
After replacing numbers: aplikasi bagus
After case transformation: aplikasi bagus
After tokenization: ['aplikasi', 'bagus']
After stopword removal: aplikasi bagus
After stemming: aplikasi bagus
------
Original: Keren, sangat membantu untuk membuat daftar tugas harian
After replacing numbers: Keren, sangat membantu untuk membuat daftar tugas harian
After case transformation: keren, sangat membantu untuk membuat daftar tugas harian
After tokenization: ['keren,', 'sangat', 'membantu', 'untuk', 'membuat', 'daftar', 'tugas', 'harian']
After stopword removal: keren, membantu daftar tugas harian
After stemming: keren bantu daftar tugas hari
------
Original: The Best App Pokoknya Buat Saya, Thanks Microsoft
After replacing numbers: The Best App Pokoknya Buat Saya, Thanks Microsoft
After case transformation: the best app pokoknya buat saya, thanks microsoft
After tokenization: ['the', 'best', 'app', 

After stemming: desain nya keren pake background foto pas awaldua susah paham
------
Original: Masih setia dengan wunderlist karena beberpa alasan.. tampilan wunderlist lebih nyaman, bisa coment list, ada tgl due date kecil dibawah setiap task, bisa singkron dengan google calendar via api wunderlist dll.
After replacing numbers: Masih setia dengan wunderlist karena beberpa alasan.. tampilan wunderlist lebih nyaman, bisa coment list, ada tgl due date kecil dibawah setiap task, bisa singkron dengan google calendar via api wunderlist dll.
After case transformation: masih setia dengan wunderlist karena beberpa alasan.. tampilan wunderlist lebih nyaman, bisa coment list, ada tgl due date kecil dibawah setiap task, bisa singkron dengan google calendar via api wunderlist dll.
After tokenization: ['masih', 'setia', 'dengan', 'wunderlist', 'karena', 'beberpa', 'alasan..', 'tampilan', 'wunderlist', 'lebih', 'nyaman,', 'bisa', 'coment', 'list,', 'ada', 'tgl', 'due', 'date', 'kecil', 'dibawah', 's

After stemming: terimakasih microsft mebuat aplikasi bantu kerja
------
Original: aplikasi super untuk super produktivitas..
After replacing numbers: aplikasi super untuk super produktivitas..
After case transformation: aplikasi super untuk super produktivitas..
After tokenization: ['aplikasi', 'super', 'untuk', 'super', 'produktivitas..']
After stopword removal: aplikasi super super produktivitas..
After stemming: aplikasi super super produktivitas
------
Original: aplikasi yang membantu mencatat tugas2 yang akan di lakukan, tanpa iklan dan full fitur. tolong di tambah calender, warna daftar dan personal kanban. trima kasih
After replacing numbers: aplikasi yang membantu mencatat tugasdua yang akan di lakukan, tanpa iklan dan full fitur. tolong di tambah calender, warna daftar dan personal kanban. trima kasih
After case transformation: aplikasi yang membantu mencatat tugasdua yang akan di lakukan, tanpa iklan dan full fitur. tolong di tambah calender, warna daftar dan personal kanban.

After stemming: lot koneksi nya
------
Original: Setelah saya coba mengatur beberapa hal di pengaturan, tiba-tiba gambar profil dan splashscreen bergerak seperti glitch. Begitu juga dengan menu pengaturan yang tidak bisa diakses. Mohon perbaikannya. ðŸ™Œ
After replacing numbers: Setelah saya coba mengatur beberapa hal di pengaturan, tiba-tiba gambar profil dan splashscreen bergerak seperti glitch. Begitu juga dengan menu pengaturan yang tidak bisa diakses. Mohon perbaikannya. ðŸ™Œ
After case transformation: setelah saya coba mengatur beberapa hal di pengaturan, tiba-tiba gambar profil dan splashscreen bergerak seperti glitch. begitu juga dengan menu pengaturan yang tidak bisa diakses. mohon perbaikannya. ðÿ™œ
After tokenization: ['setelah', 'saya', 'coba', 'mengatur', 'beberapa', 'hal', 'di', 'pengaturan,', 'tiba-tiba', 'gambar', 'profil', 'dan', 'splashscreen', 'bergerak', 'seperti', 'glitch.', 'begitu', 'juga', 'dengan', 'menu', 'pengaturan', 'yang', 'tidak', 'bisa', 'diakses.', 'moh

After stemming: sinkron remindernya aplikasi website
------
Original: Tidak berfungsi dengan baik
After replacing numbers: Tidak berfungsi dengan baik
After case transformation: tidak berfungsi dengan baik
After tokenization: ['tidak', 'berfungsi', 'dengan', 'baik']
After stopword removal: berfungsi
After stemming: fungsi
------
Original: Padahal enak makenya tpi tiba tiba akunku kekunci ngga ada solusi ngga ada SMS buat konfirmasi akun, password padahal juga bener
After replacing numbers: Padahal enak makenya tpi tiba tiba akunku kekunci ngga ada solusi ngga ada SMS buat konfirmasi akun, password padahal juga bener
After case transformation: padahal enak makenya tpi tiba tiba akunku kekunci ngga ada solusi ngga ada sms buat konfirmasi akun, password padahal juga bener
After tokenization: ['padahal', 'enak', 'makenya', 'tpi', 'tiba', 'tiba', 'akunku', 'kekunci', 'ngga', 'ada', 'solusi', 'ngga', 'ada', 'sms', 'buat', 'konfirmasi', 'akun,', 'password', 'padahal', 'juga', 'bener']
After s

After stemming: knapa sycn dgn d laptop ya sy login dgn email daftar tdk
------
Original: Ini aplikasi bagus banget
After replacing numbers: Ini aplikasi bagus banget
After case transformation: ini aplikasi bagus banget
After tokenization: ['ini', 'aplikasi', 'bagus', 'banget']
After stopword removal: aplikasi bagus banget
After stemming: aplikasi bagus banget
------
Original: Tidak ada notifikasinya
After replacing numbers: Tidak ada notifikasinya
After case transformation: tidak ada notifikasinya
After tokenization: ['tidak', 'ada', 'notifikasinya']
After stopword removal: notifikasinya
After stemming: notifikasi
------
Original: Membantu mencatat tugas tugas sekolah
After replacing numbers: Membantu mencatat tugas tugas sekolah
After case transformation: membantu mencatat tugas tugas sekolah
After tokenization: ['membantu', 'mencatat', 'tugas', 'tugas', 'sekolah']
After stopword removal: membantu mencatat tugas tugas sekolah
After stemming: bantu catat tugas tugas sekolah
------
Ori

After stemming: sincronisasi desktop mobile jalan
------
Original: ada bug
After replacing numbers: ada bug
After case transformation: ada bug
After tokenization: ['ada', 'bug']
After stopword removal: bug
After stemming: bug
------
Original: Gak bisa digunakan
After replacing numbers: Gak bisa digunakan
After case transformation: gak bisa digunakan
After tokenization: ['gak', 'bisa', 'digunakan']
After stopword removal: gak
After stemming: gak
------
Original: bug
After replacing numbers: bug
After case transformation: bug
After tokenization: ['bug']
After stopword removal: bug
After stemming: bug
------
Original: banyak sekali bug pada widgetnya
After replacing numbers: banyak sekali bug pada widgetnya
After case transformation: banyak sekali bug pada widgetnya
After tokenization: ['banyak', 'sekali', 'bug', 'pada', 'widgetnya']
After stopword removal: bug widgetnya
After stemming: bug widgetnya
------
Original: Versi terbaru tidak stabil. Tidak bisa dibuka
After replacing numbers: V

After stemming: liat status on going done new
------
Original: tidak ada note
After replacing numbers: tidak ada note
After case transformation: tidak ada note
After tokenization: ['tidak', 'ada', 'note']
After stopword removal: note
After stemming: note
------
Original: tidak bisa menyusun agenda hari esok di malam hari
After replacing numbers: tidak bisa menyusun agenda hari esok di malam hari
After case transformation: tidak bisa menyusun agenda hari esok di malam hari
After tokenization: ['tidak', 'bisa', 'menyusun', 'agenda', 'hari', 'esok', 'di', 'malam', 'hari']
After stopword removal: menyusun agenda esok malam
After stemming: susun agenda esok malam
------
Original: tidak bisa menampilkan kategori seperti Outlook
After replacing numbers: tidak bisa menampilkan kategori seperti Outlook
After case transformation: tidak bisa menampilkan kategori seperti outlook
After tokenization: ['tidak', 'bisa', 'menampilkan', 'kategori', 'seperti', 'outlook']
After stopword removal: menampilk

After stemming: nge crash udah gitu gak simpan catat tulis wah tolong laku auto save
------
Original: Menambahkan banyak email sampah secara otomatis.
After replacing numbers: Menambahkan banyak email sampah secara otomatis.
After case transformation: menambahkan banyak email sampah secara otomatis.
After tokenization: ['menambahkan', 'banyak', 'email', 'sampah', 'secara', 'otomatis.']
After stopword removal: email sampah otomatis.
After stemming: email sampah otomatis
------
Original: Benar-benar mengerikan untuk mengatur ulang kata sandi setelah melupakannya. Saya mencoba dan terkunci setelah 4 kali mencoba. Saya mengikuti instruksi dan mereka membutuhkan kata sandi yang tidak perlu saya lanjuntukan.
After replacing numbers: Benar-benar mengerikan untuk mengatur ulang kata sandi setelah melupakannya. Saya mencoba dan terkunci setelah empat kali mencoba. Saya mengikuti instruksi dan mereka membutuhkan kata sandi yang tidak perlu saya lanjuntukan.
After case transformation: benar-benar

After stemming: henti baru kecewa
------
Original: Saya hanya perlu mentransfer todos saya ke email yang berbeda tpi malah gak bisa
After replacing numbers: Saya hanya perlu mentransfer todos saya ke email yang berbeda tpi malah gak bisa
After case transformation: saya hanya perlu mentransfer todos saya ke email yang berbeda tpi malah gak bisa
After tokenization: ['saya', 'hanya', 'perlu', 'mentransfer', 'todos', 'saya', 'ke', 'email', 'yang', 'berbeda', 'tpi', 'malah', 'gak', 'bisa']
After stopword removal: mentransfer todos email berbeda tpi gak
After stemming: transfer todos email beda tpi gak
------
Original: awalnya bagus tapi daftar tugas aku selalu kosong jadi terpaksa menghentikan aplikasi secara paksa
After replacing numbers: awalnya bagus tapi daftar tugas aku selalu kosong jadi terpaksa menghentikan aplikasi secara paksa
After case transformation: awalnya bagus tapi daftar tugas aku selalu kosong jadi terpaksa menghentikan aplikasi secara paksa
After tokenization: ['awalnya'

After stemming: coba lagi integrasi tugas kalender microsoft atau pun tugas tetap kalender aplikasi to-do task manager total show stopper saya terap coba lagi
------
Original: Tidak ada tag, tidak ada kalender, tidak ada subtugas
After replacing numbers: Tidak ada tag, tidak ada kalender, tidak ada subtugas
After case transformation: tidak ada tag, tidak ada kalender, tidak ada subtugas
After tokenization: ['tidak', 'ada', 'tag,', 'tidak', 'ada', 'kalender,', 'tidak', 'ada', 'subtugas']
After stopword removal: tag, kalender, subtugas
After stemming: tag kalender subtugas
------
Original: ngelag setelah kurang lebih 4 menit waktu baru dibuka
After replacing numbers: ngelag setelah kurang lebih empat menit waktu baru dibuka
After case transformation: ngelag setelah kurang lebih empat menit waktu baru dibuka
After tokenization: ['ngelag', 'setelah', 'kurang', 'lebih', 'empat', 'menit', 'waktu', 'baru', 'dibuka']
After stopword removal: ngelag menit dibuka
After stemming: ngelag menit buka

After stemming: gak login masukin kode loading
------
Original: widget Microsoft To Do gak sinkron
After replacing numbers: widget Microsoft To Do gak sinkron
After case transformation: widget microsoft to do gak sinkron
After tokenization: ['widget', 'microsoft', 'to', 'do', 'gak', 'sinkron']
After stopword removal: widget microsoft to do gak sinkron
After stemming: widget microsoft to do gak sinkron
------
Original: bangsat, kenapa gue harus login cuman buat ginian?
After replacing numbers: bangsat, kenapa gue harus login cuman buat ginian?
After case transformation: bangsat, kenapa gue harus login cuman buat ginian?
After tokenization: ['bangsat,', 'kenapa', 'gue', 'harus', 'login', 'cuman', 'buat', 'ginian?']
After stopword removal: bangsat, gue login cuman ginian?
After stemming: bangsat gue login cuman ginian
------
Original: Tidak akan membiarkan orang lain bergabung dalam daftar
After replacing numbers: Tidak akan membiarkan orang lain bergabung dalam daftar
After case transfor

After stemming: login akun ms live
------
Original: kata katanya terbatas ya?
After replacing numbers: kata katanya terbatas ya?
After case transformation: kata katanya terbatas ya?
After tokenization: ['kata', 'katanya', 'terbatas', 'ya?']
After stopword removal: terbatas ya?
After stemming: batas ya
------
Original: login di hp aman tapi pas login di device lain malah gak mau
After replacing numbers: login di hp aman tapi pas login di device lain malah gak mau
After case transformation: login di hp aman tapi pas login di device lain malah gak mau
After tokenization: ['login', 'di', 'hp', 'aman', 'tapi', 'pas', 'login', 'di', 'device', 'lain', 'malah', 'gak', 'mau']
After stopword removal: login hp aman pas login device gak
After stemming: login hp aman pas login device gak
------
Original: Tiba-tiba saya memiliki daftar tugas yang tidak dapat saya modifikasi.
After replacing numbers: Tiba-tiba saya memiliki daftar tugas yang tidak dapat saya modifikasi.
After case transformation: tib

After stemming: mampu masuk harga daftar kirim total
------
Original: Hati-hati, todo yang nyaris tidak berfungsi ini berhenti berfungsi jika tidak ada koneksi internet. Saya tidak suka Microsoft.
After replacing numbers: Hati-hati, todo yang nyaris tidak berfungsi ini berhenti berfungsi jika tidak ada koneksi internet. Saya tidak suka Microsoft.
After case transformation: hati-hati, todo yang nyaris tidak berfungsi ini berhenti berfungsi jika tidak ada koneksi internet. saya tidak suka microsoft.
After tokenization: ['hati-hati,', 'todo', 'yang', 'nyaris', 'tidak', 'berfungsi', 'ini', 'berhenti', 'berfungsi', 'jika', 'tidak', 'ada', 'koneksi', 'internet.', 'saya', 'tidak', 'suka', 'microsoft.']
After stopword removal: hati-hati, todo berfungsi berhenti berfungsi koneksi internet. suka microsoft.
After stemming: hati todo fungsi henti fungsi koneksi internet suka microsoft
------
Original: appnya bekerja sesuai mood, kadang mau kadang enggak
After replacing numbers: appnya bekerja sesu

After stemming: harap milik progress bar
------
Original: Tampilan daily task gak dioptimalkan .
After replacing numbers: Tampilan daily task gak dioptimalkan .
After case transformation: tampilan daily task gak dioptimalkan .
After tokenization: ['tampilan', 'daily', 'task', 'gak', 'dioptimalkan', '.']
After stopword removal: tampilan daily task gak dioptimalkan .
After stemming: tampil daily task gak optimal
------
Original: Saya ingin menggunakan aplikasi ini di tempat kerja untuk membantu mengatur prioritas tugas dan mengelola waktu lebih baik. Namun, meskipun aplikasi ini dapat diakses di komputer kerja, sayangnya saya tidak dapat menetapkan batas waktu untuk setiap tugas dan merencanakannya secara efektif.
After replacing numbers: Saya ingin menggunakan aplikasi ini di tempat kerja untuk membantu mengatur prioritas tugas dan mengelola waktu lebih baik. Namun, meskipun aplikasi ini dapat diakses di komputer kerja, sayangnya saya tidak dapat menetapkan batas waktu untuk setiap tuga

After stemming: ganti hp filenya hilang semua gimana
------
Original: gak bisa buka akun gara- gara ga punya nomor hpnya lagi
After replacing numbers: gak bisa buka akun gara- gara ga punya nomor hpnya lagi
After case transformation: gak bisa buka akun gara- gara ga punya nomor hpnya lagi
After tokenization: ['gak', 'bisa', 'buka', 'akun', 'gara-', 'gara', 'ga', 'punya', 'nomor', 'hpnya', 'lagi']
After stopword removal: gak buka akun gara- gara ga nomor hpnya
After stemming: gak buka akun gara- gara ga nomor hpnya
------
Original: Pengingatnya gak membantu
After replacing numbers: Pengingatnya gak membantu
After case transformation: pengingatnya gak membantu
After tokenization: ['pengingatnya', 'gak', 'membantu']
After stopword removal: pengingatnya gak membantu
After stemming: ingat gak bantu
------
Original: Bagikan aktivitas daftar secara default? Yang bener aja
After replacing numbers: Bagikan aktivitas daftar secara default? Yang bener aja
After case transformation: bagikan aktivi

After stemming: gue suka app bikin hp gue ngelag sampah hp gue hapusin
------
Original: ganggu banget dimintain otentikasi terus
After replacing numbers: ganggu banget dimintain otentikasi terus
After case transformation: ganggu banget dimintain otentikasi terus
After tokenization: ['ganggu', 'banget', 'dimintain', 'otentikasi', 'terus']
After stopword removal: ganggu banget dimintain otentikasi
After stemming: ganggu banget dimintain otentikasi
------
Original: Saya sudah mencoba beberapa kali untuk membuka aplikasi, tetapi tidak bisa. Pertama, ia meminta email atau mendaftar, saya memasukkan email saya setiap kali dan aplikasi terus memuat... kemudian layar langsung berubah putih.
After replacing numbers: Saya sudah mencoba beberapa kali untuk membuka aplikasi, tetapi tidak bisa. Pertama, ia meminta email atau mendaftar, saya memasukkan email saya setiap kali dan aplikasi terus memuat... kemudian layar langsung berubah putih.
After case transformation: saya sudah mencoba beberapa kal

After stemming: notifikasi you have tasks for today click here to see tampilin aja tulis langsung susah bener
------
Original: Wonderlist luar biasa! To do biasa aja
After replacing numbers: Wonderlist luar biasa! To do biasa aja
After case transformation: wonderlist luar biasa! to do biasa aja
After tokenization: ['wonderlist', 'luar', 'biasa!', 'to', 'do', 'biasa', 'aja']
After stopword removal: wonderlist biasa! to do aja
After stemming: wonderlist biasa to do aja
------
Original: fitur pentingnya banyak yang hilang
After replacing numbers: fitur pentingnya banyak yang hilang
After case transformation: fitur pentingnya banyak yang hilang
After tokenization: ['fitur', 'pentingnya', 'banyak', 'yang', 'hilang']
After stopword removal: fitur hilang
After stemming: fitur hilang
------
Original: Menyimpan terlalu banyak data pribadi
After replacing numbers: Menyimpan terlalu banyak data pribadi
After case transformation: menyimpan terlalu banyak data pribadi
After tokenization: ['menyimpa

After stemming: hahh tugas checklist doang
------
Original: Itu adalah aplikasi yang sangat bagus tapi habis pembaruan malah banyak bug di fitur hariku
After replacing numbers: Itu adalah aplikasi yang sangat bagus tapi habis pembaruan malah banyak bug di fitur hariku
After case transformation: itu adalah aplikasi yang sangat bagus tapi habis pembaruan malah banyak bug di fitur hariku
After tokenization: ['itu', 'adalah', 'aplikasi', 'yang', 'sangat', 'bagus', 'tapi', 'habis', 'pembaruan', 'malah', 'banyak', 'bug', 'di', 'fitur', 'hariku']
After stopword removal: aplikasi bagus habis pembaruan bug fitur hariku
After stemming: aplikasi bagus habis baru bug fitur hari
------
Original: susah karena ga bisa sinkronisasi dua arah
After replacing numbers: susah karena ga bisa sinkronisasi dua arah
After case transformation: susah karena ga bisa sinkronisasi dua arah
After tokenization: ['susah', 'karena', 'ga', 'bisa', 'sinkronisasi', 'dua', 'arah']
After stopword removal: susah ga sinkronis

After stemming: notifikasi bikin sakit kepala pas buka gaada apadua
------
Original: Bekerja dengan baik sebelum pembaruan tetapi sekarang saya tidak dapat masuk ke akun saya.
After replacing numbers: Bekerja dengan baik sebelum pembaruan tetapi sekarang saya tidak dapat masuk ke akun saya.
After case transformation: bekerja dengan baik sebelum pembaruan tetapi sekarang saya tidak dapat masuk ke akun saya.
After tokenization: ['bekerja', 'dengan', 'baik', 'sebelum', 'pembaruan', 'tetapi', 'sekarang', 'saya', 'tidak', 'dapat', 'masuk', 'ke', 'akun', 'saya.']
After stopword removal: pembaruan masuk akun saya.
After stemming: baru masuk akun saya
------
Original: Aplikasi sampah ini sudah mulai meminta KATA SANDI yang HANYA DIKETAHUI OLEH ROBOT DAN HACKER
After replacing numbers: Aplikasi sampah ini sudah mulai meminta KATA SANDI yang HANYA DIKETAHUI OLEH ROBOT DAN HACKER
After case transformation: aplikasi sampah ini sudah mulai meminta kata sandi yang hanya diketahui oleh robot dan hack

After stemming: ditanyain tugas gak bro ngapain nanya lo tau gaada ya ngapain notifikasi
------
Original: spam notifikasi
After replacing numbers: spam notifikasi
After case transformation: spam notifikasi
After tokenization: ['spam', 'notifikasi']
After stopword removal: spam notifikasi
After stemming: spam notifikasi
------
Original: antara ponsel dan web gak sinkron
After replacing numbers: antara ponsel dan web gak sinkron
After case transformation: antara ponsel dan web gak sinkron
After tokenization: ['antara', 'ponsel', 'dan', 'web', 'gak', 'sinkron']
After stopword removal: ponsel web gak sinkron
After stemming: ponsel web gak sinkron
------
Original: UNINSTALL
After replacing numbers: UNINSTALL
After case transformation: uninstall
After tokenization: ['uninstall']
After stopword removal: uninstall
After stemming: uninstall
------
Original: Mengapa Anda tidak bisa mengintegrasikan ini ke Outlook, mengapa saya perlu menginstal aplikasi lain?
After replacing numbers: Mengapa Anda

------
Original: Sayang sekali untuk verifikasi
After replacing numbers: Sayang sekali untuk verifikasi
After case transformation: sayang sekali untuk verifikasi
After tokenization: ['sayang', 'sekali', 'untuk', 'verifikasi']
After stopword removal: sayang verifikasi
After stemming: sayang verifikasi
------
Original: Mengedit ulasan dan peringkat, karena berhenti berfungsi di MacBook.
After replacing numbers: Mengedit ulasan dan peringkat, karena berhenti berfungsi di MacBook.
After case transformation: mengedit ulasan dan peringkat, karena berhenti berfungsi di macbook.
After tokenization: ['mengedit', 'ulasan', 'dan', 'peringkat,', 'karena', 'berhenti', 'berfungsi', 'di', 'macbook.']
After stopword removal: mengedit ulasan peringkat, berhenti berfungsi macbook.
After stemming: edit ulas peringkat henti fungsi macbook
------
Original: kecewa sama aplikasinya, mending ke aplikasi lain aja
After replacing numbers: kecewa sama aplikasinya, mending ke aplikasi lain aja
After case transfor

After stemming: masuk daftar tugas hapus instalan
------
Original: Aplikasi seperti ini seharusnya dapat digunakan tanpa akun Microsoft.
After replacing numbers: Aplikasi seperti ini seharusnya dapat digunakan tanpa akun Microsoft.
After case transformation: aplikasi seperti ini seharusnya dapat digunakan tanpa akun microsoft.
After tokenization: ['aplikasi', 'seperti', 'ini', 'seharusnya', 'dapat', 'digunakan', 'tanpa', 'akun', 'microsoft.']
After stopword removal: aplikasi akun microsoft.
After stemming: aplikasi akun microsoft
------
Original: Tidak berfungsi seperti yang diharapkan. Bahkan setelah menambahkan tugas, itu tidak muncul di layar.
After replacing numbers: Tidak berfungsi seperti yang diharapkan. Bahkan setelah menambahkan tugas, itu tidak muncul di layar.
After case transformation: tidak berfungsi seperti yang diharapkan. bahkan setelah menambahkan tugas, itu tidak muncul di layar.
After tokenization: ['tidak', 'berfungsi', 'seperti', 'yang', 'diharapkan.', 'bahkan', 's