Library untuk preprocessing teks bahasa Indonesia, mencakup:
- Case folding (mengubah teks menjadi huruf kecil).
- Pembersihan teks dari URL, tanda baca, angka, dan lainnya.
- Tokenisasi teks menjadi daftar kata.
- Penghapusan stopwords bawaan library.
- Normalisasi kata tidak baku ke kata baku dengan kamus bawaan.
- Penghapusan duplikat berdasarkan teks yang telah diproses.
Instal library melalui PyPI:
Di Sarankan Install Lates Verison ini
pip install asro_preprocessing==0.1.1