Skip to content

asroharun6/asro_preprocessing

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

Asro Preprocessing

Library untuk preprocessing teks bahasa Indonesia, mencakup:

  • Case folding (mengubah teks menjadi huruf kecil).
  • Pembersihan teks dari URL, tanda baca, angka, dan lainnya.
  • Tokenisasi teks menjadi daftar kata.
  • Penghapusan stopwords bawaan library.
  • Normalisasi kata tidak baku ke kata baku dengan kamus bawaan.
  • Penghapusan duplikat berdasarkan teks yang telah diproses.

Instalasi

Instal library melalui PyPI:

Di Sarankan Install Lates Verison ini
pip install asro_preprocessing==0.1.1      

About

Asro Preprocessing

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages