Bahasa Indonesia Language Processing
Dibuat untuk membantu pemrosesan Twitter yang menggunakan bahasa Indonesia. Disertakan data berupa crawling hasil penelitian analisis sentimen saat Pemilu 2014. Dalam repository ini juga disediakan kamus singkatan (abbreviation) yang biasa digunakan oleh tweeps berbahasa Indonesia. Untuk kamus slang yang lebih lengkap, silakan cek repositori ini yang dikerjakan oleh mahasiswa saya.
Repositori ini juga mencantumkan stoplist yang didasarkan dari [1].
Author:
- Ali Akbar Septiandri (@aliakbars)
- Wisnu Aribowo (@waribowo_)
Referensi:
- Tala, F. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. M.S. thesis. M.Sc. Thesis. Master of Logic Project. Institute for Logic, Language and Computation. Universiteti van Amsterdam The Netherlands.