- (NorHashimah)
- (2003)
Nor Hashimah Jalaluddin. 2003. Bahasa dalam Perniagaan: Satu Analisis Semantik dan Pragmatik. Kuala Lumpur: Dewan Bahasa dan Pustaka. - (2005)
Nor Hashimah Jalaluddin, Harishon Radzi, Maslida Yusof, Raja Masittah Raja Ariffin dan Sa’adiah Ma’alip. 2005. Sistem Panggilan dalam Keluarga Melayu: Satu Dokumentasi. Kuala Lumpur: Dewan Bahasa dan Pustaka.
- (2003)
- Hiroki Nomoto. 2018. Korpus Variasi Bahasa Melayu: Standard Lisan.
- (Untuk anotasi pengganti ganti nama [pronoun substitute])
Nomoto, Hiroki, Ryuko Taniguchi, Shiori Nakamura, Yunjin Nam, Sri Budi Lestari, Sunisa Wittayapanyanon (Saito), Virach Sornlertlamvanich, Atsushi Kasuga, Kenji Okano dan Thuzar Hlaing. 2023. Pronoun substitute annotation in seven Asian languages. Proceedings of the Twenty-Ninth Annual Meeting of the Association for Natural Language Processing, 2242-2247. - (Untuk anotasi ganti nama kosong)
Nomoto, Hiroki, Farhan Athirah binti Abdul Razak dan Kohei Fujita. 2025. Zero pronoun annotation in Malay and beyond. Proceedings of the Thirty-First Annual Meeting of the Association for Natural Language Processing, 391-396.
Creative Commons Attribution 4.0 International (CC BY 4.0)
Fail | Topik | Jenis | Durasi | Jumlah token | ID penutur | Tempat asal penutur |
---|---|---|---|---|---|---|
KL201701 | Musang dan gagak (dengan gambar) | Monolog | 2:21 | 235 | 1 | Johor |
KL201702 | Musang dan gagak (tanpa gambar) | Monolog | 1:30 | 182 | 1 | Johor |
KL201703 | Musang dan gagak (sebagai watak) | Monolog | 1:27 | 182 | 1 | Johor |
KL201704 | Musang dan gagak (dengan gambar) | Monolog | 1:31 | 175 | 2 | Johor |
KL201705 | Musang dan gagak (tanpa gambar) | Monolog | 1:19 | 165 | 2 | Johor |
KL201706 | Musang dan gagak (sebagai watak) | Monolog | 1:09 | 145 | 2 | Johor |
KL201707 | Cerita gembira | Monolog | 1:03 | 135 | 2 | Johor |
KL201708 | Cerita sedih | Monolog | 0:51 | 103 | 2 | Johor |
KL201709 | Cerita rakyat | Monolog | 3:26 | 417 | 2 | Johor |
KL201710 | Cerita gembira | Monolog | 1:21 | 181 | 1 | Johor |
KL201711 | Cerita sedih | Monolog | 1:25 | 161 | 1 | Johor |
KL201712 | Cerita rakyat | Monolog | 3:07 | 378 | 1 | Johor |
KL201713 | Cerita gembira | Monolog | 0:55 | 129 | 3 | Kuala Lumpur |
KL201714 | Cerita sedih | Monolog | 1:50 | 225 | 3 | Kuala Lumpur |
KL201715 | Cerita rakyat | Monolog | 2:56 | 364 | 3 | Kuala Lumpur |
KL201716 | Musang dan gagak (dengan gambar) | Monolog | 1:31 | 179 | 4 | Negeri Sembilan |
KL201717 | Musang dan gagak (tanpa gambar) | Monolog | 0:56 | 150 | 4 | Negeri Sembilan |
KL201718 | Musang dan gagak (sebagai watak) | Monolog | 1:46 | 209 | 4 | Negeri Sembilan |
KL201719 | Cerita gembira | Monolog | 0:45 | 117 | 4 | Negeri Sembilan |
KL201720 | Cerita sedih | Monolog | 1:27 | 259 | 4 | Negeri Sembilan |
KL201721 | Cerita rakyat | Monolog | 1:52 | 267 | 4 | Negeri Sembilan |
KL201722 | Musang dan gagak (dengan gambar) | Monolog | 1:37 | 167 | 5 | Negeri Sembilan |
KL201723 | Musang dan gagak (tanpa gambar) | Monolog | 1:08 | 120 | 5 | Negeri Sembilan |
KL201724 | Musang dan gagak (sebagai watak) | Monolog | 1:40 | 181 | 5 | Negeri Sembilan |
KL201725 | Cerita gembira | Monolog | 0:43 | 93 | 5 | Negeri Sembilan |
KL201726 | Cerita sedih | Monolog | 1:03 | 148 | 5 | Negeri Sembilan |
KL201727 | Cerita rakyat | Monolog | 1:44 | 220 | 5 | Negeri Sembilan |
KL201728 | Musang dan gagak (dengan gambar) | Monolog | 1:03 | 132 | 6 | Sabah |
KL201729 | Musang dan gagak (tanpa gambar) | Monolog | 0:45 | 100 | 6 | Sabah |
KL201730 | Musang dan gagak (sebagai watak) | Monolog | 1:55 | 239 | 6 | Sabah |
KL201731 | Cerita gembira | Monolog | 0:38 | 67 | 6 | Sabah |
KL201732 | Cerita sedih | Monolog | 1:09 | 153 | 6 | Sabah |
KL201733 | Cerita rakyat (Huminodun) | Monolog | 1:29 | 183 | 6 | Sabah |
Jumlah | 49:22 | 6,161 |
- /// = hentian sejenak
- < > = ujaran serentak
- ### = tidak jelas
- PN = nama peribadi
XXX.txt
teks asal tanpa anotasiXXX-prodrop.jsonl
anotasi ganti nama kosong dalam format jsonlXXX-prodrop.txt
anotasi ganti nama kosong dalam format yang dibataskan tabXXX-prodrop_inserted.txt
teks asal dengan tag anotasi disisipkanXXX-prosub.jsonl
anotatsi pengganti ganti nama dalam format jsonlXXX-prosub.txt
anotatsi pengganti ganti nama dalam format yang dibataskan tab
Fail anotasi dalam format yang dibataskan tab (XXX-prodrop.txt
dan XXX-prosub.txt
) boleh disuap kepada ETA: Easy Text Annotator bersama dengan fail teks asal (XXX.txt
) untuk memvisualisasikan anotasi dalam pelayar. Dengan menggunakan ETA, anda juga mengubah anotasi dan menjana jadual ringkasan anotasi yang boleh dibukan dengan MS Excel dan sebagainya.
Anotasi diberi token selepas kedudukan ganti nama kosong (zero pronoun).
1st
orang pertama2nd
orang kedua3rd
orang ketigaS
subjekDO
objek langsungIO
objek tak langsungP
pemilik
Lihat Nomoto dkk. (2025) untuk maklumat lanjut.
Anotasi diberi pada ungkapan-ungkapan yang merujuk kepada penutur dan pendengar, baik ganti nama (pronoun) mahupun pengganti ganti nama (pronoun substitute), serta ungkapan panggilan (address term).
1st
kata ganti nama dan pengganti ganti nama yang orang pertama2nd
orang keduaaddress
ungkapan panggilan
Lihat Nomoto dkk. (2023) untuk maklumat lanjut.