Skip to content

wannaphong/IsanNLP

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

IsanNLP

corpus licensed under CC-BY 3.0

The Isan NLP porject want to develop Northeast Thailand local language tool for natural language processing tasks and want to preserve these languages.

Isan NLP เป็นโครงการพัฒนาการประมวลผลภาษาท้องถิ่นของภาคตะวันออกเฉียงเหนือ

ภาษาอีสานไม่มีจริง - อ้างอิง ไม่มีภาษาอีสานในโลกใบนี้ : อีสานใหม่

สาเหตุที่พัฒนา เพื่ออนุรักษ์ภาษาถิ่นในพื้นที่ภาคตะวันออกเฉียงเหนือของประเทศไทย

Support language

  • Korat language (ภาษาโคราช) - List word only
  • Nangrong language (ภาษานางรอง) - List word, Thai words, a few wordnet id, a few example.
  • Phu Thai language (ภาษาผู้ไท) - WIP

Features

  • Word tokenizer with korat words and nangrong words

WIP

Install

pip install IsanNLP