Thai natural language processing in Python.
PyThaiNLP is a python module similar to nltk
, but it's working primarily on
Thai language instead of English.
It supports both Python 2.7 and Python 3.
Developing
1.5
- Thai segment
- Thai wordnet
- Thai Character Clusters (TCC) and ETCC
- Thai stop word
- Thai meta sound
- Thai soundex
- Thai postaggers
- Thai romanization
- Thai misspellings detection and correction
and much more.
using pip.
$ pip install pythainlp
Install on Windows
Download pyicu
from http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu then install pyicu
. Install pythainlp
using pip
.
pip install pythainlp
Install on MacOS
$ brew install icu4c --force
$ brew link --force icu4c
$ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip install pythainlp
Read on https://github.com/wannaphongcom/pythainlp/blob/dev/docs/pythainlp-1-4-eng.md
Develop : Read on https://github.com/wannaphongcom/pythainlp/blob/dev/docs/pythainlp-1-5-eng.md
Apache Software License 2.0
ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python
Natural language processing หรือ การประมวลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่อพัฒนาการประมวลภาษาธรรมชาติภาษาไทยในภาษา Python และมันฟรี (ตลอดไป) เพื่อคนไทยและชาวโลกทุกคน !
เพราะโลกขับเคลื่อนต่อไปด้วยการแบ่งปัน
รองรับ Python 2.7 และ Python 3
- หน้าหลัก GitHub : https://github.com/wannaphongcom/pythainlp
กำลังพัฒนา
1.5
- กลับมารองรับ Python 2.7 แล้ว
- ตัดคำภาษาไทย
- ถอดเสียงภาษาไทยเป็น Latin
- Postaggers ภาษาไทย
- อ่านตัวเลขเป็นข้อความภาษาไทย
- เรียงจำนวนคำของประโยค
- แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
- เช็คคำผิดในภาษาไทย
- รองรับ Thai Character Clusters (TCC) และ ETCC
- Thai WordNet
- Stop Word ภาษาไทย
- Meta Sound ภาษาไทย
- Thai Soundex
- และอื่น ๆ
รองรับ Python 2.7 และ Python 3
รุ่นเสถียร
$ pip install pythainlp
วิธีติดตั้งสำหรับ Windows
ให้ทำการติดตั้ง pyicu โดยใช้ไฟล์ .whl จาก http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu
หากใช้ python 3.5 64 bit ให้โหลด PyICU‑1.9.7‑cp35‑cp35m‑win_amd64.whl แล้วเปิด cmd ใช้คำสั่ง
pip install PyICU‑1.9.7‑cp35‑cp35m‑win_amd64.whl
แล้วจึงใช้
pip install pythainlp
ติดตั้งบน Mac
$ brew install icu4c --force
$ brew link --force icu4c
$ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip install pythainlp
ข้อมูลเพิ่มเติม คลิกที่นี้
อ่านได้ที่ https://github.com/wannaphongcom/pythainlp/blob/pythainlp1.4/docs/pythainlp-1-4-thai.md
เอกสารนักพัฒนา : Read on https://github.com/wannaphongcom/pythainlp/blob/dev/docs/pythainlp-1-5-thai.md
Apache Software License 2.0
พัฒนาโดย นาย วรรณพงษ์ ภัททิยไพบูลย์
คุณสามารถร่วมพัฒนาโครงการนี้ได้ โดยการ Fork และส่ง pull requests กลับมา