Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
71 commits
Select commit Hold shift + click to select a range
6245a12
start pythainlp 1.4!
wannaphong Jun 4, 2017
a196d9a
add new wordnet api
wannaphong Jun 4, 2017
ddfad45
fix test
wannaphong Jun 4, 2017
1941ef1
add Trie in mm
wannaphong Jun 4, 2017
d654a1c
add docs
wannaphong Jun 5, 2017
fc6dab6
del old api
wannaphong Jun 5, 2017
6e5a63e
fix error in hunspell
wannaphong Jun 5, 2017
d2f79f7
fix pyicu
wannaphong Jun 5, 2017
7d58eca
add data to stopwords
wannaphong Jun 12, 2017
84ef982
fix stopwords
wannaphong Jun 12, 2017
2333680
add new data to stopwords
wannaphong Jun 12, 2017
3904f31
fix mm
wannaphong Jun 13, 2017
b56eccc
fix bug https://github.com/wannaphongcom/pythainlp/issues/24
wannaphong Jun 13, 2017
7389a57
del old file
wannaphong Jun 13, 2017
5320308
fix mm
wannaphong Jun 13, 2017
e9159a2
mm เปลี่ยนไปใช้ newdict
wannaphong Jun 19, 2017
880c478
add tcc and etcc
wannaphong Jun 20, 2017
7707c19
add docs 1.4
wannaphong Jun 20, 2017
fd8dbae
fix pip install
wannaphong Jun 20, 2017
f6b310b
add pylexto
wannaphong Jun 20, 2017
ee0820c
update docs
wannaphong Jun 20, 2017
d8fda84
add - หลักเกณฑ์การถอดอักษรไทยเป็นอักษรโรมัน ฉบับราชบัณฑิตยสถาน
wannaphong Jun 20, 2017
209757c
update docs
wannaphong Jun 20, 2017
1fa20bd
update docs
wannaphong Jun 20, 2017
2ed3228
fix royin
wannaphong Jun 20, 2017
8566031
new tcc
wannaphong Jun 21, 2017
3a46b60
new code
wannaphong Jun 21, 2017
d6f8720
add corpus_license.md
wannaphong Jun 21, 2017
94eaead
fix data
wannaphong Jun 21, 2017
504f669
add Meta Sound
wannaphong Jun 22, 2017
54e22da
add TCC References
wannaphong Jun 22, 2017
e7adba4
add thai soundex
wannaphong Jun 25, 2017
d77a54d
add thai soundex api
wannaphong Jun 25, 2017
da9edc0
add extract_keyword
wannaphong Jun 26, 2017
d6059ae
add coveralls
wannaphong Jun 27, 2017
92f16b2
fix travis
wannaphong Jun 27, 2017
7a1b5b4
fix travis
wannaphong Jun 27, 2017
a6cf0aa
fix appveyor
wannaphong Jun 27, 2017
60a99b0
add coveralls
wannaphong Jun 27, 2017
8d3a108
fix coveralls
wannaphong Jun 27, 2017
a77a82e
fix coveralls
wannaphong Jun 27, 2017
850e317
fix test
wannaphong Jun 27, 2017
170b9cc
add test
wannaphong Jun 27, 2017
1c1e0d0
add test
wannaphong Jun 27, 2017
c6dddac
fix install wordnet
wannaphong Jun 27, 2017
91cd669
add test
wannaphong Jun 27, 2017
cb655f5
fix test
wannaphong Jun 27, 2017
137eae7
เพิ่มประสิทธิภาพโค้ด
wannaphong Jun 28, 2017
04afe97
เพิ่มประสิทธิภาพโค้ด 2
wannaphong Jun 28, 2017
db2835f
เพิ่มเอกสารของ Corpus
wannaphong Jun 28, 2017
10813c1
เพิมประสิทธิภาพ 3
wannaphong Jun 28, 2017
2e305ff
เพิ่มประสิทธิภาพ 4
wannaphong Jun 28, 2017
d4a9ad1
เพิ่มประสิทธิภาพ 5
wannaphong Jun 28, 2017
47c1b30
เพิ่มประสิทธิภาพโค้ด 6
wannaphong Jun 28, 2017
9483c4e
add Udom83
wannaphong Jul 3, 2017
101499a
add stopword in rank
wannaphong Jul 3, 2017
41e940c
add api
wannaphong Jul 5, 2017
ed0ff68
add newmm
wannaphong Jul 5, 2017
eb4c4c3
add deepcut
wannaphong Jul 5, 2017
296693b
fix newmm
wannaphong Jul 5, 2017
a1647d3
เพิ่มคำเตือนในเอกสาร
wannaphong Jul 5, 2017
318ff1d
add listcut
wannaphong Jul 5, 2017
a4ecb0b
fix newmm
wannaphong Jul 5, 2017
0b2740a
fix newmm #2
wannaphong Jul 5, 2017
a54eebc
fix code
wannaphong Jul 5, 2017
69867fa
add pythainlp.util
wannaphong Jul 6, 2017
5dff1d0
add eng
wannaphong Jul 6, 2017
02d7db6
fix docs
wannaphong Jul 6, 2017
b9b8fcb
fix docs
wannaphong Jul 6, 2017
3c895ea
fix bug in pyicu
wannaphong Jul 6, 2017
ec0afd1
1.4: Auto stash before merge of "pythainlp1.4" and "origin/pythainlp1.4"
wannaphong Jul 6, 2017
File filter

Filter by extension

Filter by extension


Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
10 changes: 7 additions & 3 deletions .travis.yml
Original file line number Diff line number Diff line change
Expand Up @@ -3,17 +3,21 @@

language: python
python:
- "2.7"
- "3.4"
- "3.5"
- "3.6"
# command to install dependencies, e.g. pip install -r requirements.txt --use-mirrors
install: pip install -U tox
install:
- pip install -r requirements-travis.txt
- pip install coveralls

os:
- linux
# command to run tests, e.g. python setup.py test
script: python setup.py test
script:
coverage run --source=pythainlp setup.py test
after_success:
coveralls

# After you create the Github repo and add it to Travis, run the
# travis_pypi_setup.py script to finish PyPI deployment setup
Expand Down
5 changes: 5 additions & 0 deletions AUTHORS.rst
Original file line number Diff line number Diff line change
Expand Up @@ -7,6 +7,11 @@ Development Lead

* Wannaphong Phatthiyaphaibun <wannaphong@yahoo.com>

TCC & THAI SOUNDEX CODE
------------

* Korakot Chaovavanich

Contributors
------------

Expand Down
114 changes: 0 additions & 114 deletions CONTRIBUTING.rst

This file was deleted.

96 changes: 88 additions & 8 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,26 +2,101 @@
[![PyPI Downloads](https://img.shields.io/pypi/dm/pythainlp.png)]
[![pypi](https://img.shields.io/pypi/v/pythainlp.svg)](https://pypi.python.org/pypi/pythainlp)
[![Build Status](https://travis-ci.org/wannaphongcom/pythainlp.svg?branch=develop)](https://travis-ci.org/wannaphongcom/pythainlp)
[![Build status](https://ci.appveyor.com/api/projects/status/uxerymgggp1uch0p?svg=true)](https://ci.appveyor.com/project/wannaphongcom/pythainlp)
[![Build status](https://ci.appveyor.com/api/projects/status/uxerymgggp1uch0p?svg=true)](https://ci.appveyor.com/project/wannaphongcom/pythainlp)[![Code Issues](https://www.quantifiedcode.com/api/v1/project/7f699ed4cad24be18d0d24ebd60d7543/badge.svg)](https://www.quantifiedcode.com/app/project/7f699ed4cad24be18d0d24ebd60d7543)[![Coverage Status](https://coveralls.io/repos/github/wannaphongcom/pythainlp/badge.svg?branch=pythainlp1.4)](https://coveralls.io/github/wannaphongcom/pythainlp?branch=pythainlp1.4)

## English

Homepages :[https://sites.google.com/view/pythainlp/home](https://sites.google.com/view/pythainlp/home)
Thai natural language processing in Python.

PyThaiNLP is python module like nltk , but It's working with thai language.

It's support python 3.4 +.

### Project status

Developing

### Version

1.4

### Capability

- Thai segment
- Thai wordnet
- Thai Character Clusters (TCC) and ETCC
- Thai stop word
- Thai meta sound
- Thai soundex
- Thai postaggers
- Thai romanization
- Check the wrong words in Thai.

and much more.

### Install

**using pip.**

```sh
$ pip install pythainlp
```

**Install in Windows**

download pyicu from [http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu](http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu) than install pyicu. install pythainlp using pip.

```
pip install pythainlp
```

**Install in MacOS**

```sh
$ brew install icu4c --force
$ brew link --force icu4c
$ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip install pythainlp
```

### Documentation

Read on https://github.com/wannaphongcom/pythainlp/blob/pythainlp1.4/docs/pythainlp-1-4-eng.md

### License

Apache Software License 2.0

## ภาษาไทย

[![PyPI Downloads](https://img.shields.io/pypi/dm/pythainlp.png)]
[![pypi](https://img.shields.io/pypi/v/pythainlp.svg)](https://pypi.python.org/pypi/pythainlp)
[![Build Status](https://travis-ci.org/wannaphongcom/pythainlp.svg?branch=develop)](https://travis-ci.org/wannaphongcom/pythainlp)
[![Build status](https://ci.appveyor.com/api/projects/status/uxerymgggp1uch0p?svg=true)](https://ci.appveyor.com/project/wannaphongcom/pythainlp)[![Code Issues](https://www.quantifiedcode.com/api/v1/project/7f699ed4cad24be18d0d24ebd60d7543/badge.svg)](https://www.quantifiedcode.com/app/project/7f699ed4cad24be18d0d24ebd60d7543)[![Coverage Status](https://coveralls.io/repos/github/wannaphongcom/pythainlp/badge.svg?branch=pythainlp1.4)](https://coveralls.io/github/wannaphongcom/pythainlp?branch=pythainlp1.4)

ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python

Natural language processing หรือ การประมวลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่องานวิจัยและพัฒนาการประมวลภาษาธรรมชาติภาษาไทยในภาษา Python
Natural language processing หรือ การประมวลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่อพัฒนาการประมวลภาษาธรรมชาติภาษาไทยในภาษา Python และ**มันฟรี (ตลอดไป) เพื่อคนไทยและชาวโลกทุกคน !**

> เพราะโลกขับเคลื่อนต่อไปด้วยการแบ่งปัน

รองรับ Python 3.4 ขึ้นไป

- เอกสารการใช้งาน : [https://sites.google.com/view/pythainlp/home](https://sites.google.com/view/pythainlp/home)
- หน้าหลัก GitHub : [https://github.com/wannaphongcom/pythainlp](https://github.com/wannaphongcom/pythainlp)

### สถานะโครงการ

กำลังพัฒนา

### Version
1.3
1.4

### สิ่งใหม่ที่เพิ่มเข้ามาใน PyThaiNLP 1.4

- รองรับ Thai Character Clusters (TCC) และ ETCC
- Thai WordNet ตัวใหม่
- เพิ่มหลักเกณฑ์การถอดอักษรไทยเป็นอักษรโรมัน ฉบับราชบัณฑิตยสถาน
- เพิ่ม Meta Sound ภาษาไทย
- เพิ่ม Thai Soundex

### ความสามารถ
- ตัดคำภาษาไทย
Expand All @@ -31,9 +106,14 @@ Natural language processing หรือ การประมวลภาษา
- เรียงจำนวนคำของประโยค
- แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
- เช็คคำผิดในภาษาไทย
- รองรับ Thai Character Clusters (TCC) และ ETCC
- Thai WordNet
- Stop Word ภาษาไทย
- Meta Sound ภาษาไทย
- Thai Soundex
- และอื่น ๆ

# ติดตั้ง
### ติดตั้ง

รองรับ Python 3.4 ขึ้นไป

Expand Down Expand Up @@ -70,9 +150,9 @@ $ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip i
ข้อมูลเพิ่มเติม [คลิกที่นี้](https://medium.com/data-science-cafe/install-polyglot-on-mac-3c90445abc1f#.rdfrorxjx)


# เอกสารการใช้งานเบื้องต้น
### เอกสารการใช้งาน

อ่านได้ที่ https://github.com/wannaphongcom/pythainlp/blob/master/docs/pythainlp-1-3-thai.md
อ่านได้ที่ https://github.com/wannaphongcom/pythainlp/blob/pythainlp1.4/docs/pythainlp-1-4-thai.md

### License

Expand Down
5 changes: 5 additions & 0 deletions References.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,5 @@
# References

Snae & Brückner. (2009). Novel Phonetic Name Matching Algorithm with a Statistical Ontology for Analysing Names Given in Accordance with Thai Astrology. Retrieved from https://pdfs.semanticscholar.org/3983/963e87ddc6dfdbb291099aa3927a0e3e4ea6.pdf

T. Teeramunkong, V. Sornlertlamvanich, T. Tanhermhong and W. Chinnan, “Character cluster based Thai information retrieval,” in IRAL '00 Proceedings of the fifth international workshop on on Information retrieval with Asian languages, 2000.
Loading