Skip to content
은전한닢 프로젝트와 mecab 기반의 한국어 형태소 분석기의 독립형 python 인터페이스
C++ Python Shell
Branch: master
Clone or download
Latest commit 03f5935 Jan 17, 2019
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
eunjeon partial commit May 16, 2018
scripts add ldconfig May 16, 2018
tests Fix pylint May 17, 2018
.gitignore Initial commit May 14, 2018
.travis.yml Remove python 3.3, 3.4 May 16, 2018
LICENSE Add license May 14, 2018
MANIFEST.in Initial commit May 14, 2018
README.md Update README.md Aug 15, 2018
requirements-win.txt Initial commit May 14, 2018
requirements.txt Initial commit May 14, 2018
setup.cfg Remove metadata LICENSE Jan 16, 2019
setup.py add data/mecabrc Jan 16, 2019

README.md

pyeunjeon (python + eunjeon)

Build Status

pyeunjeon은 은전한닢 프로젝트와 mecab 기반의 한국어 형태소 분석기의 독립형 python 인터페이스입니다.
pyeunjeon is a stand-alone python interface for morphological analyzer mecab and project eunjeon.

Koshort 💜 KoNLPy

KoNLPy와 Koshort의 통합이 진행되고 있습니다!

Installation 설치

Linux or Mac

# Install mecab first / mecab을 먼저 설치해주세요.
bash <(curl -s https://raw.githubusercontent.com/koshort/peunjeon/master/scripts/mecab.sh)

# Install eunjeon / eunjeon을 설치합니다.
pip install eunjeon

Windows x64

pip install eunjeon

Usage 사용법

>>> from eunjeon import Mecab  # KoNLPy style mecab wrapper
>>> tagger = Mecab() 
>>> tagger.nouns("고양이가 냐 하고 울면 나는 녜 하고 울어야지")
['고양이', '', '']
>>> # 빛 아래 유령
>>> poem = """
... 흘러내린 머리카락이 흐린 호박빛 아래 빛난다.
... 유영하며.
... 저건가보다.
... 세월의 힘을 이겨낸 마지막 하나 남은 가로등.
... 미래의 색, 역겨운 청록색으로 창백하게 바뀔 마지막 가로등
... 난 유영한다. 차분하게 과거에 살면서 현재의 공기를 마신다.
... 가로등이 깜빡인다.
...
... 나도 깜빡여준다.
... """
>>> tagger.morphs(poem)  # 형태소 단위로 나누기
['흘러내린', '머리카락', '', '흐린', '호박', '', '아래', '빛난다', '.', '유영', '', '', '.', '저건가', '', '', '.', '세월', '', '', '', '이겨', '', '마지막', '하나', '', '', '가로등', '.', '미래', '', '', ',', ' 역겨운', '청록색', '으로', '창백', '', '', '바뀔', '마지막', '가로등', '', '유영', '한다', '.', '차분', '', '', '과거', '', '', '면서', '현재', '', '공기', '', '마신다', '.', '가로등', '', '깜빡인다', '.', '', '', ' 깜빡', '', '준다', '.']
>>> tagger.pos("다람쥐 헌 쳇바퀴에 타고 파")
[('다람쥐', 'NNG'), ('', 'XSV+ETM'), ('쳇바퀴', 'NNG'), ('', 'JKB'), ('', 'VV'), ('', 'EC'), ('', 'VX+EC')]

Open-source

pyeunjeon에서는 다음과 같은 오픈소스를 이용하였습니다.
pyeunjeon used following open source projects.

You can’t perform that action at this time.