# 1. Settings

In [4]:
from bs4 import BeautifulSoup
import numpy as np
import pandas as pd

import hanja
from hanja.hanja import hangul

ImportError: cannot import name 'deprecated' from 'hanja' (unknown location)

# 2. Use hanja

### 1) Installation
-----

```python
   pip install hanja
```

### 2) Usage
------
필요한 모듈 import 하기
```python
   >>> import hanja
   >>> from hanja import hangul
```

한글 초성, 중성, 종성 분리
```python
   >>> hangul.separate('가')
   (0, 0, 0)
   >>> hangul.separate('까')
   (1, 0, 0)
   # 튜플(tuple)의 마지막 원소가 0이면 종성이 없는 글자라고 판단할 수 있다.
```
'ㅎ'은 19번째 자음, 'ㅏ'는 첫번째 모음, 'ㄴ'은 다섯번째 자음이라는 것을 알 수 있다.
```python
   >>> hangul.separate('한')
   (18, 0, 4)
```

초성, 중성, 종성을 조합하여 한 글자를 만듦
```python
   >>> hangul.build(0, 0, 0)
   '가'
```

주어진 글자가 한글인지의 여부를 판별
```python
   >>> hangul.is_hangul('가')
   True
   >>> hangul.is_hangul('a')
   False
```

한글로 된 부분과 한자로 된 부분을 분리
```python
   >>> '|'.join(hanja.split_hanja('大韓民國은 民主共和國이다.'))
   大韓民國|은 |民主共和國|이다.

   >>> [x for x in hanja.split_hanja('大韓民國은 民主共和國이다.')]
   ['大韓民國', '은 ', '民主共和國', '이다.']
# 리스트가 아닌 제네레이터(generator)를 반환한다.
```

주어진 글자가 한자인지의 여부를 판별
```python
   >>> hanja.is_hanja('韓')
   True

   >>> hanja.is_hanja('한')
   False
```

문장 변환
- 치환 모드 변환:
```python
   >>> hanja.translate('大韓民國은 民主共和國이다.', 'substitution')
   '대한민국은 민주공화국이다.'
```
- 혼용 모드 변환 (text):
```python
   >>> hanja.translate('大韓民國은 民主共和國이다.', 'combination-text')
   '大韓民國(대한민국)은 民主共和國(민주공화국)이다.'
```
- 혼용 모드 변환 version 2 (text):
```python
   >>> hanja.translate('大韓民國은 民主共和國이다.', 'combination-text-reversed')
   '대한민국(大韓民國)은 민주공화국(民主共和國)이다.'
```
- 혼용 모드 변환 (HTML):
```python
   >>> hanja.translate(u'大韓民國은 民主共和國이다.', 'combination-html')
   '<span class="hanja">大韓民國</span><span class="hangul">(대한민국)</span>은 <span class="hanja">民主共和國</span><span class="hangul">(민주공화국)</span>이다.'
```