In [23]:
# -*- coding: utf-8 -*-
import re
"""
    초성 중성 종성 분리 하기
	유니코드 한글은 0xAC00 으로부터
	초성 19개, 중상21개, 종성28개로 이루어지고
	이들을 조합한 11,172개의 문자를 갖는다.
	한글코드의 값 = ((초성 * 21) + 중성) * 28 + 종성 + 0xAC00
	(0xAC00은 'ㄱ'의 코드값)
	따라서 다음과 같은 계산 식이 구해진다.
	유니코드 한글 문자 코드 값이 X일 때,
	초성 = ((X - 0xAC00) / 28) / 21
	중성 = ((X - 0xAC00) / 28) % 21
	종성 = (X - 0xAC00) % 28
	이 때 초성, 중성, 종성의 값은 각 소리 글자의 코드값이 아니라
	이들이 각각 몇 번째 문자인가를 나타내기 때문에 다음과 같이 다시 처리한다.
	초성문자코드 = 초성 + 0x1100 //('ㄱ')
	중성문자코드 = 중성 + 0x1161 // ('ㅏ')
	종성문자코드 = 종성 + 0x11A8 - 1 // (종성이 없는 경우가 있으므로 1을 뺌)
"""
# 유니코드 한글 시작 : 44032, 끝 : 55199
BASE_CODE, CHOSUNG, JUNGSUNG = 44032, 588, 28

# 초성 리스트. 00 ~ 18
CHOSUNG_LIST = ['ㄱ', 'ㄲ', 'ㄴ', 'ㄷ', 'ㄸ', 'ㄹ', 'ㅁ', 'ㅂ', 'ㅃ', 'ㅅ', 'ㅆ', 'ㅇ', 'ㅈ', 'ㅉ', 'ㅊ', 'ㅋ', 'ㅌ', 'ㅍ', 'ㅎ']

# 중성 리스트. 00 ~ 20
JUNGSUNG_LIST = ['ㅏ', 'ㅐ', 'ㅑ', 'ㅒ', 'ㅓ', 'ㅔ', 'ㅕ', 'ㅖ', 'ㅗ', 'ㅘ', 'ㅙ', 'ㅚ', 'ㅛ', 'ㅜ', 'ㅝ', 'ㅞ', 'ㅟ', 'ㅠ', 'ㅡ', 'ㅢ', 'ㅣ']

# 종성 리스트. 00 ~ 27 + 1(1개 없음)
JONGSUNG_LIST = [' ', 'ㄱ', 'ㄲ', 'ㄳ', 'ㄴ', 'ㄵ', 'ㄶ', 'ㄷ', 'ㄹ', 'ㄺ', 'ㄻ', 'ㄼ', 'ㄽ', 'ㄾ', 'ㄿ', 'ㅀ', 'ㅁ', 'ㅂ', 'ㅄ', 'ㅅ', 'ㅆ', 'ㅇ', 'ㅈ', 'ㅊ', 'ㅋ', 'ㅌ', 'ㅍ', 'ㅎ']


if __name__ == '__main__':
    test_keyword = """
    오전 12:38 현수 ㅋㅋㅋ
    오전 12:39 현수 은별아 저거
    오전 12:39 현수 파이썬 3 버전에서만 돌아가니 설치시 주의하길
    오전 12:39 현수 파이썬 2랑 3이 있는데
    오전 12:39 현수 설치할때 3으루 해야됩니다용가리~
    오전 12:39 현수 상엽쓰가 저것도 안해준단말인가~
    오전 12:39 현수 야속하다~
    -
    """
    split_keyword_list = list(test_keyword)
#     print(split_keyword_list)

    result = list()
    
    result_string = ''
    for keyword in split_keyword_list:
#         result_string += keyword
        # 한글 여부 check 후 분리
        if re.match('.*[ㄱ-ㅎㅏ-ㅣ가-힣]+.*', keyword) is not None:
            char_code = ord(keyword) - BASE_CODE
            char1 = int(char_code / CHOSUNG)
            try:
                result.append(CHOSUNG_LIST[char1])
                result_string += CHOSUNG_LIST[char1]
            except IndexError:
                result.append(' ')
                result_string += ' '
            
        else:
            result.append(keyword)
            result_string += keyword
    
    print(result_string)
    # result


    ㅇㅈ 12:38 ㅎㅅ    
    ㅇㅈ 12:39 ㅎㅅ ㅇㅂㅇ ㅈㄱ
    ㅇㅈ 12:39 ㅎㅅ ㅍㅇㅆ 3 ㅂㅈㅇㅅㅁ ㄷㅇㄱㄴ ㅅㅊㅅ ㅈㅇㅎㄱ
    ㅇㅈ 12:39 ㅎㅅ ㅍㅇㅆ 2ㄹ 3ㅇ ㅇㄴㄷ
    ㅇㅈ 12:39 ㅎㅅ ㅅㅊㅎㄸ 3ㅇㄹ ㅎㅇㄷㄴㄷㅇㄱㄹ~
    ㅇㅈ 12:39 ㅎㅅ ㅅㅇㅆㄱ ㅈㄱㄷ ㅇㅎㅈㄷㅁㅇㄱ~
    ㅇㅈ 12:39 ㅎㅅ ㅇㅅㅎㄷ~
    -
    
