In [1]:
# 키보드 상 영어 알파벳-한국어 자모음 치환할 수 있는 dictionary
ko_dict = {'q':'ㅂ', 'Q':'ㅃ', 'w':'ㅈ', 'W':'ㅉ',
           'e':'ㄷ', 'E':'ㄸ', 'r':'ㄱ', 'R':'ㄲ', 't':'ㅅ',
           'T':'ㅆ', 'y':'ㅛ', 'u':'ㅕ', 'i':'ㅑ', 'o':'ㅐ',
           'p':'ㅔ', 'a':'ㅁ', 's':'ㄴ', 'd':'ㅇ', 'f':'ㄹ',
           'g':'ㅎ', 'h':'ㅗ', 'j':'ㅓ', 'k':'ㅏ', 'l':'ㅣ',
           'z':'ㅋ', 'x':'ㅌ', 'c':'ㅊ', 'v':'ㅍ', 'b':'ㅠ',
           'n':'ㅜ', 'm':'ㅡ', 'O':'ㅒ', 'P':'ㅖ', 'Y':'ㅛ',
           'U':'ㅕ', 'I':'ㅑ', 'H':'ㅗ', 'J':'ㅓ', 'K':'ㅏ',
           'L':'ㅣ', 'B':'ㅠ', 'N':'ㅜ', 'M':'ㅡ', 'A':'ㅁ',
           'S':'ㄴ', 'D':'ㅇ', 'F':'ㄹ', 'G':'ㅎ', 'Z':'ㅋ',
           'X':'ㅌ', 'C':'ㅊ', 'V':'ㅍ'}

# 가능한 초성, 중성, 종성 리스트 (이후 unicode 계산을 위해서 sorting)
chosung_list = sorted(['ㄱ','ㄴ','ㄷ','ㄹ','ㅁ','ㅂ','ㅅ','ㅇ','ㅈ','ㅊ','ㅋ','ㅌ','ㅍ','ㅎ','ㄲ','ㄸ','ㅃ','ㅆ','ㅉ'])
joongsung_list = sorted(['ㅏ','ㅑ','ㅓ','ㅕ','ㅗ','ㅛ','ㅜ','ㅠ','ㅡ','ㅣ','ㅐ','ㅒ','ㅔ','ㅖ','ㅘ','ㅚ','ㅙ','ㅝ','ㅟ','ㅞ','ㅢ'])
jongsung_list = sorted(['','ㄱ','ㄴ','ㄷ','ㄹ','ㅁ','ㅂ','ㅅ','ㅇ','ㅈ','ㅊ','ㅋ','ㅌ','ㅍ','ㅎ','ㄲ','ㅆ','ㄻ','ㄼ','ㄽ','ㄺ','ㅀ','ㄾ','ㄿ','ㄳ','ㅄ','ㄶ','ㄵ']) # 받침이 없어 종성이 비어있는 경우까지 포함

In [None]:
# 키보드에서 같은 자리에 있는 영타 -> 한타 변환
def eng_to_kor(eng_input):
  """
    Converts an English string to a list of Korean characters based on a predefined dictionary.

    Args:
        eng_input (str): The English string to convert.

    Returns:
        list: A list of Korean characters corresponding to the input English string.
              Returns the original character if no corresponding Korean character is found.

    Example:
        >>> eng_to_kor("dksl")
        ['ㅇ', 'ㅏ', 'ㄴ', 'ㅣ']
    """
    kor_output = []
    for c in eng_input:
        if c in ko_dict:
            kor_output.append(ko_dict[c])
        else:
            kor_output.append(c)
    return kor_output

print(eng_to_kor("dksldibbbbbzzzzz"))

['ㅇ', 'ㅏ', 'ㄴ', 'ㅣ', 'ㅇ', 'ㅑ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ']


In [None]:
# 음절 분리 (기준: 자음+모음 이어져서 나오면 다시 또 다른 자음+모음 나오기 전까지 하나의 음절로 분리)
def syllable_seperator(kor_input):
  """
    Separates a list of Korean characters into a list of Korean syllables.

    Args:
        kor_input (list): A list of Korean characters.

    Returns:
        list: A list of lists, where each inner list is a Korean syllable.
        Returns a list of remaining characters if the input does not form syllables.

    Example:
        >>> syllable_seperator(['ㅇ', 'ㅏ', 'ㄴ', 'ㄴ', 'ㅕ', 'ㅇ'])
        [['ㅇ', 'ㅏ', 'ㄴ'], ['ㄴ', 'ㅕ', 'ㅇ']]
    """
  words = []
  cursor = len(kor_input)-1
  rest = []
  for i in range(len(kor_input)-1,0,-1):
    if kor_input[i-1] in chosung_list and kor_input[i] in joongsung_list:
      words.append(kor_input[i-1:cursor+1])
      cursor = i-2
      rest = kor_input[:i-1]
    elif kor_input[0] in joongsung_list:
      rest = kor_input[:cursor+1]


  if len(rest) != 0:
      words.append(rest)

  return words[::-1]

print(syllable_seperator(['ㅇ','ㅇ', 'ㅏ', 'ㄴ', 'ㄴ', 'ㅕ', 'ㅇ']))
print(syllable_seperator(['ㅂ', 'ㅏ', 'ㄹ', 'ㄱ', 'ㅇ', 'ㅡ', 'ㄴ']))
print(syllable_seperator(['ㅇ', 'ㅇ', 'ㅇ', 'ㅇ', 'ㅏ', 'ㅏ', 'ㅏ', 'ㅏ', 'ㅏ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ']))
print(syllable_seperator(['ㅇ', 'ㅏ', 'ㄴ', 'ㅣ', 'ㅇ', 'ㅑ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ']))
print(syllable_seperator([ 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ']))

[['ㅇ'], ['ㅇ', 'ㅏ', 'ㄴ'], ['ㄴ', 'ㅕ', 'ㅇ']]
[['ㅂ', 'ㅏ', 'ㄹ', 'ㄱ'], ['ㅇ', 'ㅡ', 'ㄴ']]
[['ㅇ', 'ㅇ', 'ㅇ'], ['ㅇ', 'ㅏ', 'ㅏ', 'ㅏ', 'ㅏ', 'ㅏ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ']]
[['ㅇ', 'ㅏ'], ['ㄴ', 'ㅣ'], ['ㅇ', 'ㅑ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ']]
[['ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ']]


In [None]:
# 겹받침 처리
def double_cons(letters):
  """
    Combines adjacent consonants into double consonants if they form a valid double consonant.

    Args:
        letters (list): A list of Korean consonant characters.

    Returns:
        list: A list of Korean characters with combined double consonants.

    Example:
        >>> double_cons(['ㄹ', 'ㄱ', 'ㅅ', 'ㄴ'])
        ['ㄺ', 'ㅅ', 'ㄴ']
    """
  double_consonant_map = {
      ('ㅂ', 'ㅅ'): "ㅄ",
      ('ㄱ', 'ㅅ'): "ㄳ",
      ('ㄴ', 'ㅈ'): "ㄵ",
      ('ㄴ', 'ㅎ'): "ㄶ",
      ('ㄹ', 'ㄱ'): "ㄺ",
      ('ㄹ', 'ㅁ'): "ㄻ",
      ('ㄹ', 'ㅂ'): "ㄼ",
      ('ㄹ', 'ㅅ'): "ㄽ",
      ('ㄹ', 'ㅌ'): "ㄾ",
      ('ㄹ', 'ㅍ'): "ㄿ",
      ('ㄹ', 'ㅎ'): "ㅀ"
  }

  result = []
  i = 0
  while i < len(letters):
      if i < len(letters) - 1:
          pair = (letters[i], letters[i+1])
          if pair in double_consonant_map:
              result.append(double_consonant_map[pair])
              i += 2
          else:
              result.append(letters[i])
              i += 1
      else:
          result.append(letters[i])
          i += 1
  return result

In [None]:
# 이중 모음 처리
def double_vowel(letters):
  """
    Combines adjacent vowels into double vowels if they form a valid double vowel.

    Args:
        letters (list): A list of Korean vowel characters.

    Returns:
        list: A list of Korean characters with combined double vowels.

    Example:
      >>> double_vowel(['ㅜ', 'ㅓ', 'ㅣ'])
      ['ㅝ', 'ㅣ']
  """
  double_vowel_map = {
      ("ㅗ", "ㅐ"): "ㅙ",
      ("ㅗ", "ㅏ"): "ㅘ",
      ("ㅗ", "ㅣ"): "ㅚ",
      ("ㅜ", "ㅓ"): "ㅝ",
      ("ㅜ", "ㅔ"): "ㅞ",
      ("ㅜ", "ㅣ"): "ㅟ",
      ("ㅡ", "ㅣ"): "ㅢ"
  }

  result = []
  i = 0
  while i < len(letters):
      if i < len(letters) - 1:
          pair = (letters[i], letters[i+1])
          if pair in double_vowel_map:
              result.append(double_vowel_map[pair])
              i += 2
          else:
              result.append(letters[i])
              i += 1
      else:
          result.append(letters[i])
          i+=1
  return result

In [None]:
# 음절 내 초성, 중성, 종성을 분리
def separerate_cho_joong_jong(kor_input):
  """
    Separates a list of Korean characters into initial consonant(chosung), middle vowel(joongsung), and final consonant(jongsung).

    Args:
        l (list): A list of Korean characters representing a syllable.

    Returns:
        tuple: A tuple containing three lists: chosung, joongsung, and jongsung.
          Returns empty lists if there are no characters of the given type.

    Example:
        >>> sepererate_cho_joong_jong(['ㅂ', 'ㅏ', 'ㄹ', 'ㄱ'])
        (['ㅂ'], ['ㅏ'], ['ㄺ'])
  """
  chosung = []
  joongsung = []
  jongsung = []
  vowel_index = -1
  for i, char in enumerate(kor_input):
    if char in joongsung_list:
      vowel_index = i
      break
  if vowel_index < 0:
    chosung = double_cons(kor_input)
    return chosung, joongsung, jongsung

  chosung = kor_input[:vowel_index]
  joongsung = kor_input[vowel_index:]

  cons_index = -1
  for i, char in enumerate(joongsung):
      if char in jongsung_list:
          cons_index = i
          break

  if cons_index > 0:
      jongsung = joongsung[cons_index:]
      joongsung = joongsung[:cons_index]

  if len(joongsung) > 1:
    joongsung = double_vowel(joongsung)

  if len(jongsung) > 1:
    jongsung = double_cons(jongsung)
  if len(jongsung) == 0:
    jongsung.append("")
  return chosung, joongsung, jongsung

sepererate_cho_joong_jong(['ㅇ', 'ㅑ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ'])

(['ㅇ'], ['ㅑ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ', 'ㅠ'], ['ㅋ', 'ㅋ', 'ㅋ', 'ㅋ', 'ㅋ'])

In [87]:
# 한타 변환: 0xAC00 + 종성번호 + (초성번호 * 21 * 28) + (중성번호 * 28)

def combine_syllable(chosung, joongsung, jongsung):
  """
  Combines the separated initial consonant(chosung), middle vowel(joongsung), and final consonant(jongsung)
  into a single Korean character.

  Args:
      chosung (list): A list of Korean characters representing the initial consonant.
      joongsung (list): A list of Korean characters representing the middle vowel.
      jongsung (list): A list of Korean characters representing the final consonant.

  Returns:
      str: A string containing the combined Korean character.
      Returns an empty string if the combination is not valid.
      Returns a string of combined consonants and vowels if there are any remaining double consonants and vowels.

  Example:
      >>> combine_syllable(['ㅂ'], ['ㅏ'], ['ㄺ'])
      '밝'
  """
  # 중성이 존재하지 않는다면 초성만 조인
  if not joongsung:
    return "".join(chosung)
  # 초성이 존재하지 않을 경우, 중성과 종성 그대로 조인
  elif not chosung:
    return "".join(joongsung) + "".join(jongsung)
  # 초성이 1개만 있을 경우,
  elif len(chosung) == 1:
    # 중성이 2개 이상이면, 맨 처음 중성과 초성 결합, 그 이후의 중성과 종성 그대로 조인
    if len(joongsung) > 1:
      word = 0xAC00 + (chosung_list.index(chosung[0]) * 21 * 28) + (joongsung_list.index(joongsung[0]) * 28)
      return chr(word) +  "".join(joongsung[1:]) + "".join(jongsung)
    # 초성 1개, 중성 1개인 경우
    else:
      # 종성만 2개 이상인 경우, 맨 처음 종성과 결합, 그 이후의 종성 그대로 조인
      if len(jongsung) > 1:
        word = 0xAC00  + (chosung_list.index(chosung[0]) * 21 * 28) + (joongsung_list.index(joongsung[0]) * 28)
        return chr(word) + "".join(jongsung)
      # 초성, 중성, 종성 모두 1개씩인 경우
      else:
        word = 0xAC00  + (chosung_list.index(chosung[0]) * 21 * 28) + (joongsung_list.index(joongsung[0]) * 28) + jongsung_list.index(jongsung[0])
        return chr(word)
  # 초성이 2개 이상인 경우
  else:
    # 중성도 2개 이상이면, 맨 마지막 초성+맨처음 중성 결합 후 나머지초성+결합된글자+나머지 중성+종성 조인
    if len(joongsung) > 1:
      word = 0xAC00 + (chosung_list.index(chosung[-1]) * 21 * 28) + (joongsung_list.index(joongsung[0]) * 28)
      return "".join(chosung[:-1]) + chr(word) +  "".join(joongsung[1:]) + "".join(jongsung)
    # 초성 2개 이상, 중성 1개일 때,
    else:
      # 종성 2개 이상이면, 나머지 초성+맨마지막초성과 중성과 맨처음 종성 결합 글자+ 나머지 종성 조인
      if len(jongsung) > 1:
        word = 0xAC00  + (chosung_list.index(chosung[-1]) * 21 * 28) + (joongsung_list.index(joongsung[0]) * 28)+ jongsung_list.index(jongsung[0])
        return  "".join(chosung[:-1]) + chr(word) + "".join(jongsung)
      # 종성 1개일 때, 나머지 초성+맨마지막초성과 중성과 맨처음 종성 결합 글자
      else:
        word = 0xAC00  + (chosung_list.index(chosung[-1]) * 21 * 28) + (joongsung_list.index(joongsung[0]) * 28) + jongsung_list.index(jongsung[0])
        return "".join(chosung[:-1]) + chr(word)

In [None]:
input = "dk"
# 최종 영한타 변환기 
def eng_2_kor_transformer (input):
  result = []
  # 입력값 space 기준으로 잘라서 각각 한타 변환
  input_split = input.split()
  for input in input_split:
    output = ""
    replaced_kor_alphabets = eng_to_kor(input)
    separated_syllables = syllable_seperator(replaced_kor_alphabets)
    for syllable in separated_syllables:
      chosung, joongsung, jongsung = separerate_cho_joong_jong(syllable)
      letter = combine_syllable(chosung, joongsung, jongsung)
      output += letter
    result.append(output)
  # 다시 space 추가
  result = " ".join(result)
  return  result

아
