In [None]:
import pandas as pd
from pandas import DataFrame
import random
import itertools

In [None]:
hanja = pd.read_csv('../../crawled/good_naming_hanja_filtered.csv')

In [None]:
print(hanja)

     Hanja mean sound meanFiveElements soundFiveElements
0        筵  대자리     연                목                토화
1        鬆  소나무     송                화                금토
2        秪   다만     지                목                 금
3        爟   봉화     관                화                목화
4        瑈    옥     유                금                 토
...    ...  ...   ...              ...               ...
5744     菡   연꽃     함                목                토수
5745     攬   가질     람                목                화수
5746     鄗    땅     호                토                 토
5747     囀  지저귈     전                수                금화
5748     釦   금테     구                금                 목

[5749 rows x 5 columns]


In [None]:
def find_hanja_combinations_in_name(name):
  sangmyungja = hanja[hanja['sound'] == name[0]]
  hamyungja = hanja[hanja['sound'] == name[1]]

  if sangmyungja.empty or hamyungja.empty:
    return []
  else:
    hanja_combination = []
    for i, sr in sangmyungja.iterrows():
      for j, hr in hamyungja.iterrows():
        hanja_combination.append((sr, hr))
    return hanja_combination

In [None]:
class NameTemplate:

    def __init__(self, sangmyungja, hamyungja):
        self.__sangmyungja_sound = sangmyungja['sound']
        self.__sangmyungja_hanja = sangmyungja['Hanja']
        self.__sangmyungja_mean = sangmyungja['mean']
        self.__sangmyungja_five_elements = sangmyungja['meanFiveElements']
        self.__hamyungja_sound = hamyungja['sound']
        self.__hamyungja_hanja = hamyungja['Hanja']
        self.__hamyungja_mean = hamyungja['mean']
        self.__hamyungja_five_elements = hamyungja['meanFiveElements']
        self.__five_element_combination_keys = set(["목목","목화","목수","목금","목토","화화","화수","화금","화토","수수","수금","수토","금금","금토","토토"])

    def korean_name(self):
        korean_name = f"{self.__sangmyungja_sound}{self.__hamyungja_sound}"
        return korean_name

    def hanja_name(self):
        hanja_name = f"{self.__sangmyungja_hanja}{self.__hamyungja_hanja}"
        return hanja_name

    def sangmyungja_sound_mean(self):
        sangmyungja_sound_mean = f"{self.__sangmyungja_sound}({self.__sangmyungja_hanja}): {self.__sangmyungja_mean}"
        return sangmyungja_sound_mean

    def sangmyungja_five_elements(self):
        five_elements = f"자원오행 {self.__sangmyungja_five_elements}"
        return five_elements

    def hamyungja_sound_mean(self):
        sound_mean = f"{self.__hamyungja_sound}({self.__hamyungja_hanja}): {self.__hamyungja_mean}"
        return sound_mean

    def hamyungja_five_elements(self):
        five_elements = f"자원오행 {self.__hamyungja_five_elements}"
        return five_elements

    def five_elements_combination(self):
        c1 = f"{self.__sangmyungja_five_elements}{self.__hamyungja_five_elements}"
        c2 = f"{self.__hamyungja_five_elements}{self.__sangmyungja_five_elements}"
        if c1 in self.__five_element_combination_keys:
            return c1
        elif c2 in self.__five_element_combination_keys:
            return c2
        else:
            return "불가능"

    def __str__(self):
        return f"{self.korean_name()}({self.hanja_name()})\n{self.sangmyungja_sound_mean()}, {self.sangmyungja_five_elements()}\n{self.hamyungja_sound_mean()}, {self.hamyungja_five_elements()}"

In [None]:
index_limit = len(hanja)
def generate_random_name():
  i = random.randint(0, index_limit)
  j = random.randint(0, index_limit)
  sangmyungja = hanja.loc[i]
  hamyungja = hanja.loc[j]

  name_template = NameTemplate(sangmyungja, hamyungja)
  return name_template

In [None]:
name = generate_random_name()
print(name)

현삭(㢺蒴)
현(㢺): 활, 자원오행 화
삭(蒴): 삭조, 자원오행 목


In [None]:
categorized_male_names = {
    "목목": [],
    "목화": [],
    "목수": [],
    "목금": [],
    "목토": [],
    "화화": [],
    "화수": [],
    "화금": [],
    "화토": [],
    "수수": [],
    "수금": [],
    "수토": [],
    "금금": [],
    "금토": [],
    "토토": [],
}

In [None]:
male_names = pd.read_csv('../../crawled/male_names.csv')

In [None]:
male_name_filtered = male_names[~male_names['Name'].isin(['지안', '시윤', '이든', '현진', '민서', '현서', '하율', '승리', '한솔', '지후', '규빈', '재이', '가온', '유현', '연우', '선율', '우주', '시온', '지온', '태은', '시하', '수안', '정원', '서윤', '서현', '유안', '지민', '하민', '하람', '해담', '시현', '유빈', '나율', '태율', '이안', '은성', '정인', '유민', '하루', '리온', '우진', '아인', '이현', '서율', ' 정현', '선우', '서인', '하빈', '로운', '태이', '성연', '수현', '하담', '지율', '유하', '지원', '하진', '경민', '선유', '건희', '리안', '주안', '현수', '주원', '로희', '준희', '서원', ' 하늘', '지우', '재인', '주영', '서빈', '시우', '라온', '채민', '도연', '지호', '이진', '수민', '은우', '승현', '다온', '지유', '서진', '서우', '정민', '이수', '유솔', '희원', '기타', ' 하랑', '다현', '하온'])]
names = male_name_filtered['Name'].to_list()
print(names)

['시후', '대한', '상민', '정우', '정수', '범준', '민혁', '태경', '민준', '민찬', '성빈', '진우', '주현', '지성', '현빈', '찬형', '동훈', '완기', '도현', '영천', '찬희', '태빈', '태규', '재민', '성현', '채화', '예찬', '태윤', '한울', '대건', '태현', '범수', '현태', '성욱', '준서', '수호', '지운', '예준', '경용', '광재', '은찬', '현석', '승원', '승우', '태환', '동영', '현준', '성민', '승재', '민희', '태훈', '민재', '성준', '민성', '한결', '강현', '성제', '지환', '서준', '태우', '태민', '희수', '지혁', '준호', '준혁', '현민', '유청', '주호', '규민', '승빈', '효수', '승환', '민석', '준석', '윤혁', '건우', '승민', '민규', '승준', '은후', '현우', '상준', '지훈', '준모', '동혁', '수훈', '재윤', '제백', '태영', '영민', '준우', '유찬', '재훈', '도윤', '민호', '준성', '정훈', '주성', '정현', '준영', '재혁', '지완', '재원', '지석', '민수', '동현', '동건', '상현', '현욱', '윤호', '민우', '민기', '재현', '재영', '승주', '민건', '승찬', '현성', '승훈', '규현', '주환', '예성', '환희', '태준', '우빈', '우성', '성우', '유준', '건호', '도훈', '하준', '강민', '윤우', '의진', '윤성', '승호', '현근', '세완', '하울', '동하', '석현', '송산', '준범', '정호', '형우', '대겸', '남연', '준수', '현호', '동우', '정재', '강령', '경준', '준원', '도영', '태호', '현규', '현동', '은호', '시원', '원준', '승혁', '시환', '연호', '윤재', '기훈', '찬용

In [None]:
for name in names:
  hanja_combinations = find_hanja_combinations_in_name(name)
  for hc in hanja_combinations:
    name_template = NameTemplate(hc[0], hc[1])
    five_element_combination = name_template.five_elements_combination()
    if five_element_combination in categorized_male_names:
      categorized_male_names[five_element_combination].append(name_template)

In [None]:
for k,v in categorized_male_names.items():
    print(k)
    print(f"len: {len(v)}")
    random.shuffle(v)
    chunked_list = [v[i:i+3] for i in range(0, len(v), 3)]
    # chunked 개수 조정
    chunked_list = chunked_list[:100]
    with open(f"./categorized_name_hanja/male_names_{k}.txt", "w") as f:
    for chunk in chunked_list:
      for nt in chunk:
        f.write(f"{nt}\n\n")
      f.write("\n")

목목
len: 23380
목화
len: 34950
목수
len: 31646
목금
len: 29309
목토
len: 30647
화화
len: 12641
화수
len: 22841
화금
len: 21640
화토
len: 22562
수수
len: 10397
수금
len: 19500
수토
len: 20506
금금
len: 9064
금토
len: 19290
토토
len: 9846


In [None]:
categorized_female_names = {
    "목목": [],
    "목화": [],
    "목수": [],
    "목금": [],
    "목토": [],
    "화화": [],
    "화수": [],
    "화금": [],
    "화토": [],
    "수수": [],
    "수금": [],
    "수토": [],
    "금금": [],
    "금토": [],
    "토토": [],
}


In [None]:
female_names = pd.read_csv('../../crawled/female_names.csv')
female_name_filtered = female_names[~female_names['Name'].isin(['지안', '시윤', '이든', '현진', '민서', '현서', '하율', '승리', '한솔', '지후', '규빈', '재이', '가온', '유현', '연우', '선율', '우주', '시온', '지온', '태은', '시하', '수안', '정원', '서윤', '서현', '유안', '지민', '하민', '하람', '해담', '시현', '유빈', '나율', '태율', '이안', '은성', '정인', '유민', '하루', '리온', '우진', '아인', '이현', '서율', ' 정현', '선우', '서인', '하빈', '로운', '태이', '성연', '수현', '하담', '지율', '유하', '지원', '하진', '경민', '선유', '건희', '리안', '주안', '현수', '주원', '로희', '준희', '서원', ' 하늘', '지우', '재인', '주영', '서빈', '시우', '라온', '채민', '도연', '지호', '이진', '수민', '은우', '승현', '다온', '지유', '서진', '서우', '정민', '이수', '유솔', '희원', '기타', ' 하랑', '다현', '하온'])]
names = female_name_filtered['Name'].to_list()
print(names)

['지희', '예림', '민주', '수지', '나경', '인영', '진경', '채윤', '수연', '채원', '나은', '세은', '예주', '연아', '영은', '지영', '채연', '지선', '민경', '지효', '아름', '혜민', '보민', '시연', '서영', '나현', '은혜', '예린', '현지', '진서', '은서', '세진', '채은', '지윤', '예진', '윤아', '선아', '예나', '유진', '정엽', '수빈', '시은', '민정', '수진', '승아', '예지', '주은', '지연', '소율', '하윤', '유나', '하은', '연지', '하연', '초록', '영서', '윤서', '다희', '서연', '소연', '혜원', '가현', '지수', '가영', '정연', '예빈', '규리', '소현', '지현', '윤지', '은채', '예원', '수아', '예서', '은지', '나연', '가람', '태희', '채영', '나영', '채희', '민지', '주아', '다은', '가연', '예은', '가은', '은빈', '정현', '지혜', '서희', '소윤', '아현', '다인', '지은', '채린', '고은', '유리', '다연', '보경', '수인', '주연', '지아', '채현', '혜린', '다혜', '나윤', '아영', '서정', '소희', '연서', '소정', '진효', '가희', '혜주', '선음', '정윤', '혜나', '하린', '민아', '은주', '시영', '서은', '혜인', '유은', '슬교', '하영', '영윤', '유림', '윤하', '루아', '아원', '송현', '채아', '은솔', '희윤', '예슬', '유주', '다경', '해인', '소은', '여은', '재희', '규림', '태연', '해온', '민하', '사랑', '채경', '하엘', '현경', '아린', '가윤', '아윤', '다윤', '예령', '하랑', '희연', '아연', '라희', '효주', '아율', '은희', '수하', '연재', '가을', '다예

In [None]:
for name in names:
  hanja_combinations = find_hanja_combinations_in_name(name)
  for hc in hanja_combinations:
    name_template = NameTemplate(hc[0], hc[1])
    five_element_combination = name_template.five_elements_combination()
    if five_element_combination in categorized_female_names:
      categorized_female_names[five_element_combination].append(name_template)

In [None]:
for k,v in categorized_female_names.items():
    print(k)
    print(f"len: {len(v)}")
    random.shuffle(v)
    chunked_list = [v[i:i+3] for i in range(0, len(v), 3)]
    random.shuffle(chunked_list)
    # chunked 개수 조정
    chunked_list = chunked_list[:100]
    with open(f"./categorized_name_hanja/female_names_{k}.txt", "w") as f:
    for chunk in chunked_list:
      for nt in chunk:
        f.write(f"{nt}\n\n")
      f.write("\n")

목목
len: 22580
목화
len: 29678
목수
len: 29727
목금
len: 27944
목토
len: 25256
화화
len: 9341
화수
len: 18675
화금
len: 17912
화토
len: 16142
수수
len: 9591
수금
len: 17654
수토
len: 16136
금금
len: 8542
금토
len: 15184
토토
len: 6953
