Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

인식하지 못하는 한자 #18

Open
muni0822 opened this issue Jun 25, 2021 · 3 comments
Open

인식하지 못하는 한자 #18

muni0822 opened this issue Jun 25, 2021 · 3 comments

Comments

@muni0822
Copy link

𤍠(\u24360) 𨽾(\u28F7E) 이런 한자들을 처리하게 하려면 어떻게 해야 하나요?

@dahlia
Copy link
Collaborator

dahlia commented Oct 3, 2021

  • 「𤍠」(U+24360)은 「더울 熱」의 이체자(동자; semantic variant)라고 합니다. 따라서 독음은 “열”이 되겠습니다.
  • 「𨽾」(U+28F7E)은 「종(노예) 隸」의 이체자라고 합니다. 따라서 독음은 “례”(“예”)가 되겠습니다.

@suminb table.yml에 추가하면 될 것 같습니다.

@suminb
Copy link
Owner

suminb commented Oct 14, 2021

제보 감사합니다. 사실 똑같이 생긴 한자가 다른 유니코드 값을 가지고 있는 케이스가 꽤 많이 있어서 포괄적인 대응이 필요한 상황이지만, table.yml에 해당 글자를 추가하여 제보 주신 내용이라도 임시로 해결해볼 수는 있을 것 같습니다.

@dahlia
Copy link
Collaborator

dahlia commented Oct 17, 2021

사실 똑같이 생긴 한자가 다른 유니코드 값을 가지고 있는 케이스가 꽤 많이 있어서 포괄적인 대응이 필요한 상황이지만

Unicode Han Database에서 그런 관계를 나타내기 위해 kSemanticVariant 필드를 제공하고 있습니다. 이를 활용하면 좋을 것 같습니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants