Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

지금까지 코드로 원데이터로부터 얻을 수 있는 데이터 #7

Open
sunhoi opened this issue Jun 22, 2019 · 1 comment

Comments

@sunhoi
Copy link
Collaborator

sunhoi commented Jun 22, 2019

내가 예전 코드로 얻을 수 있는 건 (가능)이라고 표시하고, 아직 얻을 수 없는 건 (아직 미정)이라 표기하였음. github에서 다운 받은 KPNN 새 코드에서 얻을 수 있는 것과 얻을 수 없는 것을 표시해 주기 바람.
월요일 미팅에선, 이 표를 중심으로 새 코드들에 대해 설명을 듣고 토론하면 좋겠음.

  1. 꼬리표 등 각종 기호 제거된 단어 목록 (가능)
  2. 동음이의어 제거된 단어 목록 (가능)
    3. 품사별 단어 목록 (예전 코드론 가능, 그러나 이번 코드론 아직 미정)
  3. 음소 기준 단어 철자, 예: 문자 -> ㅁ ㅜ ㄴ ㅈ ㅏ (가능)
  4. 발음기호로 변환된 단어 목록 (가능)
  5. 음소 기반 음운 이웃 (가능)
  6. 음소 기반 음운이웃 시각화 (가능)
  7. 음소 기반 음운이웃 지표값 산출 (가능)
  8. Pajek 작동 파일 작성 (가능)
  9. 기존 데이터를 기반으로 random lexicon 만들기 (가능)
  10. 기존 데이터의 단어 목록을 n-gram 발음기호로 만들기 (가능)
  11. 기존 데이터의 단어 목록 n-gram 발음기호를 다시 한글 n-gram으로 만들기 (가능)
    13. 음절 경계를 포함한 발음기호 n-gram 만들기 (아직 미정)
    14 음절 경계를 포함한 한글 n-gram 만들기 (가능)
  12. 음절 기반 음운이웃 (가능)
  13. 음절 기반 음운이웃 시각화 (가능)
  14. 음소 기반 음운이웃 지표값 산출 (가능)
  15. 단어 위치별 음절 목록 및 그 정보 산출 (가능)
  16. 노드 별 지표 산출 (가능)
    20. 사이시옷 관련 자료 (아직 미정)
    21. 각종 규칙 적용 데이터 생산 (아직 미정)
@sunhoi sunhoi changed the title 지금까지 코드로 얻을 수 있는 원데이터로부터 얻을 수 있는 데이터 지금까지 코드로 원데이터로부터 얻을 수 있는 데이터 Jun 22, 2019
stannam added a commit that referenced this issue Jun 24, 2019
Additionally, included a progress bar for removeSaisiot()
TODO: incorporate POS to increase speed.
@sunhoi
Copy link
Collaborator Author

sunhoi commented Jun 24, 2019

가능 = 새로운 코드로 가능
이해 = 새로운 코드 작동 원리 이해

새로운 코드로

  1. 꼬리표 등 각종 기호 제거된 단어 목록 (가능, 이해)
  2. 동음이의어 제거된 단어 목록 (가능, 이해)
  3. 품사별 단어 목록 (가능, 이해)
  4. 사이시옷 관련 자료 (가능, 이해 필요)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant