Skip to content

Releases: spellcheck-ko/hunspell-dict-ko

0.7.94

17 Jun 20:03
Compare
Choose a tag to compare

변경 사항

  • 데이터 정리

    • 우리말샘에서 사용하는 단어 정리
    • MPL/GPL/LGPL legacy 단어 삭제
  • 기타

    • 병렬 빌드로 속도 개선
    • hunspell 1.7.2에서 실패하는 서술형 조사 + 보조 용언 테스트 넘어가기

0.7.93

29 May 14:53
Compare
Choose a tag to compare

변경 사항

  • 국립국어원 단어 데이터 업데이트

    • 2023년 5월 1일 기준
  • 데이터 정리

    • 이스터에그 정보 제거 - 너무 긴 단어로 문제 발생
    • 조사 정보 이제 하드 코딩하지 않고 단어 데이터에서 추출된 정보 사용
  • 기타

    • 다시 최근 버전 PyYAML에서 동작하도록 스크립트 바로잡음. 이제 Loader= arg가 없으면
      동작하지 않음.
    • 문서 업데이트

0.7.92

28 Aug 06:15
Compare
Choose a tag to compare

0.7.92

https://github.com/spellcheck-ko/hunspell-dict-ko/releases/tag/0.7.92

내부적인 단어 정보 정리를 테스트하는 버전입니다.

변경 사항

  • 데이터 정리

    • 단어 정보 처리 스크립트 정리
      • 불규칙용언 찾기, 합성용언 찾기, 제외할 단어 찾기, 단위명사 찾기
    • 한국어기초사전 업데이트 2019/08/13
    • 구 갈퀴 단어의 일부를 표준국어대사전 및 우리말샘 단어로 대체
      • 표준국어대사전 2019/06/25
      • 우리말샘 2019/08/21
      • 대체하는 과정에서 발견된 잘못된 항목 바로잡음
      • MPL/GPL/LGPL에서 라이선스 전환하지 않은 단어 22개
      • CC BY SA 라이선스로 전환한 단어 427개
  • 기타

    • testsuite를 호스트에 설치된 hunspell 사전에 대해 실행할 수 있도록 조정
      • make hosttest HOST_DICT_PATH=/usr/share/hunspell/ko
      • 데비안 패키지 테스트 중 하나인 autopkgtest에서 사용
    • 문서 정리

0.7.91

12 Aug 06:10
Compare
Choose a tag to compare

내부적인 단어 정보 정리를 테스트하는 버전입니다. 기능상으로는 0.7.1과 큰
차이가 없습니다.

변경 사항

  • 데이터 정리

    • 내부 포맷을 YAML로 통일
    • 단어 파일 수가 너무 많아서 첫 음절 기준으로 합침
  • 활용

    • 호환 자모 뒤에 조사 ('ㄱ이', 'ㅏ는')

0.7.90

11 Jul 10:26
Compare
Choose a tag to compare

내부적인 단어 정보 정리를 테스트하는 버전입니다. 기능상으로는 0.7.1과 큰
차이가 없습니다.

변경 사항

  • 단어 데이터 업데이트 (53833 단어)

    • 한국어기초사전: 2019년 6월 25일 기준
    • 중복, 쓰이지 않는 단어 제거 후 단어
  • 외부 웹사이트를 통한 단어 데이터 관리 방식을 멈추고 모든 원본 단어 데이터를
    소스 코드에 포함.
    (#38)

    • https://github.com/spellcheck-ko/hunspell-dict-ko/tree/master/data/entries
    • 이제 수동 입력한 단어는 얼마 되지 않고 대부분의 단어가 국립국어원 사전에서
      가져온 단어라 다량의 데이터를 입력할 일이 적고, 0.7.0에서 개편한
      시맨틱위키 사용법이 오히려 참여의 장벽으로 작용하는 점이 있어 앞으로는
      github PR을 통해 받습니다.

0.7.1

25 Dec 07:59
Compare
Choose a tag to compare

https://github.com/spellcheck-ko/hunspell-dict-ko/releases/tag/0.7.1

변경 사항

  • 보조용언 미리 만들지 않고 처리, 사전 크기 감소 및 효율 개선
  • 복수접미사 '-들' 붙은 형태 미리 만들지 않고 처리, 사전 크기 감소 및 효율 개선
  • 대명사 뒤에 붙는 특별한 조사 형태 추가 ('저' + '에게' -> '제게' 등)
  • 0.6.2 이후 오류로 취급되는 단위 명사 붙여 쓰기 바로잡음
  • 항상 같은 결과를 빌드하도록 (reproducible build) 개선
    • 랜덤한 파이썬 hash 결과에 따라 순서가 달라지지 않도록

기타

총 5개의 라이선스가 있는 상황을 단순화하기 위해 CC BY 4.0 및 CC BY-SA 2.0 KR
라이선스를 호환되는 CC BY-SA 4.0으로 업그레이드합니다.

0.7.0 버전 이후 hunspell 1.3.1 이상이 필요하고 hunspell 1.2.14 미만에서 사용할
수 있는 버전은 별도로 빌드해 릴리스하지 않습니다. 1.2.14 미만 버전에서 그대로
이용하면 hunspell이 이상 중지되거나 제대로 동작하지 않는 일이 발생합니다.
MacOS에 내장된 hunspell 1.2.8을 이용하려면 소스에서 config.py의 최소 버전을
수정해 빌드하십시오. 단 기능이 제한될 수 있습니다.

이 프로젝트에 대한 공개SW개발자Lab 글로벌오픈프론티어 프로그램의 지원은
2017년으로 종료됩니다.

0.7.0

10 Nov 18:11
Compare
Choose a tag to compare

https://github.com/spellcheck-ko/hunspell-dict-ko/releases/tag/0.7.0

변경 사항

  • 갈퀴 업데이트 (53821 단어)

    • 국립국어원의 한국어기초사전 데이터 추가, 새로 추가된 단어는 약 22000 단어
    • 기타 어휘 정리
  • 명사 및 보조사 세부 분류/속성에 대한 제한 완화 (#36)

    • 모든 명사에 '-들' 접사 허용
    • 모든 부사에 보조사 허용

-어/아로 시작하는 어미 정리

  • 으불규칙 별도로 기재하지 않아도 동작

    • 형태만 보고 동작할 수 있으므로 별도로 기재할 필요가 없다
  • '-하다' 형태 동사에 (여불규칙) '-았다' 동작하지 않도록

  • '오았다', '가았다' 등 허용

    • 일반적으로 쓰이지 않는 형태지만 문법상 가능한 활용
  • hunspell 구 버전에서 오류 바로잡음: AM, AF 개수가 0이면 포함하지 않기 (#33)

기타

이제 기존의 MPL/GPL/LGPL 라이선스와 CC BY 4.0 라이선스에 더해, 국립국어원의
데이터가 포함되면서 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 (CC
BY-SA) 2.0 대한민국 라이선스도 사용됩니다.

이제 hunspell 1.2.14 미만에서 사용할 수 있는 버전은 별도로 빌드해 릴리스하지
않습니다. 1.2.14 미만 버전에서 그대로 이용하면 hunspell이 이상 중지되거나
제대로 동작하지 않는 일이 발생합니다. MacOS에 내장된 hunspell 1.2.8을
이용하려면 소스에서 config.py의 최소 버전을 수정해 빌드하십시오.

이제 갈퀴 사이트는 시맨틱 미디어위키 확장을 이용한 위키 사이트로 운영됩니다.
https://galkwi.pyok.org/

0.6.4

07 Sep 20:33
Compare
Choose a tag to compare

0.6.2에서 생긴 문제점을 바로잡는 릴리스 입니다.

https://github.com/spellcheck-ko/hunspell-dict-ko/releases/tag/0.6.4

변경 사항

  • 누락된 숫자 + 조사, 알파벳 + 조사, 수사 + 조사
  • VERSION에 프로젝트 URL (https://spellcheck-ko.github.io) 추가
  • 유니코드 아닌 로캘에서 빌드 추가로 바로잡음

MacOS의 경우 아직도 hunspell 1.2.8 버전을 내장하고 있습니다. MacOS 내장 버전의
hunspell을 이용하려면 ko-aff-dic-0.6.4-for-hunspell-1.2.8.zip 파일을
이용하십시오.

0.6.3

21 Aug 01:16
Compare
Choose a tag to compare
  • 0.6.2에서 생긴 문제점을 바로잡는 릴리스 입니다.
  • 누락된 명사 + 조사 수정
  • 누락된 명사 복수형 '-들' 수정

MacOS의 경우 아직도 hunspell 1.2.8 버전을 내장하고 있습니다. MacOS 내장 버전의
hunspell을 이용하려면 ko-aff-dic-0.6.3-for-hunspell-1.2.8.zip 파일을
이용하십시오.

0.6.2

08 Aug 07:46
Compare
Choose a tag to compare

https://github.com/spellcheck-ko/hunspell-dict-ko/releases

변경사항

  • 갈퀴 데이터 업데이트 (32132 단어)

  • 용언 활용 추가

    • 종결: '-냐',
    • '-어서였-', '-어서겠-': '-어서'에 과거/미래 선어말 어미가 붙은 형태
    • '-에나', '-에까지': '-에'에 보조사 붙은 형태
    • '-는지' 뒤에 조사
  • 조사 추가

    • '-에의'
    • '-서'가 받침이 있는 숫자 뒤에 '-이서' 형태로 붙는 경우 ('둘이서' 등)
      (#16)
    • '-에나', '-에까지': 보조사 붙은 형태

사용과 무관한 사항