Skip to content

SeHaan/program_H-side_2.0

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

역사비교언어학 프로그램 프로젝트 - H-side (NEW)

작성자 문의 이메일 라이센스
강민하 alsgk1123@gmail.com MIT License
  • 국립국어원에서 제작한 "역사자료 종합 정비물"에서 보다 편리한 검색을 도모하기 위해 제작된 프로그램입니다.

1. 업데이트 내역

1) 윈도우즈

업데이트일 버전명 업데이트 내역
20230308 ver. 2.0.1 버그 수정
20230308 ver. 2.0.0 조합형 문자열 칼럼 출력 삭제, 저장 디렉토리 추가
20220519 ver. 1.1.1 조합형 문자열도 출력하도록 수정
20220322 ver. 1.1.0 Initial Commit
20220322 ver. 1.0.5 자소검색 와일드카드 문자(*) 오류 수정
20220322 ver. 1.0.4 에러 핸들링: QMessageBox
20220322 ver. 1.0.3 Pandas 데이터프레임을 기본 딕셔너리로 변환
20220322 ver. 1.0.2 자소검색 기능 추가
20220317 ver. 1.0.1 검색 스트링을 첫가끝으로 변환
20220309 ver. 1.0.0 Initial Setting

2) 맥OS

  • (계획중: 작성자에게 맥OS를 구동할 수 있는 컴퓨터가 아직 없습니다)
  • 맥OS를 사용하고 계신다면 아래의 3) 실행나. 나는 내가 직접 빌드해서 사용하겠다 항목을 참고해주세요.

2. 사용방법

1) 프로그램 다운로드

  • 깃허브 레포지토리 우측 상단의 'Code'를 클릭 후 'Download ZIP'을 클릭하면 됩니다.
  • 물론 레포지토리를 바로 클론하셔도 무방합니다.

2) 구성

다운로드된/클론된 폴더는 다음과 같이 구성되어 있습니다.

  • dict 폴더 : 자소 검색이 가능하도록 도와주는 딕셔너리가 pickle 확장자로 저장되어 있습니다. 해당 폴더와 내용물이 없으면 프로그램이 실행되지 않으므로 주의해주시기 바랍니다.
  • H-side.exe 또는 H-side UNIX 실행파일 : 프로그램의 본체입니다. dict 폴더와 같은 위치에 있지 않으면 역시 실행되지 않으므로 주의해주세요. 바탕화면에 두신다면, program_H-side 폴더는 다운받은 위치에 남겨두시고 H-side.exe만 바로가기로 따로 빼서 사용하는 것을 권장드립니다.
  • img 폴더 : 이 도움말에 사용된 사진이 들어 있는 폴더입니다.
  • README.md, README.html : 도움말 파일입니다.
  • main.py, searching.py : H-side.exe를 구성하는 Python 스크립트 파일입니다. 삭제하셔도 무방하고, 분석을 위해 남겨두셔도 좋습니다.
  • LICENSE : 라이센스 파일입니다. 해당 프로그램은 MIT LICENSE를 준수합니다.

3) 실행

가. 윈도우즈

  • 클론된 폴더/다운로드해서 압축을 해제한 폴더에서 H-side.exe를 더블클릭합니다.

나. 나는 내가 직접 빌드해서 사용하겠다.

  • 또는, 직접 빌드하셔도 됩니다. 현재 맥OS용 실행 파일은 만들지 못했으므로, 맥OS를 사용하신다면 이 방법을 사용해주세요.
  • 빌드하기 전에, 컴퓨터에 아래 버전의 파이썬과 그 라이브러리가 설치되어 있는지 확인해주세요.
    • Python 3.11.0 이상

    • 필수 라이브러리(requirements.txt 참고): 터미널에서 이 폴더의 경로까지 들어오신 다음 아래의 실행 코드를 입력하면 알아서 설치해줍니다.

      pip install -r requirements.txt
      Module version
      altgraph 0.17.3
      pefile 2023.2.7
      pyinstaller 5.8.0
      pyinstaller-hooks-contrib 2023.0
      PyQt5 5.15.9
      PyQt5-Qt5 5.15.2
      PyQt5-sip 12.11.1
      pywin32-ctypes 0.2.0
    • 아래의 명령어를 입력해주세요.

      pyinstaller -F -w -n=H-side main.py

4) 검색

  • 먼저, data dir을 설정해야 합니다. 오른쪽의 find dir을 클릭하신 다음, 역사자료종합정비물이 존재하는 폴더를 열어줍니다.

    • 이때, 열린 폴더 안에 하위 폴더가 존재하면 안 된다는 점에 유의해 주세요.
    • 검색할 수 있는 역사자료종합정비물은 .xml이든 .txt이든 상관없으나, 이미 자소 분해가 되어 있는 파일들이어야 합니다. 즉, 첫가끝 방식으로 변환된 파일들이어야 합니다.
    • direc이 비어 있다면, search를 눌러도 경고창이 출력되면서 검색이 되지 않습니다.
  • 다음으로, save dir을 설정해야 합니다. 오른쪽의 find dir을 클릭하신 다음, 결과물(result.txt)을 저장할 폴더를 열어줍니다.

    • 이때, data dir은 사용할 수 없습니다(업데이트 예정)
  • 다음으로, target word 칸을 채워줍니다. target word에는 다음과 같은 형식이 들어갈 수 있습니다.

    • 일반검색: 평범하게 입력하시면 됩니다.
    • 자소검색: 옛한글을 입력할 수 없거나, 특별히 자소 단위로 분해해서 입력하고 싶다면 원하는 음절을 '[초성/중성/종성]'으로 둘러싸 주세요. 입력 방식은 유니콩크와 완전하게 동일합니다.
    • 어떤 검색어를 입력하느냐에 따라 검색 시간이 오래 걸릴 수도 있으므로 주의해주세요. (예: 한 음절로만 입력, 모든 자소에 와일드카드 문자 입력)
  • 완료되었다면, search를 눌러주세요. 검색이 완료되면 몇 개가 검색되었는지 알려주는 창이 뜨고, 검색 개수가 하단의 상태바에 표시됩니다.

  • 검색 결과는 'number - 파일명 - 위치 - 검색된 라인(조합형)' 순서로 표시됩니다.

figure1

  • 검색 결과는 화면에뿐만 아니라 result.txt라는 이름의 텍스트 파일로도 자동으로 저장이 됩니다. 해당 파일은 항목들이 탭(tab)으로 구분되어 있기 때문에, csv나 엑셀 파일로 다시 저장하실 수도 있습니다.

5) 번외: 자소검색 방법

  • H-side에서 자소 검색은 검색 위치에 상관없이 가능합니다. 입력 방식은 다음과 같습니다.
    • 합용병서, 각자병서, 연서는 모두 단순히 자음을 나열해주면 됩니다.
    • 아래아는 'ㅏㅏ'로 입력하면 됩니다.
    • 중성은 모두 분리해서 적을 수 있습니다. 예를 들어, 'ㅟ'는 'ㅜㅣ'로 적을 수 있습니다.
    • 반치음은 '#ㅅ', 여린히읗은 '#ㅎ', 옛이응은 '#ㅇ'으로 입력하면 됩니다.
    • 치두음은 '!ㅅ', 정치음은 'ㅅ!'와 같이 입력하시면 됩니다.
    • 자소검색 도구('[ ]' 기호)안에 옛한글을 넣을 경우 오류가 날 가능성이 높습니다.
  • 자소 검색에서 사용할 수 있는 와일드카드 문자는 다음과 같습니다.
    • * : 해당 위치에 나올 수 있는 모든 소리를 찾습니다. 예를 들어, '[ㄱ/ㅏ/*]'와 같이 입력했다면, 초성이 'ㄱ', 중성이 'ㅏ'인 모든 음절을 찾습니다. '가/강/감/...'등이 나온다고 예상할 수 있겠습니다.
    • @ : 해당 위치가 비어있음을 나타냅니다. 이 문자는 중성에서는 사용할 수 없습니다(중성이 비어 있는 소리는 없으니까요).

6) 사용례

Releases

No releases published

Packages

No packages published

Languages