Skip to content

해커스 토익 기출보카 단어 문제집에서 정답을 추출하는 모듈

Notifications You must be signed in to change notification settings

tiod0611/ExtractWordFromHackers

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Extract word from 해커스 보카 단어 시험지

본 모듈은 '해커스'에서 제공하는 무료 단어장 생성기 에서 생성된 PDF파일에서 문제와 정답(영단어)을 추출하여 csv 파일로 반환합니다.

1. Installation

  • windows
$ install.bat
  • mac
$ sh install.sh

2. Usage

a. 해커스_단어시험_생성기 에서 생성한 단어장을 test_papers 폴더에 넣는다. (※여러개의 파일이 있을 경우 파일의 기본 순서대로 결과가 만들어 짐)

b. terminalpython ./Extractwords.py 를 입력함

$ python ./Extractwords.py

3. Result

완성된 결과물은 해당 폴더에 answersheet.csv 로 만들어 짐


추가 할 일

  1. 한글 단어 배열에 발생하는 문제 해결하기.

    • 사용자에게 day와 타입 인자를 받게 하고 url에서 바로 pdf를 20개씩 읽어와서 문제 만들기
    • 중복된 단어 없이 40개의 문제가 되도록 할것
  2. 문제가 발생하는 특정케이스 패턴 분석하여 예외처리하기 -> 상시 + 예외 케이스 모으기

  • Google SpreadSheet와 연동하여 자동 업데이트 만들기 -> 보류

About

해커스 토익 기출보카 단어 문제집에서 정답을 추출하는 모듈

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published