Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

영어 처리 과정에서 오류가 있습니다. [english.py] #14

Open
5Hyeons opened this issue Aug 4, 2022 · 0 comments
Open

영어 처리 과정에서 오류가 있습니다. [english.py] #14

5Hyeons opened this issue Aug 4, 2022 · 0 comments

Comments

@5Hyeons
Copy link

5Hyeons commented Aug 4, 2022

eng_words = set(re.findall("[A-Za-z']+", string))

정규식 내에 따옴표 ' 때문에 영어 처리가 제대로 이루어지지 않습니다.
위를 그대로 사용할 경우
Input : the shawshank redemption'이다. 언뜻 생각하면 'escape'를 썼을 법한데 'redemption'을 썼다. redemption의 사전적 의미는 구원, 속죄, 회복이다.
output : 'the 쇼섄크 리뎀프션'이다. 언뜯 쌩가카면 'escape'를 써쓸 뻐판데 '리뎀프션'을 썯따. 리뎀프셔늬 사전저 긔미는 구원, 속쬐, 회보기다.

아무래도 대괄호를 닫는 과정에서 오타를 넣으신 것 같습니다.

따라서 eng_words = set(re.findall("[A-Za-z]+", string))로 수정하면 좋을 듯합니다.

수정 후 output : '더 쇼섄크 리뎀프션'이다. 언뜯 쌩가카면 '이스케이프'를 써쓸 뻐판데 '리뎀프션'을 썯따. 리뎀프셔늬 사전저 긔미는 구원, 속쬐, 회보기다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant