Skip to content

cgh2797/nltk_tutorial

Repository files navigation

NLTK 설치가 안되는 경우

과거 버젼에서 사용되었던 nltk.download() 를 사용하면 CERTIFICATE_VERIFY_FAILED] certificate verify failed 서버연결 오류로 문제가 발생합니다. 이와같은 경우에는 위와 같이 오류 메세지에서 제시하는 대로 따르면 됩니다, 이는 각각의 Corpus 파일을 다운받는 방법으로 문제를 해결 가능합니다

pip3 install -U nltk

import nltk; nltk.download('punkt')

만약 위의 방법으로도 해당 Corpus 가 설치되지 않고 계속 오류메세지를 출력하는 경우에는 수동으로 각각의 함수에서 요청하는 Corpus를 다운받아 설치하면 되며, 자세한 내용은 블로그 또는 동영상 해결방법 을 참고하시면 도움이 될 것입니다

nltk 자연어 분석도구

예제와 코드로 알아보는 파이썬 자연어 분석

사용한 모듈

nltk == 3.3
konlpy == 0.5.1
wordcloud == 1.5.0
scikit-learn == 0.19.2
scipy == 1.1.0
gensim == 3.5.0
tensorflow == 1.9.0

강의 대상

파이썬에 대한 학습 경험이 있는, 학생/ 직장인을 대상으로 자연어 분석과정 전반에 대한 내용을 다룹니다.

강의 목표

자연어 분석에 필요한 용어 및 개념들을 익히고, 간단한 사례와 소스코드 실습을 통해서 내용을 익힙니다.

강의 슬라이드

모든 슬라이드는 slideshare 에 공유를 하였고, linked in 또는 Facebook 계정만 있으면 다운로드 가능합니다

Step1 wordcloud 실습을 활용한 기본개념 익히기

Step2 sentence 문장분석

Step3 meaning 의미분석 / 베이지안 분류

Step4 Doc2Vec / Word2Vec

Step5 RNN 딥러닝 활용

전체과정을 4개의 슬라이드로 분할 구성하였고, 각 각의 슬라이드는 순서에 따른 연계성을 갖으므로, 이해안되는 부분이 있으시다면 앞의 내용을 한번 더 복습한 뒤 진도를 나아가는 방식으로 진행하시면 도움이 될 것입니다.

소스코드

소스 코드의 주석은 전체 진행 Process를 익히는데 도움이 되도록, 작업 단락을 기준으로 구분하였습니다.

About

NLP Intro

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published