과거 버젼에서 사용되었던 nltk.download() 를 사용하면 CERTIFICATE_VERIFY_FAILED] certificate verify failed 서버연결 오류로 문제가 발생합니다. 이와같은 경우에는 위와 같이 오류 메세지에서 제시하는 대로 따르면 됩니다, 이는 각각의 Corpus 파일을 다운받는 방법으로 문제를 해결 가능합니다
pip3 install -U nltk
import nltk; nltk.download('punkt')
만약 위의 방법으로도 해당 Corpus 가 설치되지 않고 계속 오류메세지를 출력하는 경우에는 수동으로 각각의 함수에서 요청하는 Corpus를 다운받아 설치하면 되며, 자세한 내용은 블로그 또는 동영상 해결방법 을 참고하시면 도움이 될 것입니다
nltk 자연어 분석도구nltk == 3.3
konlpy == 0.5.1
wordcloud == 1.5.0
scikit-learn == 0.19.2
scipy == 1.1.0
gensim == 3.5.0
tensorflow == 1.9.0
파이썬에 대한 학습 경험이 있는, 학생/ 직장인을 대상으로 자연어 분석과정 전반에 대한 내용을 다룹니다.
자연어 분석에 필요한 용어 및 개념들을 익히고, 간단한 사례와 소스코드 실습을 통해서 내용을 익힙니다.
모든 슬라이드는 slideshare 에 공유를 하였고, linked in 또는 Facebook 계정만 있으면 다운로드 가능합니다
Step1 wordcloud 실습을 활용한 기본개념 익히기
전체과정을 4개의 슬라이드로 분할 구성하였고, 각 각의 슬라이드는 순서에 따른 연계성을 갖으므로, 이해안되는 부분이 있으시다면 앞의 내용을 한번 더 복습한 뒤 진도를 나아가는 방식으로 진행하시면 도움이 될 것입니다.
소스 코드의 주석은 전체 진행 Process를 익히는데 도움이 되도록, 작업 단락을 기준으로 구분하였습니다.

