PARK HOIJAI 18309002
Beijing Jiaotong University
Software engineering
Mentor : Associate Prof. Mr.Li Yu
This project is my Graduation Project in BJTU, 2019/12 - 2020/05.
The project subject is User comment sentimental Analysis in Football League Community page using Bi_LSTM
- 프로젝트 소개 영상 (한국어) : https://youtu.be/4FSKS5ll_ok
자연어 처리를 이용한 유저의 감정 분석 및 내용 기반 카테고리 분류 웹 시스템입니다.
시스템 언어는 전부 Python으로 이루어져 있고, 네이버 무비 및 네이버 스포츠 그리고 네이버 포털 검색에서
학습에 필요한 데이터셋을 크롤링 하였습니다.
양방향 LSTM을 데이터 학습 모델로 선정하여, 감성분석 및 카테고리 분류 모델을 각각 따로 제작하였으며
두 모델은 92%이상의 높은 정확도를 보였습니다.
파이썬 플라스크 웹 프레임워크를 이용, 학습 내용을 바탕으로 연산처리 결과를
실시간으로 서빙하여 웹 페이지에 보여주었습니다.
- Flask --1.1.1
- SQAlchemy --1.3.1
- Tensorflow --1.15.2
- numpy --1.18.2
- gensim --3.8.1
- Google Colab Pro https://colab.research.google.com/
- PyCharm 2019.3.2
- Python 3.7
I do not share datasets due to copyright.
The dataset had been labeled like this,
and here is a Wordcloud based on the datasets from Naver sports news headlines
There is a map after the word embedding using Word2Vec
The dataset had been labeled like this,
and here is a Wordcloud based on the datasets from Naver movie user review comments
There is a map after the word embedding using Word2Vec
There is a accuracy after training (Epochs = 13)
there show pretty higher than i expect. almost over 92% both of them.
1.Main page
When you click the button, we can see the developer's info.
2.Football league category classification function page
When you click the button, we can check the football league category classification function
You can check the result, when i wrote about Hueng-min Son and Tottenham,
they said this sentence league category is "EPL" about 98%.
3.Comment sentimental analysis function page
When you click the button, we can check the =sentimental analysis function
You can check the result, when i wrote about Positive one,
they said the emotion of this sentence writter is "Positive" about 96%.