2021년 11월 민원 데이터 분석 공모전

장려상(동국대학교 통계학과)

#1

민원 데이터에 대한 자유 분석이 주제였으며, 세부 주제로는 민원 데이터를 활용하여, 이미 제안된 민원과 유사한 정도를 텍스트마이닝을 통해 측정하여 민원 관리자와 민원인 양 쪽에서 시간을 단축하고 노동력을 절감할 수 있도록 하였다. 해당 분석을 실제로 활용하기 위하여, Python을 통해 간단한 검색 시스템까지 구현하고자 하였다.

#2

프로젝트의 흐름을 도식화함.

#3

주 분석 방법으로는 LDA 토픽모델링을 활용하였다. 토픽모델링을 통해 텍스트 데이터를 클러스터링 비슷하게 하였다.

#4

Tf-idf를 이용해서 임베딩 처리한 텍스트 데이터를 통해, 유사도가 높은 과거의 민원을 뽑아오고, 그 과정에서 Filtering을 해주는 방법론으로 이전 슬라이드의 토픽 모델링을 활용한 토픽 index을 활용하였다. 즉, 토픽이 동일한 민원 내에서 유사도가 높은 것을 긁어온다.

#5

Python Flask를 활용하여 검색 서비스를 간단하게 개발하였음. 서버를 구입하여 외부에서 사용할 수 있도록 하는 정도까지는 구현하지 못하였으나, 가볍게 서버와 클라이언트를 나눠 클라이언트에서 민원을 문장 형태로 입력하면, 서버에서 토픽과 텍스트의 유사도를 활용하여 과거 민원을 추천해주는 형식으로 구현하였음.

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
1_텍스트클리닝.ipynb		1_텍스트클리닝.ipynb
2_전처리.ipynb		2_전처리.ipynb
3_twitter+미등록어.ipynb		3_twitter+미등록어.ipynb
3_명사추출(Okt).ipynb		3_명사추출(Okt).ipynb
4_데이터분석(dldks).ipynb		4_데이터분석(dldks).ipynb
4_데이터분석(khaiii).ipynb		4_데이터분석(khaiii).ipynb
5_시각화(djswl).ipynb		5_시각화(djswl).ipynb
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

2021년 11월 민원 데이터 분석 공모전

About

Releases

Packages

Languages

License

YianKim/Complaints-NLP-Visualization-2021

Folders and files

Latest commit

History

Repository files navigation

2021년 11월 민원 데이터 분석 공모전

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages