개요 : 빅데이터 동아리 BOAZ 데이터 엔지니어링 부문 Adv 프로젝트 (18회 컨퍼런스)
기간 : 2023.04 - 2023.07
팀원 모두 웹툰에 큰 관심을 가지고 있으며, 웹툰을 자주 즐겨봅니다. 이러한 경험으로 웹툰 댓글에 대한 흥미와 관심도 더욱 높아졌습니다.
특히 '네이버 웹툰'은 국내 콘텐츠 점유율이 가장 높은 기업으로, 글로벌 웹툰 플랫폼에서도 최고의 위치를 차지하고 있습니다.
이러한 이유로 "네이버 웹툰 댓글 분석"이라는 주제를 선정하게 되었습니다.
- 웹툰 댓글을 수집 및 저장, 가공, 분석하여 빅데이터를 다루어본다
- 웹툰별 베스트댓글을 통해 각 웹툰별 유저들의 경향을 파악한다
- 연재 중인 주간 웹툰의 정보를 파악하여 웹툰 동향을 살펴본다
투니버스_스파크 기반 네이버 웹툰 댓글 수집 및 분석.pdf
이름 | 역할 | 부문/기수 | Github |
---|---|---|---|
김혜민 | 웹툰 정보 및 베스트 댓글 수집, 데이터 정제 및 댓글 분석&시각 | 데이터 엔지니어링 19기 | @HyeM207 |
박지윤 | 실시간 인기웹툰 랭킹 수집, 베스트 댓글 워드클라우드 | 데이터 엔지니어링 18기 | @Willow.yun(윌로) |
고병찬 | DB 모델링, 데이터 분석 및 시각화 | 데이터 엔지니어링 18기 | @chan1940 |
Field | Stack |
---|---|
사용 언어 | |
데이터 적재 | |
데이터 분석 및 정제 | |
Dashboard | Preset |
협업 도구 |