Skip to content

bluewink/dataQualityClassifier

Repository files navigation

빅터링: 빅데이터 품질 분석기

프로젝트 추진배경

빅데이터 활용이 증가함에 따라 데이터 전처리를 위한 비용, 피로도가 늘어나고 있습니다. 데이터 품질을 평가, 제공함으로써 데이터를 분류하는데 드는 비용, 부담을 절감하고자 했습니다.

기능

  • 뉴스 기사 댓글 크롤링
  • 오류 사전 기반 데이터 품질 분석
  • 의사결정 트리 기반 데이터 품질 분석
  • 품질 분석 결과 도표화

프로젝트 수행 기간

2020.05. ~ 2020.01

기술 스택

  • Python
  • Beautiful soup
  • Scikit-learn
  • React js

프로젝트 시연 영상

Alt text

프로젝트 성과

2020 한이음 공모전에서 입선 수상

About

data quality classifier using AI

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors