- 2022년 6월 7일~2022년 6월 21일(약 2주)
- 유저의 final stats를 예측하는 EDA(Exploratory Data Analysis) 위주의 ML 프로젝트
- 이어드림 스쿨 40개 조 중, 우수 프로젝트 선정 및 PT 진행
- 데이터 용량 감소 후 로드 / 데이터 기본 정보 확인 및 결측치 파악
- target, categorical, numerical 분류에 따라 총 28개의 feature 상세 분석
- correlation에 기반한 6개의 가설 설정 및 검증 결과 도출
- data cleaning 및 feature selection 진행
- 경우의 수에 따른 모델 생성 및 평가 진행
- 2022년 7월 21일~2022년 8월 5일(약 2주)
- 세포 이미지 내 핵(nucleus)을 식별하는 instance segmentation 위주의 DL 프로젝트
- 이어드림 스쿨 21개 조 중, 우수 프로젝트 선정 및 PT 진행
- image와 mask의 경로를 추출하는 로직 함수화 및 시각화 진행
- cluster center에 기반한 clustering 진행
- image_id, image & mask 경로, cluster 정보가 포함된 dataframe 생성
- cluster에 따른 시각화 진행
- 단일 mask에 대한 외곽선 정보 추출 연습
- 전체 mask의 polygon과 bounding box 정보를 추출하는 로직 함수화
- 추출된 annotation 정보를 COCO format으로 변환하는 로직 함수화
- COCO API를 사용해 instance segmentation 시각화 진행