Skip to content

Taeu/HeLP-Challenge-Goldenpass

Repository files navigation

0. 스터디 소개

GPP

  • 팀명 : GoldenPass(골든패스)
  • 팀원 : 김대영, 김태우, 서창원, 최종현, 한성일
  • History
    • 2018.07.04 구글 머신러닝 스터디 잼 입문반 스터디 결성
    • 2018.07~08. 구글 머신러닝 스터디 잼 입문반 수료
    • 2018.09. Coursera course로 DL 스터디
    • 2018.10. 구글 머신러닝 스터디 잼 심화반 수료
    • 2018.11~12. Kaggle, DL 관련 책으로 스터디
    • 2018.01~02. HeLP-Challenge 참가 (2-2. 주제부분 3위/10팀)
    • 2018.02~ Facebook Developer Circle: Seoul에서 지원 받아 Spark Plus에서 스터디 중!!

1. 챌린지 소개

HeLP Challenge는 서울아산병원이 주최하는 의료인공지능 개발 콘테스트다. 관련 링크

  • 대회 목적 : 인공지능 개발자들이 서울 아산병원의 의료데이터에 접근하여 연구할 수 있는 플랫폼을 제공함으로써 세계적인 의료인공지능기술 개발에 기여하고자 함.
  • 참가자격 : 의료인공지능기술개발에 관심이 있는 개인, 대학, 스타트업, 연구기관, 기업
  • 콘테스트 내용
    • 1-1 뇌종양 MRI에서 뇌종양 영역 분할
    • 1-2 심장 CT에서 right&left ventricle chambers, left ventricle myocardium, and papillary muscle 분할
    • 2-1 뇌경색발생과 MRI 촬영 사이의 시간 추정
    • 2-2 병리조직 슬라이드에서 breast cancer metastasis 여부 판정
  • 우리 팀이 참가한 주제는 2-2 병리조직 슬라이드에서 breast cancer metastasis 여부 판정이다.
  • Contest 2-2. Breast cancer classification on frozen pathology 주제와 관련된 description wiki
  • 기간 : 2019.01.21.월 ~ 2019.03.03.월 6주간 진행

2. 진행 과정

  • 사전조사 : breast_cancer_challenges_tu.xlsxS sheet 참고

  • 진행과정 : breast_cancer_challenges_tu.xlsxSc sheet 참고

    • 2018.12.31 ~ 2019.01.06 (1주차) : 사전조사 완료
    • 2019.01.07 ~ 2019.01.13 (2주차) : Windows 환경에 Openslide package 설치, 관련 git 조사
    • 2019.01.14 ~ 2019.01.20 (3주차) : 설명회 참가. (거의 아무것도 안함)
    • 2019.01.21 ~ 2019.01.27 (4주차) : 대회 시작.
      • Openslide Package 뜯어보기
      • Data preprocessing
      • Whole process coding
      • Data analysis
      • Docker 공부, Finished Image 생성
    • 2019.01.28 ~ 2019.02.03 (5주차) : 대충 모델이 완성되어 거의 아무것도 안함..
    • 2019.02.03 ~ 2019.02.10 (6주차) : 설날.
      • 도커로 학습되는지 확인
      • 도커환경에서 돌릴 때 발생한 문제점들 하나씩 해결 (image build, docker file structure, package download, data preprocessing, memory, file handle etc..)
    • 2019.02.11 ~ 2019.02.17 (7주차) : 도커 학습 성공
      • 02.10. 첫 도커 학습 성공, 4시간 학습, Phase 1 score : 0.86
      • training set sample size, model (simple, unet, inception) 변경해가며 적용
      • data aug 빼면서 30시간 학습 (성능저하)
      • data aug 추가해보면서 학습시킴, 다양한 data aug 실험
      • 30 시간 학습 --> score 0.93으로 증가. epoch,
    • 2019.02.18 ~ 2019.02.24 (8주차) : Phase2 Open: 새로운 data set
      • Phase 2 submit에 맞게 inference 수정(그 전까지 학습한 model 활용 불가하게 됨..)
      • 02.19. Phase 2 첫 score 0.66
      • Phase1 score와 Phase2 score의 차이가 큼. sampling , 학습방법 잘못됐다는거 인지
      • 02.21. sampling method 수정
    • 2019.02.25 ~ 2019.03.03 (9주차)
      • 02.25~27. 학습속도가 너무 느려 image 저장하고 data 저장하는 방식으로 변경, 30시간 학습, 성능 저하..
      • learning decay (keras call back 활용)
      • 02.21에 변경한 모델로 60시간 정도 학습하는 걸로 마무리 (20000 samples 20 epochs) ( Phase 1 score 0.86 -> Phase 2 score 0.75)
      • 03.03. ensemble 노가다. Phase2 0.76 마무리 (3위 / 10 팀)

3. 관련 기술 소개

4. 결과

Contest 2-2. Breast cancer classification on frozen pathology : 3위 / 10 팀

p1

(Phase 2로 시상)

p2

5. 후기

  • 김태우 : 참가 후기 글

  • 최종현 : 처음에 대회 OT에 참여 했을 때, 대단하신 분들이 많아서 저희 팀끼리 농담으로 '꼴등만 하지 말자'라고 했던게 엊그제 같은데 벌써 대회가 끝났네요. HeLP Challenge를 진행하면서 많은 것들을 배울 수 있어서 좋았습니다

    • 좋았던점 :
      • 쉽게 접해 보지 못 했던 의료 데이터를 가지고 딥러닝 모델에 적용해 볼 수 있어서 좋았습니다.
      • 결과 파일을 도커(docker) 이미지 파일로 제출해야 했기 때문에, 도커에 대한 지식을 쌓을 수 있었습니다.
      • 스터디 팀원들과 함께 딥러닝을 공부했던 것들을 실제 데이터에 적용하여, 전처리 부터 모델링까지 전체 과정을 경험해 볼 수 있었습니다.
    • 아쉬웠던 점 :
      • '이것은 도커 대회인가 딥러닝 대회인가'라고 느낄 정도로 저에겐 도커 때문에 제약사항이 많았습니다.
      • 도커로 이미지 파일을 올려야 했기 때문에, 실시간으로 학습(Training)이 잘 되고 있는지 확인하기 어려웠습니다.
      • 도커로 이미지 파일을 올려야 했기 때문에, 학습 후 Inference 과정에서 에러가 나면 처음 부터 다시 학습시켜야 한다는 번거로움이 있었습니다.
  • 김대영 : 조직 슬라이드라는 의료 데이터를 통한 딥러닝 모델을 만들어 볼 수 있는 값진 경험을 했습니다.
    openslide 라이브러리를 통한 데이터 분석은 낯설어서 더 어렵게 느껴졌지만 확실히 신선하며 재미있었고,
    저 역시 도커 때문에 많은 삽질을 경험하긴 했지만 덕분에 도커 관련 지식도 많이 알게 되어서 좋았습니다.
    이번 대회를 하며 한 층 성장하게 된 것 같아서 기쁘고,
    무엇보다도 대회기간 동안 애써주신 모든 팀원분들께도 감사 말씀드립니다!😍
    마지막으로 케라스는 사랑입니다💖

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •