Dataon의 2022 연구 데이터 분석활용 경진대회에 참여하며 진행했습니다.
제가 진행하면서 직접 구현한 코드들을 올리고 경진대회가 끝나면 최종 모듈 결과도 분리해서 추가 합니다.
본 프로젝트는 “Gexp”라는 이름의,
TCGA의 유전자발현 데이터에서 암을 구별할 수 있는 마커 유전자를 검출하는 라이브러리 소프트웨어를 개발하는 것을 목표로 합니다.
Step | 모듈 기능 | |
---|---|---|
1 | ☑️ | Web crawling을 통한 암 환자 데이터 로드 모듈 |
2 | ☑️ | 압축해제와 암 환자 라벨링 모듈 |
3 | ☑️ | 수치/통계/머신러닝 방법들을 통한 마커 유전자 탐색 모듈 |
4 | 마커 유전자 선택 모듈 | |
5 | 선택된 마커 유전자의 점수 시각화 모듈 | |
6 | 선택한 마커 유전자를 시각화 및 클러스터링 모듈 | |
Final | 경진대회에서 Gexp 시연 발표 |