Skip to content
No description, website, or topics provided.
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
.settings
part01
part02
part03
part04
part05
reference
README.md
event01.jpg
main01.jpg

README.md

빅바이오

스터디 정보

빅데이터을 활용한 바이오인포매틱스 + 통계기초 + 딥러닝 실습에 대한 스터디입니다.

공유폴더

https://drive.google.com/drive/folders/0B6bSLTlVnagfTFJqV0dwRGdGMWs

교재 정보

참고 자료

데이터 분석 실습

데이터 분석 실습용 데이터

  • 공유폴더 > 빅바이오 > 참고자료 > 학습용 데이터
  • mrna_20160125-200855_type1_00.pkl.gz 와 같은 파일이 24개, 전체 용량 700MB

장소

  1. 장소: 토즈 신촌 아트레온토즈점 ( http://www.toz.co.kr/branch/main/index.htm?id=6 )
  2. 매주 화요일, 저녁 7시 30분~10시
  3. 시작: 2016년03월 08일

스터디 공지

Schedule

Part 1.

seq. 날짜 내용 후기
1 2016. 3. 8 (통계기초) Introductory Statistics with R (Chap. 1~2)(이승우) 후기
(딥러닝 실습) Getting Started(남광우) 후기
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 2장(지용기)
2 2016. 3.15 (통계기초) Introductory Statistics with R (Chap. 3~4)(성민경) 후기
(딥러닝 실습) MNIST For ML Beginners의 발표자료(유재용), MNIST For ML Beginners의 코드
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 3장(우륭)
3 2016. 3.22 (통계기초) Introductory Statistics with R (Chap. 5~6), 이론설명(조현선)
(딥러닝 실습) Deep MNIST for Experts, 용어설명(박혜진)
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 4장(이재환)
4 2016. 3.29 (통계기초) Introductory Statistics with R (Chap. 7~8)(서승연) 후기
(통계기초) 7장 실습, 8장실습
(딥러닝 실습) TensorFlow Mechanics 101(박세진)
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 5장(박지환), 참고자료

Part 2.

seq. 날짜 내용 후기
1 2016. 4. 5 (통계기초) Introductory Statistics with R (Chap. 9~10)(이운섭) 후기
(딥러닝 실습) Convolutional Neural Networks(한성국), GuidetoConvolution.pdf, VisualizingCNN.pdf
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 6장(권선민)
2 2016. 4.12 (통계기초) Introductory Statistics with R (Chap. 11)(이승현)
(통계기초) Introductory Statistics with R (Chap. 12)(이승현)
(딥러닝 실습) TensorFlow Serving(손준영)
(딥러닝 실습) TensorFlow Serving(손준영)
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 7장(박혜진)
3 2016. 4.19 (통계기초)Introductory Statistics with R (Chap. 13~14)(서승연)
(딥러닝 실습) Vector Representations of Words(한성국)
(딥러닝 실습) 참고 논문 : DistributedRepresentations, Learning word embeddings efficiently, Efficient Estimation of Word Representations
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 8장(우륭)
4 2016. 4.26 (통계기초) Introductory Statistics with R (Chap. 15~16 이론)(유재용)
(통계기초) Introductory Statistics with R (Chap. 15~16 R실습)(유재용)
(딥러닝 실습) Recurrent Neural Networks 이론(지용기)
(딥러닝 실습) RNN 실습, Udacity Word2Vect, Udacity LSTM
(빅데이터 기초) 러닝 스파크(Learning Spark)이론: 1 ~ 2장(박세진)
(빅데이터 기초) 러닝 스파크(Learning Spark)실습: 1 ~ 2장(박세진)

Part 3.

seq. 날짜 내용 후기
1 2016.5.3 (딥러닝 실습) 암 환자의 유전체데이터 및 데이터 변환작업 소개 ( TCGA )(지용기)
(빅데이터 기초) 러닝 스파크(Learning Spark) 이론 : 3장(이승우)
(빅데이터 기초) 러닝 스파크(Learning Spark) 실습 : 3장(이승우)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 4장(박혜진)
2 2016.5.10 (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 1, 실습1)(조익연)
(딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 1, 실습2)(조익연)
(빅데이터 기초) 러닝 스파크(Learning Spark) 이론 : 5장(손준영)
(빅데이터 기초) 러닝 스파크(Learning Spark) 실습 : 5장(손준영)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 6장(박세진)
3 2016.5.17 (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 2)(조익연)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 7장(지용기)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 8장(박혜진)
4 2016.5.24 (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(MLP) 이론(한성국)
(딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(MLP) 코드(한성국)
(딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(데이터 변환 및 PCA 활용)(박혜진)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 9장(박세진)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 11장 이론(지용기)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 11장 실습(지용기)

Part 4.

seq. 날짜 내용 후기
1 2016.5.31 (구글 genomics) https://cloud.google.com/genomics/what-is-google-genomics :
What Is Google Genomics?, Pricing and Quotas , Getting Started (이승우)
(빅데이터 유전체 분석) Data Algorithms: 1장 , 2장 : Secondary Sort (박세진)
2 2016.6.7 (구글 genomics) How-to Guide: Analyze Variants Using BigQuery( 조익연 )발표자료
(빅데이터 유전체 분석) Data Algorithms: 5장 Order Inversion ( 박혜진 )
(빅데이터 유전체 분석) 테스트환경 구축
(빅데이터 유전체 분석) Data Algorithms: 6장 Moving Average( 지용기 )
3 2016. 6.14 (구글 genomics) How-to Guide : Installing the Cloud SDK and Genomics Commands(이창언) 발표자료
(빅데이터 유전체 분석) Data Algorithms: 7장 Market Basket Analysis( 박세진)
(빅데이터 유전체 분석) Data Algorithms: 8장 Common Friends(지용기 )
4 2016. 6.21 (구글 genomics) How-to Guide : Loading Genomic Variants (Peterpan Kim)발표자료
(빅데이터 유전체 분석) Data Algorithms: 9장 Recommendation Engines Using MapReduce (이승우)
(빅데이터 유전체 분석) Data Algorithms: 9장 보강
(빅데이터 유전체 분석) Data Algorithms: 10장 Content-Based Recommendation: Movies (이창언)

Part 5.

seq. 날짜 내용 후기
1 2016. 6.28 (구글 genomics) Broad Institute GATK on Google Genomics (박세진)
GATK 자료1, GATK 자료2, GATK 자료3
(빅데이터 유전체 분석) Data Algorithms: 11장 Smarter Email Marketing with the Markov Model (박혜진)
(빅데이터 유전체 분석) Data Algorithms: 12장 K-Means Clustering(송원종)
2 2016. 7. 5 (구글 genomics) Running Custom Pipelines 발표자료 (이승우)
(빅데이터 유전체 분석) Data Algorithms: 13장 k-Nearest Neighbors(이창언)
(빅데이터 유전체 분석) Data Algorithms: 14장 Naive Bayes(지용기)
3 2016. 7.12 (구글 genomics) Google Genomics Public Data
full list of published data정리, 3가지 access방법에 대한 예제 보여주기 (손준영)
(빅데이터 유전체 분석) Data Algorithms: 15장 Sentiment Analysis (송원종)
(빅데이터 유전체 분석) Data Algorithms: 16장 Finding, Counting, and Listing All Triangles in Large Graphs (지용기)
4 2016. 7.19 (구글 genomics)Docs » Process Data on Google Cloud » Run workflows and common tasks in parallel (손준영)
(빅데이터 유전체 분석) Data Algorithms: 17장 K-mer Counting (지용기)
(빅데이터 유전체 분석) Data Algorithms: 18장 DNA Sequencing (김가경)

Part 6. => 진행하지 않고 종강함. 아래 내용은 R바이오에 포함됨.

seq. 날짜 내용 후기
1 2016. x.xx (구글 genomics)Docs » Process Data on Google Cloud » Create a Grid Engine cluster on Compute Engine
(빅데이터 유전체 분석) Data Algorithms: 19장 Cox Regression
(빅데이터 유전체 분석) Data Algorithms: 20장 Cochran-Armitage Test for Trend
2 2016. x.xx (구글 genomics)Docs » Process Data on Google Cloud » Create a Grid Engine cluster with Preemptible VM workers
(빅데이터 유전체 분석) Data Algorithms: 21장 Allelic Frequency
(빅데이터 유전체 분석) Data Algorithms: 22장 The T-Test
3 2016. x.xx (구글 genomics) Docs » Process Data on Google Cloud » Run SAMtools to index BAM files in Cloud Storage
(빅데이터 유전체 분석) Data Algorithms: 23장 Pearson Correlation
(빅데이터 유전체 분석) Data Algorithms: 24장 DNA Base Count
4 2016. x.xx (구글 genomics) Docs » Analyze Data in Google Genomics » Analyze Reads
(빅데이터 유전체 분석) Data Algorithms: 25장 RNA Sequencing
(빅데이터 유전체 분석) Data Algorithms: 26장 Gene Aggregation

스케줄에 없는 구글 genomics 문서들

You can’t perform that action at this time.