Skip to content
生命情報の機械学習入門(新学術領域「先進ゲノム支援」中級講習会資料)
Jupyter Notebook Python
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
data
img update data preparation for sequence analysis Nov 21, 2018
script
src
.gitignore add ignore file Nov 17, 2018
0_data_prep_and_visualization.ipynb
1_machine_learning_with_features.ipynb
2_deep_learning_for_features.ipynb modified text Nov 20, 2018
3_deep_learning_for_images.ipynb update descriptions Nov 21, 2018
4_deep_learning_for_sequences.ipynb update data preparation for sequence analysis Nov 21, 2018
README.md Update README.md May 10, 2019

README.md

生命情報・バイオインフォマティックス向けの機械学習入門

文責:瀬々 潤(ヒューマノーム研究所 & 産総研AIRC

この資料は、新学術領域「先進ゲノム支援」中級講習 (2018年11月実施) のために作成しました。

このコースでは、機械学習を利用したクラス分類問題を、実問題を利用して一通り問いてみることに焦点をあてます。 まず前半は、酵母の表現型データベースである、SCMD (Saccaromices cerevisiae Morphology Database) (Ohya, Sese et al. PNAS 2005, Saito et al. NAR 2004) のデータを利用して、酵母の画像(および、画像から抽出した特徴量)から、各細胞の細胞周期を同定する機械学習を実施します。

後半は、 世界のChIP-seqデータ(転写因子結合サイト実験)を収集し解析したデータベースであるChIP-Atlas (Oki et al. EMBO reports 2018) から、一次解析の終了したChIP-seqデータを基に、転写因子結合の有無を予測します。

  1. 0章 : データの準備、可視化
  2. 1章 : 特徴量を利用した機械学習(SVM, Random Forest)
  3. 2章 : 特徴量を利用した深層学習(PyTorchを利用して)
  4. 3章 : 画像を解析する深層学習
  5. 4章 : 配列を解析する深層学習

更新履歴: 2018/11/21: 初版作成

You can’t perform that action at this time.