Skip to content
dritoshi edited this page Feb 20, 2012 · 5 revisions

取り扱う話題

1. ChIP-seq 解析の前処理、peak calling などを理解する

この部分については R + Bioconductor で扱うことはあまりなく、そのほかの優れたソフトウェアを利用するのが一般的です。そこでハンズオンではなく講義のみで行います。実験のクオリティチェックや、ゲノムへのマッピングなどの前処理や peak calling などについて紹介します。

2. ChIP-seq データを R + Bioconductor で扱えるようにする

  • BED file を GenomicRanges オブジェクトへ変換し、rdat 形式で保存する

3. ChIP-seq の peak にアノテーションをつける

  • Peak caller で予測された転写因子結合サイトを近傍の遺伝子に割り当てる
  • 近傍に peak を持つ遺伝子へ、有意に assignment される Gene Ontology を挙げる

4. ChIP-seq の peak 内DNA配列からDNAモチーフを検索する

  • Peak 内のDNA配列を得る
  • peak 内の DNA 配列に有意に頻出する DNA モチーフ配列を予測する
  • DNA モチーフデータベースにある position weight matrix を peak 内DNA配列に対して検索する
  • モチーフ分布を描画する

5. 2つの異なる転写因子の ChIP-seq データを比較をする

  • オーバラップする peak を得る

講義のスタイルについて

ChIP-seq の計算は、計算量が多かったり、ネットワークから大量のデータをダウンロードしながら行うため、時間がかかります。当日は時間が限られていることもあり、事前に計算済みのファイルを利用して、実際の実行を飛しながら進めます。時間はかかりますが、MacBook Air や自宅の光回線などでも計算可能な時間(数分から数時間程度)のコードを紹介しています。講義用のソースコードにはそれらのデータも含まれています。以下からダウンロード可能です。

https://github.com/dritoshi/jsbi_chipseq/zipball/master

Clone this wiki locally