-
Notifications
You must be signed in to change notification settings - Fork 2
Lecture
dritoshi edited this page Feb 20, 2012
·
5 revisions
この部分については R + Bioconductor で扱うことはあまりなく、そのほかの優れたソフトウェアを利用するのが一般的です。そこでハンズオンではなく講義のみで行います。実験のクオリティチェックや、ゲノムへのマッピングなどの前処理や peak calling などについて紹介します。
- BED file を GenomicRanges オブジェクトへ変換し、rdat 形式で保存する
- Peak caller で予測された転写因子結合サイトを近傍の遺伝子に割り当てる
- 近傍に peak を持つ遺伝子へ、有意に assignment される Gene Ontology を挙げる
- Peak 内のDNA配列を得る
- peak 内の DNA 配列に有意に頻出する DNA モチーフ配列を予測する
- DNA モチーフデータベースにある position weight matrix を peak 内DNA配列に対して検索する
- モチーフ分布を描画する
- オーバラップする peak を得る
ChIP-seq の計算は、計算量が多かったり、ネットワークから大量のデータをダウンロードしながら行うため、時間がかかります。当日は時間が限られていることもあり、事前に計算済みのファイルを利用して、実際の実行を飛しながら進めます。時間はかかりますが、MacBook Air や自宅の光回線などでも計算可能な時間(数分から数時間程度)のコードを紹介しています。講義用のソースコードにはそれらのデータも含まれています。以下からダウンロード可能です。