-
Couldn't load subscription status.
- Fork 0
ex5
計算機を利用する受講生と自分のPCを利用する聴講生では演習環境に差が生じるため、各問題において作業ディレクトリを適宜読み替えること。
例: ~/gitc/data/5_ngs 等と記載している場合、利用者各自の判断で ~/Desktop/gitc/data/5_ngs と読み替える など。
~/gitc/data/5_ngs に移動せよ
2D2L_rep1_R1.fastq と 2D2L_rep1_R2.fastq ファイルはアラビドプシスの発芽・緑化後の芽⽣えをサンプリング、ライブラリー作製した paired-end read (76base x2) の RNA-Seq の⽣リードの fastq ファイルである。cutadapt のパラメータは以下を参考にせよ。
-q 30
-O 7
-m 50
-a AGATCGGAAGAGCACACGTCTGAACTCCAGTCA
-A AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT
-
- 上記のパラメータを用い、
2D2L_rep1_R1.fastqと2D2L_rep1_R2.fastqを paired-endでのcutadaptにかけよ。 -
cutadaptのlog を⾒て、pass したpair 数、quality trim されたbase 数を調べよ。 -
cutadapt処理前後の fastq ファイルをlessコマンド等で⾒⽐べよ -
wcコマンドでcutadapt前後のread 数を調べよ。 -
cutadapt処理前後の fastq ファイルをfastqcにかけ、cutadapt処理による、低品質配列が除かれていることを確認せよ。
- 上記のパラメータを用い、
-
seqkitを使ってリードファイルecoli.2.fastqecoli.3.fastqの statistic 情報を確認せよ。 -
bowtie2を使って、リードファイルecoli.2.fastqecoli.3.fastqを、リファレンスecoにマッピングし、結果をファイルeco_ex.samに出⼒せよ。その際、リードファイルはカンマ区切りで複数指定できることを使え。 -
samtoolsを使って、eco_ex.samを bam フォーマットに変換し、eco_ex.bamとして保存せよ -
samtoolsを使って、eco_ex.bamをソートし、eco_ex_sorted.bamとして保存せよ。現⾏samtoolsは4および5 の作業は⼀度にできうるが過程確認のため、今回は個別に⾏う。 -
samtoolsを使って、eco_ex_sorted.bamにインデックスを作成せよ -
samtoolsを使って、eco_ex_sorted.bamから以下の遺伝⼦にマップされたリードを取り出して数を数えよ。抽出された⾏を数えるには、wcコマンドを使うこと。
| 染⾊体名 | 開始位置-終了位置 | 遺伝⼦名 |
|---|---|---|
| chr | 337 - 2799 | thrA |
| chr | 4179268 - 4183296 | rpoB |