## ノートブックって何がうれしいの？

### ✏️ 楽々コマンド入力
オートコンプリート機能で、楽に正しくコマンド入力ができます。

![](https://media.githubusercontent.com/media/yamaton/test-binder/dev/binder/assets/autocomplete.gif)

これでもう `--thread` と `--threads` を間違えてエラーになったりしません。


### 🔍 コマンドの意味をポップアップ表示
カーソルをコマンドの各部に合わせるとポップアップが現れます。

![](https://media.githubusercontent.com/media/yamaton/test-binder/dev/binder/assets/hover.gif)

Usage を確認するのにも便利です。
`tar -xvf` のような呪文を解きほぐして意味が見えてくるはずです。


### 🏃 そのままコマンド実行
各種バイオインフォマティクスツールがプリインストール済みなので、セットアップの必要がありません。また実行環境を気にすることなく各コマンドを利用できます。



**\[備考\]** 内部的には `micromamba run` を通じて各conda環境内でコマンド実行されます。そのため多くのコマンド入っていても依存の衝突の心配がありません。


### 📁 ファイルブラウザ
画面左にファイルブラウザを表示できるので、もう `ls` とタイプする必要はありません。


対象を右クリックして **Copy Relative Path** を選択してからのペーストで、パスの入力間違いを防げます。

<img src="https://raw.githubusercontent.com/yamaton/test-binder/dev/binder/assets/copy-relative-path.png" alt="copy relative path" width="50%"/>


### 🎨 各種テーマ
メニューのSettings → Theme から各種テーマを選べます。

<img src="https://user-images.githubusercontent.com/36528777/79721723-6927f680-8315-11ea-8a5b-e2c298eeed09.png" alt="" width="50%"/>

<img src="https://raw.githubusercontent.com/simicd/jupyterlab-tailwind-theme/main/style/images/jupyterlab-tailwind-notebook-example-light.png" alt="" width="50%"/>

<img src="https://raw.githubusercontent.com/simicd/jupyterlab-tailwind-theme/main/style/images/jupyterlab-tailwind-notebook-example-dark.png" alt="" width="50%"/>


### 💻 ターミナル機能も
いざというときにはターミナルも利用できます。

タブの隣にあるプラス➕のボタンを押して "Terminal" をクリックすることで起動できます。






## コマンドラインツールを動かしてみる

次のセルにある `curl 'wttr.in` から始まるコマンドは、天気予報を出してくれます。
試しに実行してみてください。**セルを選択して Shift + Enter** です。

実行が終わったら「越中島」の部分を別の地名に変えてまた実行してみてください。

In [None]:
curl 'wttr.in/越中島?m&lang=ja'

## おもむろにバクテリアゲノムを de novo assembly してみる

ノートブックの使い勝手を確かめるべく、メルボルンの資料[^1]を雑に追いかけてバクテリアゲノムのショートリードデータの de novo assembly を行ってみます。

Shift+Enter を連打して実行していただくのもよし、隣に新しくセルを作って写経していただくのもよしです。

[^1]: https://www.melbournebioinformatics.org.au/tutorials/tutorials/assembly/assembly-protocol/



### 0. データの準備

資料と違い手元にデータが無いので、代わりに E. Coli の Illumina リード ([SRR030257](https://trace.ncbi.nlm.nih.gov/Traces/?view=run_browser&page_size=10&acc=SRR030257)) を使うことにします。

SRAからダウンロードをするため `sra-tools` に含まれる `prefetch` と `fasterq-dump` のコマンドを使います。

In [None]:
prefetch SRR030257

画面左のファイルブラウザで `SRR030257` が作られたのが確認できるはずです（成功していれば。）

`prefetch` コマンドがダウンロードしてくるのは `SRR030257.sra` というファイルなので、ここから FASTQ を取り出します。

In [None]:
fasterq-dump SRR030257

### 1. FASTQ データの確認

`SRR030257_1.fastq`, `SRR030257_2.fastq` という2つのファイルができました。

次のコマンドを実行して、リード数 "3800180", "Paired" と出ることを確認してください。
]

In [None]:
seqfu count SRR030257_*.fastq

### 2. クオリティコントロール (QC)

`fastqc` でリードの品質を眺めてみます。


In [None]:
fastqc SRR030257_*.fastq

`fastqc` はレポートをHTMLで出してくれます。

画面左のファイルブラウザで `SRR030257_1_fastqc.html` をダブルクリックしてみてください。同ファイル名で新しいタブが現れてレポートを確認できます。

資料ではここで `trimmomatic` を使ってトリミングの指示が出ていますが、今回はトリミング無しで進めてみます。アダプターとか既に取り除かれてるようですし。


### 3. アセンブリ

In [None]:
spades.py -1 "SRR030257_1.fastq" -2 "SRR030257_2.fastq" -o "spades_output" --threads 4

### 4. draft contig の確認

## インストール済みパッケージ一覧

Triton Notebook にはたくさんのバイオインフォマティックスのツールがインストール済みです。何か動かなかったり足りなかったりしたら [Telegram](https://t.me/yamaton) または [Twitter](https://twitter.com/phantomile) に投げてください。ツール名を並べてもらえばＯＫです。

インストール済みツールを確認するにはこちら⬇️を実行。

In [None]:
condax list --short