f# mishima2019
mishima.syk#14のスライドはこちら
GithubPagesで今回のまとめを作ってみました。→こちら
- 三島に到着
- AWSに初めて触れる
- atomでREADMEを書き始める(プレビュー機能)
- metagenome解析(実行)
- Nimに触れる、atomで動かす
- BS-seq解析(実行、解読)終了!
- 発現類似度の計算スクリプト、Pythonverを理解、Pandasで。
- ikraで40サンプルほどをまわした。iDEPに入れることはできた。
- IsoformSwitchAnalyzeRのダイジェスト版を実行する
- metagenome、他のサンプルでもQIIME2で解析できないか試してみる(途中)
- metagenome解析(解読)
- ikraをtravis ciに対応させる。
- IsoformSwitchAnalyzeRを自前のデータでやってみる
- leafcutterの実行
- travis ciの並列化
- coverallsをつける
- プレゼン作成
- mishima.syk#14の参加、発表
記録は全て、ScrapBoxに保存しています。ScrapBoxは無料でUPの制限もなく、コードがきれいに表示できる、ページとページを簡単に使えるので今イチオシでハマっています。
三島に来たからこそ、オフラインで学べたことを簡単に箇条書きで書いていきます。
到着。
ホテルのWiFiはルーターを使えば、わりと快適。
-
三島駅の南北連絡通路がない。。。
三島駅の南北通り抜け -
Markdownの記法を学ぶ
参考:Git Hubにて使用する簡単なMarkdown記法まとめ
markdown-cheatsheet.md- atomでプレビューができる。
→AtomのMarkdownプレビュー機能を使ってみた
- atomでプレビューができる。
-
AWSの入門
-
8:40発のバスで到着。
-
坊農さんより、いろんな話をお聞きする。
-
本の部数について初めて聞いたので驚いた
-
githubの勉強
-
copyleft・・・公開されたソフトウェアなどについて、利用・再配布・改変の自由を認める思想。
-
topでhello worldと検索すると、全世界でのたくさんのタイプミスが見つかる。
https://github.com/search?q=hello+world
気にせず未熟なコードを書き込め!という意味だそう。
-
ヒトのデータはそのデータベースから持ち出せない→cwlを渡して、そのパイプラインで解析してもらって、結果だけもらう。統一させる。
-
BS-seqも大きく変わる?
-
今の技術は周りくどい。直接メチル化シトシンが読めればいい!
nanoporeの仕組み(電位差を読む)で、「メチル化シトシン」が読み取れればいけるのでは?あとは精度の問題か。 -
issue#1より追記
すでにDNA methylationをNanoporeで読む技術はかなり確立。
https://academic.oup.com/nar/article/47/8/e46/5356940
Direct RNA sequencingによるfull length sequenceやm6AなどのRNA modificationも難しいけど可能なよう。
https://www.nature.com/articles/s41467-019-11713-9
-
RNA-seqも進歩の余地あり。
-
今はcDNAに逆転写してるが、RNAの中にcDNAになりにくいものも。RNAを直接読みたい。nanopore?
-
Python2のmac2はどうなる。。。
-
ツールの開発は資金面が難しい。。。
- イギリスのwellcome trust
-
ほおずきおいしい。
-
どこまでやりたいか。
-
2日目にして、ホテルのTVをモニタ化できることに成功!笑
フロントにダメ元で聞いてみたところ、入力切り替えできるリモコンを貸してもらえました。
ただHDMIケーブルは持参必須ですね。
-
今日は初富士山!
-
メタゲノムも結局メタデータが一番大事。どんな条件でサンプルとったのか。突き詰めたら、その日の気温は、湿度は、等々。細胞の良さ具合とか。
-
寄生蜂。1個の卵が数個~数千個の胚を生じる。ゲノムはn半数体。
-
ソルジャー
-
真社会性→真社会性・・・ハチやアリの社会はすごい
-
シルク×パーキンソン病の論文→Identification of key uric acid synthesis pathway in a unique mutant silkworm Bombyx mori model of Parkinson's disease.
-
micropython→MicroPython ガイド
-
PubMedにのるのは、出版されてから3〜4日程度かかる!誰かがやってくれているから。世の中そんなに便利じゃない。
-
田舎はお店が厳しく自然淘汰される。おいしいお店しか残らない。中立説はない。田舎はその点がよいか。
-
しいたけキャッチャー
-
坊農さんより、明日のsykの発表のダイジェストを一足先に聞かせて頂く。
-
坊農さんのスライド→https://github.com/bonohu/slides
-
git pitch、おもしろい!
だが、もうすぐ有償化するらしい。。。
https://gitpitch.com/bonohu/slides?p=190921mishimasyk14#/
メモ
-
a.k.a・・・also known as、またの名を。
-
Allie・・・CWL
-
CWLの使われている例→https://gitpitch.com/bonohu/slides?p=190921mishimasyk14#/3/3
NCBIの例→PGAPNCBI Prokaryotic Genome Annotation Pipeline -
Common Workflow Language Viewer→例)https://github.com/dbcls/AOE/blob/master/gethoge-and-pigz.cwl
-
kallisto bustools→https://www.kallistobus.tools/about
-
ええとこ
-
個別のプログラムインストール不要。Dockerとcwltoolが入っていればいい
-
いろんなサーバーでメタ解析とかできる。
-
あかんとこ
-
コンテナサイズが巨大。
-
メモリが多く必要。プロセスのメモリ+Dockerのメモリが必要。
-
ハッシュタグ #CommonWL
-
本→生命科学者のためのDr.Bonoデータ解析実践道場
-
癌学会も。
メモ -
SNP chip
-
gnomAD⇒ノックアウトのヒト版(ALDH2とか)、遺伝的な変異。
-
TOGOVAR=gnomADの日本版。日本のデータ見るなら。
-
TOMMO(東北メディカル・メガバンク)、HGVD。
-
専門医向けの講義。
-
COI Disclosure information → no financial
-
logistics of DB→DBのソムリエ。高速を潤滑にする役割。
-
Refex⇒GTEx
-
ChIP Atlas
-
DBCLS SRA・・・APIでJSONからwgetもできる。
- エラスティックサーチ。
-
metascape
-
variant⇒somastic(体細胞変異)
-
UCSC genome browser⇒COSMICタブあり。
-
GWAS-catalog
-
HBB→rs334(鎌状赤血球)
-
TCGA
-
BRAF V600E(600番目のバリンが変化している)
-
slid→切片も見れる。
-
資料は、cartに入れる→downloadできる。
-
沼津港を訪れる。
-
Mishima.syk#14に参加する。conpass
-
①KNIME @PK(@t_kahi)
-
in vitroの創薬
-
KNIME analytics platform ⇒GUI KNIME Analytics Platform とは?
-
ケモインフォでよく使われる。
-
中でRが使える。
-
random forestとか機械学習も。
-
cellProfiler(HCSのスタンダート、フリーソフト)を使った、high content analysis(high content screening)
-
High Content Screening(HCS)とは,何千もの化合物やsiRNAライブラリーを処理した細胞内の生理活性を測定することができる自動顕微鏡スクリーニング技術のこと。
細胞や細胞内のオルガネラ,タンパク質などを複数の蛍光物質で染色をし測定することからhigh contentと呼ばれています.
【HCS】High Content ScreeningとCellProfilerについてより。 -
ソフトは、condaとかでインストールできても、ライセンスがfreeじゃないときもある。
-
バイオインフォ系、統合TVもサポートしてた。→Galaxyだけが残った→その後、今はCWL。
-
② 大川さん(@fmkz___)
-
ケモ、バイオインフォ。
-
データサイエンティスト→ドメイン、ITスキル、統計処理能力が必要。
2種類存在、①まずドメインがある→プログラミング(創薬ではこっちが重視)、②IT→ドメインか。 -
udemyではデータサイエンティストにはなれない。汚いデータを前処理して、統計処理にもっていけることが必要。
-
KNWF・・・拡張子。
-
③ (@iwatobipen)
-
Airflow
-
Luigiではない。
-
Jupyterでプレゼンができるっぽい→(参考:【Day-5】Jupyterでできる!イケてるプレゼンスライドの作り方
Jupyter Notebookでプレゼンをするとっても便利な方法) -
AIrflow=ワークフローエンジンと言われるツールの一種で、 複数のタスクの実行順序を定義するワークフローの作成、実行のスケジューリング、監視などを行うことができる。(参考:初めて触るAirflow)
-
Airflowのチュートリアルビデオ→Airflow tutorial 1: Introduction to Apache Airflow
ドキュメント→https://airflow.apache.org/tutorial.html -
④ 露崎さん@antiplastics
1細胞オミックス解析の新GSEA手法 -
理研基礎科学特別研究員、JSTさきがけ研究員。
-
趣味で発酵食品の作成
-
scRNA-seq
-
クラスタリング:細胞型を特定することの大変さ。
論文にはすごい色たくさんの図が。。。→manualでつけた。 現場の泥臭さが反映されていない。 -
scTGIFを作った!→scTGIF
-
細胞を関連する遺伝子名ではなく、遺伝子機能に結びつける。
-
attention mechanism(deep learning)
-
Rで、Bioconductorに登録したいときは→Contribute Packages to Bioconductorにissueをたてる。
-
Bioconductorで作ったツールをhexagon(六角形)のデザインにして、オーストラリアの形にしたのがすごい。⇒useR! 2018 feature wall
-
NOISeqを高速化した改造版が、metaSeq。metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
-
PyCon=Pythonのmeeting。PyCon JP2019
-
LT-角崎太郎さん
-
CWLについて。
-
WebからKNIMEを使う話
-
スライド→https://github.com/kochi0603/mishima14/blob/master/20190209_mishima_syk_flask.pdf ,https://github.com/kochi0603/mishima14/blob/master/KNIME_batch_mode_20190921_kochi.pdf
- 少し観光して大阪に帰ります。
- 夜
近くのラーメン屋にて。
- 昼 しんちゃん
- 夜
ホテルの夜鳴きそば。
- 昼
- 夜 ウェンディーズ(チェーン店!)
- 夜 しおや
- 昼 もかすけ、えびとんこつつけ麺
- 昼 磯はる食堂@沼津
- 夜 千楽 北口店