Skip to content

Latest commit

 

History

History
300 lines (214 loc) · 13.1 KB

README.md

File metadata and controls

300 lines (214 loc) · 13.1 KB

f# mishima2019

mishima.syk#14のスライドはこちら

GithubPagesで今回のまとめを作ってみました。→こちら

進んだこと

0日目

  • 三島に到着
  • AWSに初めて触れる
  • atomでREADMEを書き始める(プレビュー機能)

1日目

  • metagenome解析(実行)
  • Nimに触れる、atomで動かす

2日目

  • BS-seq解析(実行、解読)終了!
  • 発現類似度の計算スクリプト、Pythonverを理解、Pandasで。
  • ikraで40サンプルほどをまわした。iDEPに入れることはできた。
  • IsoformSwitchAnalyzeRのダイジェスト版を実行する
  • metagenome、他のサンプルでもQIIME2で解析できないか試してみる(途中)

3日目

  • metagenome解析(解読)
  • ikraをtravis ciに対応させる。
  • IsoformSwitchAnalyzeRを自前のデータでやってみる

4日目

  • leafcutterの実行
  • travis ciの並列化
  • coverallsをつける
  • プレゼン作成

5日目

  • mishima.syk#14の参加、発表

学んだことのまとめ

記録は全て、ScrapBoxに保存しています。ScrapBoxは無料でUPの制限もなく、コードがきれいに表示できる、ページとページを簡単に使えるので今イチオシでハマっています。

日々の感想

三島に来たからこそ、オフラインで学べたことを簡単に箇条書きで書いていきます。

19/09/16 0日目

到着。
ホテルのWiFiはルーターを使えば、わりと快適。

富士山きれい! huzi

19/09/17 1日目

  • 8:40発のバスで到着。

  • 坊農さんより、いろんな話をお聞きする。

  • 本の部数について初めて聞いたので驚いた

  • githubの勉強

  • copyleft・・・公開されたソフトウェアなどについて、利用・再配布・改変の自由を認める思想。

  • キャラの商品がある
    github

  • topでhello worldと検索すると、全世界でのたくさんのタイプミスが見つかる。
    https://github.com/search?q=hello+world
    気にせず未熟なコードを書き込め!という意味だそう。

19/09/18 2日目

  • Human Re-sequencing

  • ヒトのデータはそのデータベースから持ち出せない→cwlを渡して、そのパイプラインで解析してもらって、結果だけもらう。統一させる。

  • BS-seqも大きく変わる?

  • 今の技術は周りくどい。直接メチル化シトシンが読めればいい!
    nanoporeの仕組み(電位差を読む)で、「メチル化シトシン」が読み取れればいけるのでは?あとは精度の問題か。

  • issue#1より追記

すでにDNA methylationをNanoporeで読む技術はかなり確立。
https://academic.oup.com/nar/article/47/8/e46/5356940
Direct RNA sequencingによるfull length sequenceやm6AなどのRNA modificationも難しいけど可能なよう。
https://www.nature.com/articles/s41467-019-11713-9

  • RNA-seqも進歩の余地あり。

  • 今はcDNAに逆転写してるが、RNAの中にcDNAになりにくいものも。RNAを直接読みたい。nanopore?

  • Python2のmac2はどうなる。。。

  • ツールの開発は資金面が難しい。。。

    • イギリスのwellcome trust
  • ほおずきおいしい。

  • どこまでやりたいか。

  • 2日目にして、ホテルのTVをモニタ化できることに成功!笑
    フロントにダメ元で聞いてみたところ、入力切り替えできるリモコンを貸してもらえました。
    ただHDMIケーブルは持参必須ですね。 TV

19/09/19 3日目

19/09/20 4日目

  • PubMedにのるのは、出版されてから3〜4日程度かかる!誰かがやってくれているから。世の中そんなに便利じゃない。

  • 田舎はお店が厳しく自然淘汰される。おいしいお店しか残らない。中立説はない。田舎はその点がよいか。

  • しいたけキャッチャー

  • ベアードビール

  • 坊農さんより、明日のsykの発表のダイジェストを一足先に聞かせて頂く。

  • 坊農さんのスライド→https://github.com/bonohu/slides

  • git pitch、おもしろい!
    だが、もうすぐ有償化するらしい。。。
    https://gitpitch.com/bonohu/slides?p=190921mishimasyk14#/

メモ

  • a.k.a・・・also known as、またの名を。

  • Allie・・・CWL

  • CWLの使われている例→https://gitpitch.com/bonohu/slides?p=190921mishimasyk14#/3/3
    NCBIの例→PGAPNCBI Prokaryotic Genome Annotation Pipeline

  • Common Workflow Language Viewer→例)https://github.com/dbcls/AOE/blob/master/gethoge-and-pigz.cwl

  • kallisto bustools→https://www.kallistobus.tools/about

  • ええとこ

  • 個別のプログラムインストール不要。Dockerとcwltoolが入っていればいい

  • いろんなサーバーでメタ解析とかできる。

  • あかんとこ

  • コンテナサイズが巨大。

  • メモリが多く必要。プロセスのメモリ+Dockerのメモリが必要。

  • ハッシュタグ #CommonWL

  • 本→生命科学者のためのDr.Bonoデータ解析実践道場

  • 癌学会も。
    メモ

  • SNP chip

  • gnomAD browser
    genomAD browser

  • gnomAD⇒ノックアウトのヒト版(ALDH2とか)、遺伝的な変異。

  • TOGOVAR=gnomADの日本版。日本のデータ見るなら。

  • TOMMO(東北メディカル・メガバンク)、HGVD。

  • 専門医向けの講義。

  • COI Disclosure information → no financial

  • logistics of DB→DBのソムリエ。高速を潤滑にする役割。

  • Refex⇒GTEx

  • ChIP Atlas

  • DBCLS SRA・・・APIでJSONからwgetもできる。

    • エラスティックサーチ。
  • metascape

  • variant⇒somastic(体細胞変異)

  • UCSC genome browser⇒COSMICタブあり。

  • GWAS-catalog

  • HBB→rs334(鎌状赤血球)

  • TCGA

  • BRAF V600E(600番目のバリンが変化している)

  • slid→切片も見れる。

  • 資料は、cartに入れる→downloadできる。

19/09/21 5日目

  • 沼津港を訪れる。

  • Mishima.syk#14に参加する。conpass

  • ①KNIME @PK(@t_kahi

  • in vitroの創薬

  • KNIME analytics platform ⇒GUI KNIME Analytics Platform とは?

  • ケモインフォでよく使われる。

  • 中でRが使える。

  • random forestとか機械学習も。

  • cellProfiler(HCSのスタンダート、フリーソフト)を使った、high content analysis(high content screening)

  • High Content Screening(HCS)とは,何千もの化合物やsiRNAライブラリーを処理した細胞内の生理活性を測定することができる自動顕微鏡スクリーニング技術のこと。
    細胞や細胞内のオルガネラ,タンパク質などを複数の蛍光物質で染色をし測定することからhigh contentと呼ばれています.
    【HCS】High Content ScreeningとCellProfilerについてより。

  • ソフトは、condaとかでインストールできても、ライセンスがfreeじゃないときもある。

  • バイオインフォ系、統合TVもサポートしてた。→Galaxyだけが残った→その後、今はCWL。

  • ② 大川さん(@fmkz___)

  • ケモ、バイオインフォ。

  • データサイエンティスト→ドメイン、ITスキル、統計処理能力が必要。
    2種類存在、①まずドメインがある→プログラミング(創薬ではこっちが重視)、②IT→ドメインか。

  • udemyではデータサイエンティストにはなれない。汚いデータを前処理して、統計処理にもっていけることが必要。

  • KNWF・・・拡張子。

  • ③ (@iwatobipen)

  • Airflow

  • Luigiではない。

  • Jupyterでプレゼンができるっぽい→(参考:【Day-5】Jupyterでできる!イケてるプレゼンスライドの作り方
    Jupyter Notebookでプレゼンをするとっても便利な方法

  • AIrflow=ワークフローエンジンと言われるツールの一種で、 複数のタスクの実行順序を定義するワークフローの作成、実行のスケジューリング、監視などを行うことができる。(参考:初めて触るAirflow

  • Airflowのチュートリアルビデオ→Airflow tutorial 1: Introduction to Apache Airflow
    ドキュメント→https://airflow.apache.org/tutorial.html

  • ④ 露崎さん@antiplastics
    1細胞オミックス解析の新GSEA手法

  • 理研基礎科学特別研究員、JSTさきがけ研究員。

  • 趣味で発酵食品の作成

  • scRNA-seq

  • クラスタリング:細胞型を特定することの大変さ。
    論文にはすごい色たくさんの図が。。。→manualでつけた。 現場の泥臭さが反映されていない。

  • scTGIFを作った!→scTGIF

  • 細胞を関連する遺伝子名ではなく、遺伝子機能に結びつける。

  • attention mechanism(deep learning)

  • Rで、Bioconductorに登録したいときは→Contribute Packages to Bioconductorにissueをたてる。

  • Bioconductorで作ったツールをhexagon(六角形)のデザインにして、オーストラリアの形にしたのがすごい。⇒useR! 2018 feature wall

bioconductor

19/09/22 6日目

  • 少し観光して大阪に帰ります。

お食事日記

0日目


  • 近くのラーメン屋にて。

1日目

  • 昼 しんちゃん

  • 夜 ホテルの夜鳴きそば。

2日目


  • 夜 ウェンディーズ(チェーン店!)

3日目

  • 夜 しおや

4日目

  • 昼 もかすけ、えびとんこつつけ麺

5日目

  • 昼 磯はる食堂@沼津

  • 夜 千楽 北口店