Skip to content

20180329

percipere edited this page Mar 29, 2018 · 35 revisions

第2回研究会開催案内

趣旨:ワークフローシステム、再現性、自動化、及びそれに関連する様々な事柄について、知見を交換したり、技術を高めるための研究会です

日程:2018年3月29日

時間:10時から19時

場所:理化学研究所、東京連絡事務所(15階)    第5会議室(以前第2会議室とアナウンスしていました。すみません。)、部屋の前に、10:00-19:00 Workflow Meetupって書いてある看板があると思います。

アクセス:東京連絡事務所・革新知能統合研究センター・医科学イノベーションハブ推進プログラムへのアクセス | 理化学研究所

  1. 地下鉄できたときは、1階まで行く
  2. 1階から6階まであがるエレベータにのる(ドラッグストアの近くのエレベータです。)
  3. 6階から15階まであがるエレベータにのる(会社の受付のようなところをとおりすぎ奥の方へいくとエレベータがあります、入場ゲートはとおらないです)

東京連絡事務所に入った後、第5会議室への行き方

  1. 入って、左手に進む。
  2. 広いスペースにはいるところ左手、わかりやすい位置に看板があります。

プログラム

時間 内容 備考
10:00-11:30 作業
11:30-12:30 昼食 まわりがこみそうなので、とりあえずこの時間に設定しました
12:30-13:30 作業
13:30-14:00 トーク「Garuda Platform の紹介」
14:00-15:00 作業
15:00-15:30 中間報告、問題点共有
15:30-18:00 作業
18:00-19:00 まとめ

トーク「Garuda Platform の紹介」(Nikolaos Tsormanさん, システム・バイオロジー研究機構 - The Systems Biology Institute)

Garuda Platform の紹介を、開発されている方々から予定しています。

Latest Garuda Developer Pack here.

For any questions please contact Nikos Tsorman.

発表時間は 13:30 から 30-40分の予定です。

事前計画

西田孝三 (理研QBiC 生化学シミュレーション研究チーム)

具体的な開発予定

E-Cell4 の Azure Batch 活用機能を切り出したプログラムの GARUDA gadget化

  • GARUDAはデスクトップアプリケーションだがE-Cell4で研究レベルのシミュレーションを行うにはローカルのPCでは無理がある
  • バイオクラウドハッカソン以降E-Cell4は Azure Batchを用いて並列計算で複数回のシミュレーション結果の統計を得ることが可能になった。
    • (細かいことではあるが)Azure Batchを用いる場合, ローカルPCへのE-Cell4(とその依存物)のinstallをユーザーに強いる必要も無くなる

他参加者からの情報提供を希望すること,自分が調査したいと思っていること

  1. アノテーションパイプライン (e.g. https://twitter.com/uniprot/status/976030489252433921)
  2. タスクスケジューリングパイプラインの調査 (dask + luigi?)
  3. (抽象的な)モデルの利用に適したパイプラインの(記法の)有無の調査 (データ同化分野でこういったものがあるかも?,データサイエンスではレコメンドエンジンコンテストなどで「予測タスクのワークフロー設計」や「性能評価のためのデータ分割方法」がコツとして存在する?)
  4. ID Conversion ワークフローがあれば知りたい
  5. AWS, GCP に Azure オープンライセンス相当があるか知りたい

その他

  • 所属ラボの強み・プロジェクトとは異なりますがCytoscapeの最新動向を知りたい方のサポートはできるかもしれないです。

石井学 (理化学研究所 バイオインフォマティクス研究開発ユニット)

具体的な開発予定

  • ACE EditorでのCWLのシンタックスハイライトの作成
  • ワークフローシステム(CWLとかNextflowなど)の紹介スライドの作成
  • できたら
    • Yacleの実装(CWLのGolang実装)
    • Galaxyでの、CWLサポートについて可能であればサポートを広げる
    • Galaxy多言語対応

他参加者からの情報提供を希望すること,自分が調査したいと思っていること

  1. ご自身で開発中のシステムを含めて、CWLやNextflowなどワークフローシステムを使っているところや、使っている情報があれば知りたいです
  2. Nextflowの Kubernetes サポートについてどうやっているのかなど
  3. uDockerの中身、具体的な挙動

その他

  • Azure Batchや、AWS Batchなどを使ったジョブ実行方式について調べたいと思っています。dockerコンテナつかえるのかなど。
  • セキュリティ関連
  • 下記のシステムなど使用(開発)経験はあるので、そのあたりは応えられるかもしれません。
    • Puppet, Ansible, Chef, Jenkins
    • Java, Python
    • Galaxy, CWL
    • 各種エディタでの、言語ハイライト

大田

やること予定

聞きたいこと、調査したいこと

  • Singularity
    • 既にある CWL workflows 動くのか調査
    • dockerのセキュリティ問題を本当に解決しているのか調査

やったこと

  • 邪悪なCWLを睨んでいた https://github.com/pitagora-galaxy/cwl/pull/3
    • validation をしない、readability を上げる、という意味では inputs class: File[] とすべきだが…
  • 引き続きまともな方法を探す
  • singularity 試す時間なかったのでまた今度

事前計画の雛形()

「お名前」以降「その他」までをコピーして、 やることや興味があることなどを事前に書いておいていただけると、情報交換などがスムーズかなとおもいます。 あと、やったことや、作ったレポジトリ、画像などをはってもらえると、まとめにもなるので、助かります。

丹生 (国立情報学研究所)

具体的な開発予定

  • CWL の Javascript Expression が自由すぎるので消えて欲しい
    • 事前準備として、現状の JSExpression がどのように使われているのかをまとめる
    • 各パターンについて代替案を考える

他参加者からの情報提供を希望すること,自分が調査したいと思っていること

  • CWL 以外のワークフロー記述言語での型変換や入力パラメータの validation を行う方法

やったこと

  • JSExpression の用途をまとめた
    • 後で英語にして問題提起 & JSExpression を滅ぼしたい
  • ワークフローシステムの紹介スライド作成のためのネタ出しを行った

池田(Percipere, LLC)

具体的な開発予定

  • nextFlow の使い方

他参加者からの情報提供を希望すること,自分が調査したいと思っていること

  1. Write Once, run everywhere.

その他

  • 一手詰めtoolsとても良いかも!!

お名前 (所属など)

具体的な開発予定

  • 当日やることを書く、複数あれば複数書く

他参加者からの情報提供を希望すること,自分が調査したいと思っていること

  1. こんなこと知りたい、調査したいということを書く。複数あれば複数書く

その他

  • なにかその他の情報など、自分が詳しい分野とか、まわりへの告知など

連絡先

石井: manabu.ishii.rb@gmail.com

You can’t perform that action at this time.