meeting2 log

Toshiaki Katayama edited this page Mar 25, 2017 · 2 revisions

As of Jan 24 2011

第2回オープンバイオ研究会 議事録

  • 日時:
    • 2005年12月19日 15:00-18:00
  • 場所:
    • パシフィコ横浜3階 315 号室
  • 参加者数: 約40名(発表者・スタッフを含む)
    • 立ち見の人はカウントしきれていません。

はじめに

オープンバイオ 2.0

片山さん

  • 開催主旨
    • 日本にオープンバイオを普及させる
    • 去年はもりだくさん
    • 今年はゆっくりとやります
  • BioPerl使ったことある人 18人
    • 去年も18人でした。増えていない?
  • 2.0時代に向けて
  • BOSC2005での話
    • BioPerlのキーノートスピーチ
    • 総括に入ってる?
    • 「やることがない」わけがない!
    • そこで2.0
    • 課題山積
    • 役立つソフトはいろいろ
    • 情報交換していきましょう=2.0
  • 今日の目次
  • 2.0っぽいオープンバイオの雰囲気を。
  • http://open-bio.jp/

セッション1:プロジェクト紹介

BioRuby+ChemRuby

片山さん

  • 未踏プロジェクトに採択されました。
  • メンバー紹介
  • 時代はポストゲノム
  • 遺伝子の世界+化合物の世界
    • 病気の解明だとか生命システムの解明とか
    • Pathway
  • ポストゲノム: Bio + Chem
  • もうひとつの方向性も: 解析統合環境 (G-languageみたいな)
  • 生命の情報表現
  • BioRubyの必要性
  • Ruby
    • 自分に合う言語でいいけど、
    • 最初に始められる言語で、それひとつでずっと使い続けていける言語

としてRubyを薦める

  • ケモインフォマティクス
  • 化学物質の情報表現
  • ChemRuby
    • 遺伝情報と化学物質の情報を同時に取り扱えるように。
  • 具体例として KEGG Pathway
  • Rubyの優位性
    • ユーザ: 生物系・化学系の実験屋さんにも敷居が低い
    • 開発者: アイデアの実現が早い
    • オブジェクト指向
      • データ構造
    • 標準的ライブラリが充実
    • インストールが簡単
  • ユースケース
    • 必要なデータをネットから取得
    • ローカルでデータを加工
    • 計算
    • 統計処理
    • ビジュアライズ
  • 実行速度より実装速度
  • Rubyは遅い?
    • ものによってはBioPerlより20倍速い
    • ややこしい計算はCで拡張
    • YARV
  • 未踏の今年のスケジュール(当初予定)
    • 遅れてる
    • 今日、0.7.0リリース!
    • APIの見直し
    • UnitTest
    • 英文ドキュメント
      • RDoc
    • チュートリアル
      • 英語版、日本語版の両方
  • BioRuby/ChemRuby組の課題
    • ドキュメント整備
    • APIのRDoc化
    • チュートリアル
    • 普及促進
      • 学会発表、講習会
    • 機能追加
      • インタラクティブなシェル
    • 生物情報学+化学情報学の統合ライブラリ
      • グラフ(後述)
      • 高品質化
    • テスト: Test::Unitを利用
    • 開発促進・地理的隔離の解消
      • 合宿
  • チュートリアル
    • thanks to Dr. Pjotr Prins
  • APIのドキュメント
  • 開発ガイドライン
    • README.DEV
      • 書いた→コントリビュートがどんどん来た
        • コントリビュート方針
        • ライセンス
        • コーディングスタイルetc.
  • 書籍でも紹介
    • 屋比久友秀さん著「実践バイオインフォマティクス プログラミング」(ISBN:4798011487)
  • 普及促進活動
    • BOSC2005
    • 関西Ruby勉強会
    • かずさ YaGIW2005
    • BioRuby/ChemRuby実習(人材養成)
  • BioRuby 0.7.0 今日リリース!
    • 良くなったところ
      • autoload化
      • 起動が高速化
      • シェルの開発
        • スクリプト書かなくてもOK
      • 追加機能・追加ライブラリ

ChemRubyの紹介

田中さん (15:29)

  • ゲノム創薬
  • 化学物質の情報表現
    • いろんな形式がある
      • SMILES
  • 化学的性質
    • グラフマッチ
  • 化合物の類似性から性質を推定
  • Rubでも遅くない
    • Graph Match
    • Matrix
      • Adjacency Matrix
      • ビットパターンで比較
        • ループをなくして高速化
    • Cで拡張ライブラリ

BioRuby+ChemRuby (続き)

片山さんに交代 (15:34)

  • 汎用グラフライブラリでAPIを共通化
  • テスト
    • 開発と平行して進めている
      • 慣れてきた。ノウハウが蓄積
      • インストール前に正常動作を確認できる
        • 約700テスト, 900アサーション
        • 実例 (0 error)
          • どうしてもfailureが取れないものはテストしないことにした…(仕様あるいはテストの書き方の問題)
  • 合宿
    • 地理的隔離
    • 7回の合宿
  • KEGG API v2
    • Rubyからの利用が大躍進
    • 去年はPerlが最大
    • 今年は全体の半分がRuby
    • 京都合宿の成果
      • DNA music
      • 化合物 music
        • 実は一部のスライドのバックで流れてました
  • デモンストレーション
  • biorubyコマンド
kuma = ent("genbank:AF237819") # "genbank AF237819" でもいけた
# 設定ファイル ~/.bioinformatics/seqdatabase.ini
puts flatparse(kuma).naseq
kuma2 = seq("genbank:AF237819")
# 補完(TABキー)
# 以下は配列操作の例
kuma = seq("genbank:AF237819")
kuma.complement
kuma.translate
seqstat kuma
config color
   # 色も付きます
seqstat kuma
   # 細かいところに凝ってます
doublehelix kuma
   # 二重らせんのAscii Art
midifile "kuma.mid", kuma
   # 音楽
  • おわり
    • 質疑は時間も押しているし特になし

G-language

荒川さん (15:49)

  • Overview

  • since2001

  • 慶応先端研

  • 予想よりは開発が遅れている

  • 2.0出そうで出ない

  • BioPerlでできることは全部そっちで。

  • 200くらいのアプリケーション

  • Perl

use G;
$gb = new G("ecoli.gbk");
gcskew($gb);
  • できるだけグラフィカルにやるという方針

  • BioPerlとの相互互換性

  • GのほうがBioPerlより速いので慣れればそちらを使うことをお勧め

  • GUI

  • SVGでクリッカブル

  • CGIベースでインタラクティブに。

  • GC skew

  • コドンテーブル

  • マイクロアレイ

  • 関数 200以上

  • 開発環境

    • Perlで書ける人はそれでバリバリと。
    • インタープリタ
    • プラグイン
      • サブルーチンをプラグインフォルダに放り込んでおけばインタプリタで使える
      • メモリが永続
      • makelog
    • GUI
      • GUIを作ってくれる
      • GUIの解析をPerlに戻すこともできる
  • What's New

    • KEGG API対応
      • +独自実装
    • インタプリタ改良
      • USAに部分対応(INSD/UniProt)
  • パフォーマンス改良

    • 少ないコンピュータ資源でも解析
    • メモリを共有した環境
    • グリッド
  • Data cacheing

    • リレーショナルDB
    • ユーザが意識しなくてもメモリ共有
    • ひとつの共有メモリを使いながら計算を分散できる
    • data I/O
    • BLAST
  • KNOB

    • KNOPPIX for Bio に G-language導入
      • 今年最大のトピック?
        • インストールが実は大変でした
  • 2.0時代に向けて

  • E-CELL

    • PythonのAPIをPerlに移植
    • G-languageのシェルでシミュレーションできるようにした
  • シミュレーションモデルの構築

  • 文献2000本

  • 人での作業を自動化したい

  • 酵素反応速度論

  • インターフェースの話

  • User Interface

  • G-language自体E-CELLの影響を大いに受けている

  • シミュレーション

    • 読み込んで、必要なパラメータを設定(パラメータはたいして多くない)
    • ゲノムを元にシミュレーションモデルを作ってくれる
      • 例: 大腸菌全部
    • それを元にE-CELL起動
    • シミュレータで
  • シミュレーション結果のビューア

  • 3D simulation viewer

    • KEGGのパスウェイ上で物質の量を時系列表示
  • 解糖系

    • シミュレーションデータと実験データの比較
      • いきなりゲノムから作ったにしては悪くはない
  • おまけ

    • VRML
      • ネットワークを3次元で。
  • ウェブページ大改定中

  • デモ

    • マイクロアレイ+KEGGパスウェイ
      • (CGI、Flushベース)
    • 20個以上の遺伝子でもOK (たとえばp53)
      • 詳細はポスターNo.9
    • シェル
      • GC-skew (X over SSH でグラフ表示)
      • double helix (Ascii Art 表示)
    • USA
    • 終了時に保存するかどうか確認
      • 保存すれば次回に続きができる
  • 質疑

    • マウスクリックで解析かコマンドで解析かシームレスに統合
      • pluginフォルダ
      • モジュールになってないPerlスクリプトでもOK
    • USA対応は部分配列とか相補鎖とかワイルドカードとかは未対応
    • Gのオブジェクトとは?
      • 自動判別。たまにバグるかも。E-CELLオブジェクトもOK。
    • ドキュメント
      • チュートリアル書いている。
    • ネットから取ってくる
      • 大腸菌シミュレーション
      • 酵素反応情報
      • 大腸菌以外ではS.cerevisiaeくらい
  • 会場挙手アンケート

    • G-language 使ってる人 5人くらい

KNOB

二階堂さん (16:20) (プレゼンテーション資料[PDF])

  • 会場挙手アンケート
    • KNOB起動したことがある人 21人
    • KNOB知っている人 ほぼ全員
  • KNOBとは?
  • データタイプがいっぱい
    • マイクロアレイ
    • 画像
    • 配列
    • 数値
    • グラフ
    • 自然言語
  • データベースがいっぱい
    • NAR Database Issue
      • 約700
  • ツールがいっぱい
    • EMBOSSだけでも160個
  • デジタルデバイドがいっぱい
  • KNOB
    • 「ノブ」と読みます
      • Blogから発案
  • One CD bootable
    • CDから起動するOS
    • Windowsコンピュータで使える
    • Windowsには影響を与えない
  • インストールされてるツール
    • 開発環境 Perl, Ruby, R. Fortran...
    • BioPerl
    • BioRuby
    • G-language
  • データベース
    • EMBOSS
      • デフォルトで世界三大データベースにアクセスできる設定済
  • Knoppix for Bio の仕組み
    • cloop
    • データベースはネットワークを参照
  • 最近の進展
    • KNOB 1.3.2
  • KNOB 1.3.2リリース
    • G-languageをサポート
      • G-languageを一番簡単に使える環境
    • coLinuxをサポート
    • 忘れていたClustal Wをインストール
  • KNOB on Windows
    • coLinux
      • (写真はリモートデスクトップ on MacOS Xでの例)
  • 教材としてのKNOB
    • バイオインフォマティクス入門の教材として使える
    • ゲノム情報利用ワークショップ
      • KAST
      • 慶応大、東京医科歯科大(修士学生の教育など)
  • データベースはウェブサービスで
    • REST
    • DAS
    • SOAP
    • ...
  • EMBOSS
    • USA(データベースのエントリを指すフォーマット)
    • emboss.default
      • KNOBでは適切な設定を最初から入れている
  • BioRuby+BioRegistry
    • 配列
    • MEDLINE
    • DDBJにBLAST
    • KEGG API
  • Knoppix for Bio High throughput Computing Edition
    • (KNOB HTC Edition)
    • CD1つで簡単にグリッドコンピューティング
    • Condor
      • ジョブスケジューリング
    • PVFS2
      • 分散ファイルシステム
  • 起動の手順
    • サーバにCD1枚
    • ほかのマシンはネットワーク起動(PXE)の設定
  • LinuxWorldデモ
    • 小西さん
  • 3年目のKNOBをどうするか?
    • ちょうどKNOBも次は2.0
    • KNOB 2.0って何だろう?
      • ウェエトな人がみんなバイオインフォマティクスを活用する時代
      • ウェットな人でもパイプライン処理やHTC
    • 教材としてのKNOB
    • オープンバイオのツールを解説した本を出版
      • 付録にKNOB2.0 DVD Editionを!
    • Web serviceのクライアント
      • Biomoby
      • バイオポータル(NIG)
    • Biomoby
      • ウェブサービスのパイプライン処理のソリューション開発
      • Taverna
        • Biomobyのクライアント (Java)
    • HTCのクライアントとして
      • 特定のアプリケーション・ソリューション
        • InterProScan etc.
  • 参加しよう、オープンバイオ
    • 作品を公開
      • できればオープンソースなライセンスで
    • ドキュメントを書こう翻訳しよう
      • 印刷物からブログまで
    • 製品を紹介しよう
      • 「無料」にこだわっているわけではない
  • KNOB Projectに参加しよう
    • ビルダー
      • イメージ作成
    • テスター
      • 各プログラムの動作チェック
        • (ちゃんとインストールされているかも含めた)
    • デベロッパー
      • 新しいソフトのhack
    • ドキュメント
  • http://knob.sourceforge.jp
  • http://itoshi.tv/
  • おまけ
    • バイオインフォマティクスリング
    • Web 2.0的リング
    • 科学者リング
      • 科学者の日常生活の多様性を伝える
    • JAMBO
      • 翻訳
    • 書籍
      • バイオインフォマティクス第2版
        • Perlの章ができた
    • ゲノム情報はこう活かせ
  • Grasp the KNOB!
  • 質疑
    • BioKnoppixとの違い
      • はじめた当時はなかった
      • コンタクトは取っていない
      • 日本語で解析できるという点も重視していた
      • 一緒にやることはあまり考えていない
      • ウェブサービス対応とかは?
    • ユーザビリティ
      • デスクトップのカスタマイズ
      • GUIソフトの充実化
    • coLinuxだけでなくVMwarePlayer用ディスクイメージも。
    • メンバー募集
      • やさしく教えてもらえますか?
      • いつもやさしいつもりです。
      • 「コントリビュートの仕方」ドキュメントがあってもいい
    • 学生実習とかに便利

(16:55-17:00 休憩)

セッション2:ライトニング

b-Src

なかおさん (17:02)

  • gonzui をつかった
  • Domain Specific Service
  • DSS
  • バイオインフォマティクスに特化
  • v-srcじゃないよ
  • 150以上のパッケージがあります
    • BLASTとかも
  • tar.gzだけでViewCVSがないと面倒
  • そこでb-Src
  • 色が付いたり
  • http://b-src.cbrc.jp/
  • GoogleでBLAST検索すると大変なことに
  • そこでDSS
  • ソースコードはユースケース
  • 教育目的
    • ソースコードコミュニケーション
  • ソースコードの任意の行のURL
  • Google経由でアクセスする人が多い
    • Google様にインデックスされている
  • ソースコード
    • 説明に難儀する
  • たまに落ちる
    • メモリ不足
    • 現在2GB RAM
  • アクセス統計
    • 7621ユニークIPアドレス
  • パッケージを丸ごと公開したほうがいい?
    • (会場より)欲しいの声あり
  • CRAN code search by GONZUI
  • 名前決定の瞬間
    • (Skype(?)のチャットのログを表示)
    • びーさーく
  • デモ
    • インクリメントサーチ
    • クラス定義だけ、特定言語だけetc
  • 総括
    • 使うと実に便利

(17:12) インフォメーション

  • 打ち上げの案内
    • みなとみらい線日本大通り駅下車徒歩数分

BioPAX

福田さん (17:14)

  • Biological Pathway Data Exchange Format

  • http://www.biopax.org

  • Pathway これから知識リソースとして期待

    • シグナル伝達
    • 代謝マップ
    • たんぱく質相互作用
    • Gene regulation
    • ...
  • Pathway Information

    • データベース
    • 文献
      • 電子化されているが人間が読むことを前提
    • 生物学者の脳ミソ
      • richest data source
  • 現在200のパスウェイデータベースがある

    • 197 Pathway Databases
      • フォーマットばらばら
      • モデルとかカバーしてる範囲とかもばらばら
  • 従来

    • Point-to-pointでデータのインポート・エクスポートする必要
    • "Tower of Babel"
  • After BioPAX

    • Unifying language
  • BioPAX Goals

    • Represent
      • Metabolic pathways
      • Signaling pathways
      • Protein-Protein, molecular interactions
      • Gene regulatory pathways
      • Genetic interactions
      • Community effort
      • オープンな会議
  • RoadMap

    • Level 1 (Jul,2004)
      • Metabolic pathways
        • ecosite など
    • Level 2 (Dec,2005)
      • Molecular interactions
        • Post-translational modifications
    • Level 3 (Mar,2006)
      • シグナル伝達
      • Molecular states
      • Generic physical entities
        • たとえばRasと言ってもいろんなRasがある
        • "GenericなRas"
      • Gene regulation
      • Genegtic interactions
  • 日本でこの前ミーティング

  • BioPAX Structure

    • セマンティックWeb
  • CytoScapeでのBioPAX

  • BioPAXのバリデーション

  • オープンソースでもいろんな展開

(質疑)

  • バックワードコンパチビリティ
    • Level3までは確保
    • その後は再構築されてコンパチでなくなるかも。
  • SBMLとの違い
    • 用途次第
    • 住み分け
    • BioPAXは静的なもの
    • SBMLはkineticsも入っている。すぐ実行可能なシミュレーションの記述が目的。
    • BioPAXは文献データとか
  • BioPerlでもまだ未対応
    • G-languageでも(SBMLは対応しているが)BioPAXはまだ
  • 存続する方策とか何とか
    • 拡張
    • オープンなので仕様提案→マイナーバージョンアップもありえる
  • BioPAXはあくまでも仕様を決めるだけ
    • キュレーションとかはデータベース次第

GBrowseのAjax化

石井さん (17:30)

  • 自己紹介
    • bioinformaticsは素人
    • デザインは…
  • Ajaxとの出会い
    • 2005.1
      • 酔った勢いで
    • 2005.2
  • Ajaxとは
    • ページの動的な書き換え
    • Asynchoronous JavaScript + XML
    • 非同期通信
    • ブラウザベース
    • XML
  • Ajax 長所短所
    • 長所
      • 技術が枯れている
      • 名前がかっこいい
      • 何でもできる感じがする
    • 短所
      • 幻想
      • 結局JavaScriptをがんばって書く必要あり
  • 今回の最低目標
    • ブラウザ側でレンダリング
    • ドラッグでスクロール
    • 同じ画面に複数表示
    • 拡大
  • 使用したライブラリ
    • GBrowse 1.6.2
    • Prototype.js 1.4.0_rcX
    • Scriptaculous 1.5rcX
    • ...
  • XML(通信)の形式
    • 独自形式
    • 実装しやすさ優先
  • サーバ(CGI)
    • GBrowseからの変更を最低限にとどめる
  • クライアント
    • ほぼ同じインターフェース
  • デモ
    • ドラッグしたりとか
      • (ローカルマシンでapache動かしてるのでちょっと遅い)
    • ダブルクリックで新しいのが出てきて
      • 複数表示
    • 拡大とか
    • 閉じたりとか
    • 一部消したりとか
    • 配列データが取れたり
    • コピペで持っていったり
    • ...
  • 課題
    • 矢印
    • チェックボックス
    • キャッシュとかはまだやってない
  • 全部JavaScriptでローカルでレンダリングしている
    • 画像を送らなかったのはXMLにすれば転送量も減ると思ったから
    • (卓上デモではWindowsローカルでapache+GBrowseを動かしてそのマシンでブラウザで見ていたのでちょっと遅かったけどLinuxサーバで動かすと速い)
  • 問題点
    • ドラッグでスクロールは負荷が大きい
      • 0.1秒ごとに取りに行くとかのチューニングが必要
    • ウインドウが重なると判別が困難
    • レンダリングできてないものがある
    • インターフェースがいまひとつ
      • デザインとか
  • そもそも…
    • 何が必要かよくわからない…
      • バイオインフォ屋でないので…
  • 課題
    • 必要なデータの差分取得
    • グラフィック部分のサポートを増やす
  • とりあえず言ってみる
    • ほかのゲノムブラウザへの対応
      • パーサさえあれば何でもできる
    • DAS
    • SOAP
      • パーサをJavaScriptで用意する
      • サーバに保存する仕組みがあれば…
    • Biojavascript
      • できることは限られているけど
  • チュートリアル翻訳

GBrowse活用例

奥田さん (17:47)

  • オペロンデータベース
  • KEGG DASを流用
  • 画像が欲しい
  • リンクが作れなかった
  • KEGG DASの画像をそのまま取ってくる
  • 返ってくるHTMLをパース
    • 画像とリンクが取れる
  • 維持管理が楽
  • (質疑)
    • 整合性を保つにはどうするか?
      • 基本はKEGGなので、だいたい同じになる
      • 順次バージョンアップ
      • 基本は連絡を取る

MedCD

Yachie Nozomuさん (17:53) (プレゼン資料[PDF])

  • Pubmedの概念辞書
  • ome
    • Genome
    • Proteome
    • Metabolome
    • ...
  • 研究者が溜め込んだ文献
    • Literature-ome
  • "Pubmedome"
  • MedCD
    • 「 The 'Corona beer' is cold! 」を Googleで検索
      • Corona beer そこそこヒット
      • Cold たくさんヒット
      • and そこそこヒット
  • 共起
    • Bioのいろんな単語で
  • Multiple and Layerness
    • AutherやAffiliationも。
      • 研究者間の仲とかも見える?
  • Pairwise evaluation
  • SVGベース
  • About 500万文献
  • デモ
    • (scientific termを次々とたどったり、いろいろ)
    • (驚くほど快適にサクサク速く動いていたと思います)
  • 上位概念体系
  • ネットワーク
    • 共起関係
  • MedCD Programming Eutilities

(18:01 そろそろ時間ですよと言われる)

  • 質疑応答
    • データの更新頻度
      • 1週間に一回
      • 1年に一回大幅な更新
    • 双方向のデータベース
    • 検索対象: 基本はアブストラクトのみ
  • 近日公開予定

SayaMatcher(狭山茶)

ぼうのうさん (18:03) (プレゼン資料[PDF])

  • 転写因子予測結合領域解析パイプライン
    • EMBOSS
    • UNIXスクリプト群
    • DAS
    • オープンソース
  • 論文が出た(PMID:16120477)
  • ...

総括

片山さん (18:05)

  • ハンズオンセミナーとかやりたい
  • 来年以降も何回か開催したい
  • open-bio.jp のメーリングリストもぜひ

宴会の案内

宴会担当幹事 かわじさん

  • 北前そば 高田屋 横浜山下町店
  • 19:00開始
You can’t perform that action at this time.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session.
Press h to open a hovercard with more details.