meeting0 log
Toshiaki Katayama edited this page Mar 25, 2017
·
3 revisions
As of Jan 24 2011
第0回オープンバイオ研究会 議事録
- 日時:
- 2004年12月13日 16:00-18:00(予定)
- 実際には18:25頃まで延びました。
- 2004年12月13日 16:00-18:00(予定)
- 場所:
- パシフィコ横浜3階 315 号室
部屋の定員(用意されていた机と椅子の数)は20名でしたが、発表者だけで大部分を使い切ってしまい、追加の椅子を出してもらいました。開始直後の参加者数は40名弱、最大で50名以上の人がいた模様です。
以下は後藤さんによる当日のメモから再構成した発表内容の簡易な記録です。あくまで簡易なものであり、途中内容が飛んでいる場合があります。
発表者交代の合間を有効利用して、あるいは単に発表者や司会者の興味に応じて、挙手による簡単なアンケートが行われました。多少参加者の出入りがあったので母集団は厳密には一致しないですが、参考までに。
はじめに
開催の趣旨など
片山さん (スライド)
- 開催の経緯
- 謝辞
- 宴会の紹介
- BOSC
- BioHackathon
発表者記念撮影
発表者全員が前に出て記念撮影をしました。
プロジェクト紹介
KNOB
二階堂さん (スライド)
- KNOPPIX for Bio
- SFSサーバでネットワークから起動
日本のバイオインフォコミュニティ
坊農さん (スライド)
- 自己紹介
- 1998頃からBioPerlを使っていた
- GO
- Ensembl
- Bio::Writer
- Rubyもちょこっと
- Community Ontology (CO)
- Laboratiroes
- Target
- Language
- Favorite Protocol
-
bioinformatics-jp (since 12/01/1999)
- オープンにしたからこそ人が増えた
- Wing
- 自宅 | レンタル鯖
- PLOS
- オープンな「バイオインフォマティクスする」土壌は十分できている。が、
- 日本人には最初のバリアが大きい?
- 「オタク」?
- コンピュータ使ってると遊んでると思われる
- 生業との両立
- 日本人には最初のバリアが大きい?
- Using is Believing!
GBrowse
川路さん (スライド)
- GBrowseって何?
- データ記述形式
- GFFフォーマット Ver.2
- 構成
- インストールしてみる@Gentoo Linux
- BioPerlも emerge bioperl 一発でOK
- 参考になるconfig
- ./conf/yeast_chr1.conf
- ローカルのGFFファイルを参照
- ちょっと試すには便利
- MySQL
- DAS
- ./conf/yeast_chr1.conf
- 参考になる書籍
SOKOS
金さん (スライド)
- RNA sequence analysis
- Similarity Computation
- Clustering / Classification
-
http://www.cbrc.jp/~taishin/
- CBRCのページからリンクはないが…
- ライセンスは GPL?
- 知的財産の問題
- 知財部
- SOKOS
- 確率自由文法
- Kernel Computation
- Support Vectpr Machine (SVM)
- SVM計算ライブラリの中ではLIBSVMが一押し
- 技術
- 掛け算がいっぱい
- 実数演算でやるとすぐゼロになる
- 内部では log でやる
- 掛け算は楽だが、足し算は大変
- LOG-anization
- Fast LOG algorithm
- Reduction of memory allocation / destroy
- 一回で多次元配列のメモリを確保
- Development Tool
- 開発ツールは絶対に必要
- Valgrind
- Doxygen
-
GLIBのソース
- Cの良い書き方の教科書になる
-
http://www.koders.com/
- source code search engine
- 開発ツールは絶対に必要
- Non-coding RNA Analysis の人材募集中
- 掛け算がいっぱい
Biopython
増田さん (スライド)
- 挙手によるアンケート
Pythonを知っている人 --- 会場内のほぼ全員
Pythonを書ける人 --- 数人
- Pythonの紹介
- 1990年頃から開発
- 和文ドキュメントも(今は)多い
- (増田さん個人の)Python使用に至る経緯
- PerlでつくっていたけどHDD飛んだ
- Pythonで書き直したら2週間でできた
- 可視化
- BioPython
- コアは5人くらい(そのうち1名は職探し中…)
- BioPythonの機能
- 解析アルゴリズム
- お絵かきツール
- Pythonの知識が必要
- いいところばかりではない
- ドキュメントの整備がいまひとつ
- メンテナンスが放置されたものも
- 入門者向けの...
- ドキュメントの整備がいまひとつ
-
日本語に翻訳
- 日本語ドキュメントを充実させよう!
- ぜひトライしてください
BioConductor
田崎さん (スライド)
- BioConductor は R上にインプリメントされている
- R is poorman's S
- GPLなS
- Excelマクロは曲者
- マニュアルと齟齬がある
- 旧バージョンが入らない
- BioConductorの利点
- 最新の解析手法
- 綺麗なグラフ
- 最新の解析手法
- おすすめでない使い方
- スプレッドシートっぽく使いたい
- Wordにグラフや結果を貼り付け
- ExcelやSpotFireにはかなわない
- グラフとデータをいったりきたりする
- SpotFireなどがよいと思う
- BioConductorは統計ソフトではない
- データ読み込みツール&基礎データ集
- Affymetrix .celファイル読み込み
- GOA
- いちおうノーマライズとかは出来る
- データ読み込みツール&基礎データ集
- Bio系基礎データ・アプリ for R
- 一括処理・最新データ処理は得意
- BioConductorの利用例
- CHPファイルからMAS5ファイル
- ALL/AML を分類する遺伝子検索
- Random Permutation (この例ではBioConductorの機能はまったく使っていない)
- GOHyperG
- Rを使いこなせていることが重要
- 解析手法に凝るより、測定・サンプル調整に手をかけたほうがよい
- 良いデータに勝るものはなし
- BioConductor あるいは R はバッドノウハウの山
- 「奥が深い」に注意
- 提供データにはおかしなことがある場合もある
- 挙手によるアンケート
BioConductor を使っている人 --- 4-5人
R を使っている人 --- 10人くらい
BioPython を使っている人 --- 数人
BioPerl を使っている人 --- 18人
BioJava を使っている人 --- 7人
BioRuby を使っている人 --- 16人
BioRuby, RRb, Ruby-RMathLib
- BioRuby
- 開発者は9人くらい
- さきほど 0.6.2 リリース
- 130以上のファイル
- 歴史
- Bio::Hoge.pm 時代
- あるときRubyに乗り換えた
- 2000/11/21 酔った勢いで(?)ドメイン取得
- 2003/11くらい サーバ危機→ OBFに移行
- 今日 0.6.2 リリース
- クラスの紹介
- 今後の予定
- ドキュメント充実化
- rdocの導入
- Unit Test の充実化
- BioRuby in Anger の完成
- User contributed codes のリポジトリ
- SearchIO や AlignIO のようなデザインパターンの活用
- 画像関係
- ドキュメント充実化
- 高度な問い合わせ (joke)
- PDBの立体構造を注文する
- RRb (R from Ruby)
- http://sourceforge.net/projects/rrb/
- RSPerl, RSPython, RPy を見て思い立った
- 動く実装がまだない
- 開発者熱烈募集中
- Ruby-RMathLib
- RRbの派生プロジェクト
- librmathをRubyから使う
- 例: 超幾何分布
- Cを書かなくてもOK
ChemRuby
田中さん
- Chemicalなものにもいろんなファイルフォーマットがある
- アルゴリズム
- SSSR
- リングサーチ
- 競合システム
- ビット演算ベースのグラフライブラリ
- Rubyバインディング
- 現状
- まだオープンにしていない
- KEGGのバックエンドとして使用
- KEGG Ligand compound search
- ビジュアライズ
- オープンソースのインセンティブ
- なぜまだオープンではないか
- ユーザのインセンティブ
- 開発者のインセンティブ
- ボスのインセンティブ(重要!)
- なぜまだオープンではないか
G-language, E-cell
荒川さん (スライド)
- E-Cell Simulation Environment
- 1996-
- マルチアルゴリズム
- マルチタイムスケール
- GPL
- コアはC++
- フロントエンドはPython
- G-language Genome Analysis Environment
- 2001-
- 3つのインターフェース
- Perlライブラリ
- interactive shell
- GUI
- 基本はGPL (一部LGPL)
- 例 for Programmers
- 例 for Non-Programmers
- 3クリックでゲノム解析ができる
- なんでBioPerlを使わないのか?という誤解
- 視点が違う
- 開発環境に焦点
- 3つのレイヤー
- データベースファイルのIOに関してはBioPerlを活用
- よく使うものは(BioPerlは遅いので)独自開発
- 互換性も保っている
- 200以上のアプリケーション
- ゲームまである (ゲノムデータでステージが変わる...)
- GUI環境
- Perl + wxWindows
- Shell
- 変数情報を記憶
- タブ補完
- プラグイン構造
- GUIの開発も簡単
- 挙手によるアンケート
G-languageを使ったことがある人 --- 4人
BioJava
篠山さん (スライド)
- Javaで書かれたBioinformatics用のライブラリ集
- Java言語の特徴
- Object Oriented
- クロスプラットフォーム
- 大規模開発
- 高速
- ライブラリ充実
- GUIアプリケーション
- 統合開発環境
- どんなものが含まれているか
- 配列操作
- BLASTパーサ
- ...
- 一覧
- org.biojava.bio.
- BioJavaの情報源
- http://www.biojava.org/
- メーリングリスト
-
BioJava in Anger
- 「どうすれば…できるか」クックブック
- 日本語訳
- 使用例
- GenBank -> FASTA
- BioJavaインストール
- JDKインストール
- BioJavaの4ファイル(バイナリ)をダウンロード
- CLASSPATHの通ったところに置く
- ソース作成
- コンパイル
- javac GenBankReader.java
- 実行
- java クラス名 入力ファイル 入力フォーマット 種類
- 結果
- BioJavaインストール
- GenBank -> FASTA
- 挙手によるアンケート
MacOS(OS X)をメインで使っている人 --- 13人
JAMBO, EMBOSS
多賀谷さん (スライド)
- 挙手によるアンケート
EMBOSSを知っている人 --- ほぼ全員(45人?)
- EMBOSS
- European ...
- ヨーロッパ方面で開発
- http://emboss.sourceforge.net/
- EMBOSS for Windows もある
- Sequence Formats
- 多くの配列フォーマットに対応
- フォーマット自動認識
- 統一されたユーザインターフェース
- コマンドライン
- GUI Interfaces
- Script Interfaces
- Bio::Emboss (Perl)
- BioPerl
- Biopython
- BioRuby
- JAMBOの活動紹介
- Japan EMBOSS User Group
- 経緯
- Aug-2003 ぼうのうさんがキリ番ゲット
- 翻訳プロジェクト始動
- Feb-2004 チュートリアル翻訳完了
- SourceForgeに移行
- 活動内容
- ドキュメント翻訳状況
- 順調に滞っている…(協力者求む!)
- European ...
- 挙手によるアンケート
Linuxをメインに使っている人 --- 16人
Ensembl
癸生川(きぶかわ)さん (スライド, EnsShow, MousePolymorphism, AtEnsembl)
- 挙手によるアンケート
Ensemblのサイトを訪れたことがある人 --- ほぼ全員(50人?)
- What's Ensembl
- Free Unrestricted Genome Access For All
- ローカルに環境構築可能
- カスタマイズ可能
- EnsemblサイトのTop Page
- 特に重要なところは
- Help Desk
- Documents
- 特に重要なところは
- 現在、プレリリースを含めて17種のゲノムデータ
- サイトの見方
- EnsMart
- 多彩なView
- alignview
- anchorview
- ... (数十のviewがある)
- 企業を含めた導入事例
- 遺伝研
- Ensembl + DAS
- XXXX株式会社
- A.thaliana
- http://arabidopsis.info/ の AtEnsembl
- 顧客独自のデータを入れている
- AtEnsemblはまだDASをサポートしていない
- 仕方なくEnsembl DB に直接入れた
- アーキテクチャ
- MySQL schema
- API直利用
- JavaとPerl
- Happy! Ensembling! ;)
- 遺伝研
Omic Space の Web サービスをラップする Java API
豊田さん
- 自己紹介
- 10年前は
- Structure Based Drug Design
- 当時はできないできないと言われていたが、今や普通
- 今は
- ゲノム〜フェノーム間のネットワーク解明へ
- GSC 和田先生
- 網羅的にカバー
- Omic Space 座標にもとづくデータ統合
- フェノーム
- メタボローム
- ...
- GPS: Genome <=> Phenome SUperhighway System
- 上から見れば...
- 横から見れば アノテーション
- http://omicspace.riken.jp/
- XMLデータサービスをベースにシステムを構築
- 各平面ごとに...
- Flashを使っている
- Web Browsers
- Native Application
- Users Programming
- In-silico Positional Cloning
- 例: Pheno-interactionに対応する分子レベルの...
- Java wrapper class を利用したプログラミング例
- wrapper class はオープンソースで公開できるかな、と思う
- 今後の計画
- Omic Space サービスの公開
- Java wrapper class をオープンソースで公開
- 10年前は
- 挙手によるアンケート
Windowsをメインに使っている人 --- 13人
残りはその他OSの人? --- IRIX, Solaris, HP/UX, *BSD?
Xgrid
荻島さん (スライド)
- グリッドコンピューティングとは?
- 疎結合なヘテロな分散コンピューティング
- Gridソフト
- Globus Toolkit
-
Sun Grid Engine
- Solaris, Linuix, Windows
- The BioTeamがMac OS Xへ移植
- Xgrid
- アップル社 ACGが開発
- 「iMovieのような」簡単さ
- Xgrid
- インストールや設定・管理が非常に簡単
- しくみ
- コントローラ
- エージェント群
- BEEPプロトコル RFC3080 (4111番ポート)
- インストール
- ダウンロード
- インストール
- 3つのパスワードを設定
- コントローラを起動
- エージェントを起動
- たったこれだけでOK
- ためしにMandelbrotを実行
- タコメータの針がキュイーンと上がる(単位: GHz)
- Xgrid BLAST
- Pluginで任意のプログラムを分散実行する
- Linuxもエージェントにできる
- 挙手によるアンケート
Xgridを使ったことがある人 --- 4人
SO (Sequence Ontology)
粕川さん (スライド)
- 仕事の多くは何かを"joining"すること
- joinするデータの形を整える
- Bio*の活用
- joinするデータの意味を整える
- ontologyの活用
- joinするデータの形を整える
- 配列上のアノテーション情報(feature情報)
- 共有可能な用語と概念
- Sequence Ontology の例
- 例: CDS
- 関係
- Sequence Ontology の応用
- Sequence Ontology
- Open Biological Ontology (OBO)
- おまけ
おわりに
時間オーバーのため追われるように打ち上げ会場へ。きちんとした挨拶ができずゴメンナサイ。
宴会(パネルディスカッション?)
横浜駅近辺の居酒屋にて打ち上げをしました。参加者25人程度で、まずは飲み、食べ、最後にプロジェクターを持ち込んで今後の方針についてのパネルディスカッションをしました。
- 今後もこのような場を継続して持ちたい
- 年に数回程度のミーティングを目指す
- 今回の BOF と同じような形態のもの
- 今度は質疑応答も時間を取りたい
- 今回参加して頂けなかった方も呼びたい
- 一般向けのチュートリアルのようなもの
- 各プロジェクト(たとえば BioPerl)の使い方を伝授
- 開発者向けのハードコアなもの
- 実際に会って合宿形式で効率的にハックしまくりたい
- 今回の BOF と同じような形態のもの
- 次回は3月ごろの SIGBMK と共催で行なえないか検討中
- 年に数回程度のミーティングを目指す
- コミュニティの名称を「オープンバイオ研究会」とする
- 活動内容
- 今回の BOF のようなミーティングの開催
- ソフトウェア開発の情報交換
- ライセンス問題などの問題点をディスカッションなど
- 活動内容
- open-bio.jp ドメインを取得する (12/14済)
- このあと sourceforge.jp にプロジェクトを申請し登録されました
- オープンバイオ全般のディスカッションは、すでに大きなコミュニティを形成している bioinformatics-jp メーリングリストでやってよい、とリストオーナーが承認:)
- 今後のオープンバイオ研究会の打ち合わせなどについては open-bio-info メーリングリストで行なう予定ですので、今回 BOF 来られなかった方もぜひご参加ください
二次会
特に決めていなかったので呼び込みのおねーさんに誘われて広い部屋のある飲み放題なカラオケへ。マイクは当然ですがテレビに VGA 入力まであり、歌いたいひとを抑制しつつ続きのディスカッションをするにはちょうど良かったかも。