meeting4 abstract

Toshiaki Katayama edited this page Mar 25, 2017 · 1 revision

ActiveRecord によるバイオデータベースモデリング:UniProtとGO DatabaseとGFFの場合

  • 中尾光輝(かずさDNA研究所・産業総合技術研究所生命情報科学研究センター)

リレーショナルデータベースとオブジェクトをつなぐ O/R マッパーのひとつ、ActiveRecord をつかってバイオインフォマティクスで利用されているいくつかの公開データベースのモデリングをおこなった。試したのは UniProt と GO Database, Bio::DB::GFF の三つである。それぞれことなったデータの性質があり、モデリングで注力する部分がことなる。公開データベースの利用という観点において、O/R マッパーをつかうことで検索などのデータの操作性がどのように変わるかについて議論したい。

E-Cell 3D:細胞シミュレーションの新しい見方

  • 荒川和晴(慶応義塾大学先端生命科学研究所)

汎用細胞シミュレーション環境である E-Cell 3 は、オブジェクト指向によるモデリングや複数のアルゴリズム及び時間尺度を混在させることが可能なソフトウェアである。E-Cell 3 は Python 言語によるフロントエンドからプログラマブルに扱えるほか、GTK によるグラフィカルユーザインタフェースを持つが、近年細胞シミュレーションが扱う対象は次第に複雑化してきており、従来のインタフェースでは複雑な細胞動態の全体像を理解するのは困難である。ここでは、特に動的な細胞シミュレーションモデルの理解を支援するための新しい可視化の試みを紹介する。

BioFlash.org - Flash (Flex) による初級バイオインフォツールの紹介とオープンバイオ化

  • 坂庭真悟(BioFlash.org)

Flash のオープンバイオ化として BioFlash.org を始める。オープンバイオ化には無料で利用できる Flash 開発ツールが必要になるが、テキストエディタさえあれば Flash 開発が可能な Flex2 SDK をアドビシステムズ社が配布している。今回は Flex2 SDK を利用して Flash を作成する方法や、公共のウェブサービスを利用するバイオインフォFlashアプリケーションの作成方法等を紹介する。将来的にはソースの寄付を募り BioFlash.org を発展させていきたい。

文献情報使いますか?

  • 山本泰智(東京大学大学院新領域創成科学研究科)

ハイスループットな実験技術により生成される大量のデータの生物学的な解釈を効率的に行うために文献に書かれた知識を用いる手法が多く提案されている。また、医学・生物学の研究の発展に伴い、領域の細分化が生じていることから、自分の興味に関連する知識を網羅的に効率よく見つけることが困難になっている。この問題に対処するために文献に蓄積されている知識を効率よく俯瞰する手段の重要性が増している。現在文献情報を対象とした研究は主に上記の二つの目的を持つが、果たして実際のニーズはどこにあるのだろうか。今回は会場の方々から積極的な意見を頂きたく、前半に背景やシステムの紹介をし、そこでの議論をたたき台として後半はディスカッションという形で進めたい。

DDBJ Web services (DDBJ-XML)の更なる利用向上への取り組みについて

プログラムから直接操作したいという需要を認識した DDBJ は、SOAP/WSDL を使って そのほとんどのデータ検索・解析ツールを標準的 Web services として公開を行い、現在、21 services/156 methods の公開を行っている (DDBJ-XML)。この新機能はすでに国内外から利用されているが、さらなる利用促進を図るため、DDBJ としても複数の情報資源を組み合わせた種々のワークフローの開発を行ってきた。現在は、日本 DNA データバンク (DDBJ) を始めとするバイオ基幹情報資源を対象としてその機能を標準形式で記述することによって、更なる選択的統合利用の実現へ向けた取り組みを進めており、それらについても紹介を行う予定である。

第3回オントロジー研究会 アブストラクト

かずさDNA研究所における生物情報データベースの取り組み

  • 中村保一(かずさDNA研究所)

財団法人かずさ DNA 研究所は我が国初のゲノム塩基配列解析センターとして 1994 年に千葉県により設置された非営利の研究所である。我々は 1996 年のシアノバクテリアゲノム 3.6Mb の全塩基配列決定を手始めに、2000 年には国際シロイヌナズナゲノムプロジェクトの結果として全塩基配列 115Mb の約 1/4 を決定しゲノムアノテーションを行った。今年中にはマメ科植物のモデルとなるミヤコグサのゲノム解析情報をリリースする予定である。そんななかで情報処理のイロハも知らなかった実験出身の研究者が、大量のゲノム情報と格闘しつつデータベースらしきモノをぽつぽつ残してきた極々個人的な歴史を披露しつつ、リソースやツールの揃っている今ならどのようにできるのか、さらにコレからどうしていけば良いのかを考えてみたい。

EzCatDB: A Database of Enzyme Catalytic Mechanisms

酵素の立体構造、リガンドの化学構造、酵素とリガンドの相互作用など様々な角度から酵素の触媒機構を詳細に理解することで、酵素に特有な阻害剤・活性化剤などをデザインすることが可能になると考えられる。しかしながら、酵素にまつわる情報学はまだ充分に整理されているとは言えない。従来の酵素の分類であるEC番号は、主に基質・産物の化学構造や触媒反応に関わる補酵素などに基づいて分類が行われており、触媒機構において重要であるタンパク質の配列情報や立体構造に関する情報が全く考慮されていない。こうした問題点を踏まえ、触媒機構を決定する要因や、酵素とリガンドの反応部位に特に注目し、酵素触媒機構の系統的な分類を行う酵素触媒機構データベース:EzCatDB を開発している。このデータベースでは、(1) 基本反応、(2) リガンド反応部位、(3) 触媒機構、(4) 酵素側の触媒残基、補酵素の種類、というように階層的に酵素触媒機構を分類している。

参考文献

  1. Nozomi N. (2005) Nucleic Acids Research, 33 Database Issue, D407-D412.
  2. Nozomi Nagano, Tamotsu Noguchi, Yutaka Akiyama (2006) PROTEINS: Structure, Function, and Bioinformatics. in press.

eF-site: electrostatic surface of Functional-site

ポストゲノム配列解析時代の大きな課題一つとして、生体内で様々な機能を実際に行っているタンパク質の機能解析が重要になってきている。そのすべてを実験的に決定するのは事実上困難である事から、計算科学的な手法での機能推定法の必要性が高まってきている。これに対して我々は、タンパク質の表面形状と静電ポテンシャルの類似性検索による機能推定法の開発を行ってきた。類似性検索によるアプローチでは、機能部位のデータベースとそのデータベースに対する検索法が必要になってくる。今回の発表では、機能部位のデータベース eF-site の開発を中心として、類似性検索による機能推定の例、類似性検索 Web サービス eF-seek、表面及び静電ポテンシャルの計算 Web サーバ eF-surf について解説を行う。また、我々が開発を行ってきた一連の Web サーバに関しても簡単に紹介する。

DBTSS: Database of Transcriptional Start Site

DBTSS は、Cap-trapper 法や oligo-capping 法によって mRNA の5’ 端が保証された cDNA をゲノムにマッピングすることにより、正確な転写開始点の情報を記載したデータベースである。現在、ヒト:15262 遺伝子、マウス:14162 遺伝子、シゾン:3635 遺伝子、ゼブラフィッシュ:3061 遺伝子、マラリア:1527 遺伝子、に対応する転写開始点が登録されている。さらに、

  1. ヒト・マウスのオーソログ遺伝子同士のプロモータ比較
  2. 任意のプロモータ同士のプロモータ配列比較
  3. パターンマッチによるモチーフ検索

等の機能も備えている。

近年我々は、DBTSS の情報から複数のプロモータを持つ遺伝子、すなわち選択的プロモータを持つ遺伝子群を検出した、また、転写開始点にピリミジンに富む terminal-oligo pyrimidine (TOP) と呼ばれる配列を持つ遺伝子群を網羅的に検出した。このように、データベースの構築だけではなく、それを生かした解析も積極的に行っている。発表では、DBTSS の紹介と合わせてこれらについても報告する予定である。

ODB: Operon DataBase

原核生物における遺伝子の共制御のメカニズムとして、オペロン構造は非常に重要である。ゲノム配列の決定が急速に進み、いまや 300 を超える生物種のゲノムが利用できる状態にあるが、それらのオペロンの情報は、ごく限られた生物種のみでしか利用できない。そこで我々は、様々な生物種におけるオペロンの情報を文献から収集し、これをデータベース化している。加えて、それら既知のオペロン構造から推測されるオペロン構造も同時にデータベース化している。また、オペロン構造のみではなく、オペロンに関連しうる情報として、遺伝子間距離、マイクロアレイに基づいた遺伝子間の共発現、代謝系などのパスウェイ上での距離、さらにゲノム間での遺伝子の並びの保存などの情報が統合されている。これらの情報はオペロンの指標として利用できるものであり、その組み合わせによって、オペロンを予測するツールの提供も行っている。

CellMontage: 類似実験検索と細胞解析のための遺伝子発現データベース

マイクロアレイデータのメタアナリシスなどではなるべく多くの類似データを必要とする。実際に公共の遺伝子発現データベースからデータを集めて見ると、

  1. キーワード検索によりデータを収集
  2. 遺伝子名を共通化
  3. 適切に正規化

などの多くの処理が必要である。我々は、NCBI の GEO にあるデータを全て UniGene で参照できるよう処理し、一色法と二色法のデータを同一方法で比較できるように統合した。さらに高速なスピアマンのランク相関計算法によってダイレクトに自分の持つマイクロアレイデータと類似データを瞬時に取得できるシステムを開発した。現在は1秒間に約 1000 枚のアレイデータをスキャンすることが可能である。このシステムを用いると、類似データ検索を通して「類似細胞検索」や「類似反応検索」ができる。我々は、このシステムを用いて遺伝子発現を細胞の機能や構造に関連する「モジュール」の発見法を研究しており、その初歩的な結果を報告する。

You can’t perform that action at this time.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session.
Press h to open a hovercard with more details.