遺伝子をGoogleのように検索できるウェブサービス
Perl ApacheConf JavaScript CSS
Latest commit 1934d9d Jan 21, 2017 @meso-cacase RefSeq 80に更新

README.md

統合遺伝子検索GGRNA.v2

遺伝子をGoogleのように検索できるウェブサービスです。

検索キーワードとして、遺伝子名やアクセッション番号など各種のIDをはじめ、
遺伝子の機能やタンパク質のドメイン名、さらには、塩基配列やアミノ酸配列など、
あらゆる語句を単一の検索窓に入力するだけでRefSeqに登録された転写産物を
すばやく探し出すことができます。

  • 統合遺伝子検索GGRNA (http://GGRNA.dbcls.jp/)
    本レポジトリにあるCGIが実際に稼働しています。

なお、本レポジトリはGGRNAのウェブインターフェース部分です。
ユーザからのリクエストを受け付け、検索を実行するサーチャにクエリを発行し、
得られたデータを処理してユーザに検索結果を返します。

サーチャはプリファードインフラストラクチャー (PFI) の Sedue を使用しています。
Sedueは、接尾辞配列のインデックスをSSDに保持することによって、塩基配列や
アミノ酸配列を含む検索語を、見落としなく、きわめて高速に検索します。

サンプル画像

スクリーンショット

トップページ (左図) の検索窓に、Argonaute "PAZ domain" と入力して
ヒトの遺伝子を検索した例 (右図)。キーワードは緑色にハイライトされます。
また、マイクロアレイのプローブID 1552311_a_at を検索した例 (下図)。
AffymetrixのプローブIDは、対応する25 merのプローブ配列×11本に変換され、
塩基配列による検索が行われます。

文献

関連プロジェクト

更新履歴

2013年7月8日

  • GGRNA.v2をリリース。

従来のGGRNAは、インメモリの圧縮接尾辞配列インデックスを利用していたため、
メモリ容量の制約から13種類のモデル生物に限ってサービスを提供してきました。
また、ヒット件数が極端に多い場合は圧縮接尾辞配列の解凍に時間がかかるという
課題がありました。そこで、サーチャを最新版のSedueに置き換えて、非圧縮の
接尾辞配列インデックスをSSDに載せる方針 (SSD方式) に変更しました。

ライセンス

Copyright © 2012-2015 Yuki Naito (@meso_cacase) at
Database Center for Life Science (DBCLS), Japan.
This software is distributed under modified BSD license.