KEGG API のサービス構築とウェブサービスの普及に向けて


片山俊明(東大HGC)
我々は 2003 年頃より KEGG を利用するためのウェブサービスである KEGG API の 開発を行ってきた。KEGG API ではゲノムネットで提供されている 20 種以上の 生物学関連データベースを検索できるほか、KEGG の PATHWAY データベースで 提供されているパスウェイ情報、KEGG の GENES や GENOME で提供されている ゲノムの決まった生物種の遺伝子アノテーション情報、LIGAND データベースで 提供されている酵素・化合物・糖鎖・医薬品の情報、などを利用することができる。
バイオインフォマティクスの分野では様々なデータベースやソフトウェアが利用されている。 一方で、ゲノムプロジェクトなどの進展によりデータベースの規模は拡大の一途をたどっており、 ユーザが様々なデータベースをダウンロードし定期的に更新を行うことは困難になってきた。 さらに、多様なソフトウェアを利用する計算機ごとにインストールしセットアップするには かなりの手間がかかる。また、多くのソフトウェアがデータベースの利用を前提にしているため、 管理のためのコストまで考慮すると大規模なサーバで提供されているサービスを利用する方が 現実的である。
このため、高速なインターネットを利用しユーザの計算機からサーバのリソースを 活用する仕組みとして、ウェブサービスの利用が考えられる。すでに、生物学関連の データベースや解析サービスを提供するサーバは多様で分散しており、これらを一つの サーバに統合して提供することは困難である。多数の分散したサーバを組み合わせた 解析が求められていることから、バイオインフォマティクスでは、他の分野と比較して、 ウェブサービスによるワークフローの構築が向いていると考えられる。
しかし、現在のところウェブサービスを提供するサイトはそれほど増えていない。 今回は KEGG API のサービス構築の経験から、ウェブサービス提供のノウハウと、 今後のウェブサービスの普及における課題などを検討したい。