国立遺伝学研究所 DDBJ センターは生命科学系大規模データ解析用に設計された遺伝研スパコンを共有計算機資源として運用し、主に国内の研究者に大規模な計算機能力と保存容量を提供することで生命科学研究の発展を支えて参りました。
生命科学分野では次世代シークエンサを始めとする測定技術の飛躍的な進歩により、個人ゲノムデータの大規模化と複雑化が急速に進展しており、研究者が自前で十分な計算能力と保存容量を備えたセキュアな解析環境を準備することが困難になってきています。DDBJ センターはこの課題の解決に資するため通常の遺伝研スパコンとは別にセキュリティを高めた個人ゲノム解析環境の提供を2018年9月3日から開始いたしました。個人ゲノム解析環境のシステム構成や利用手順・規約についてはこちらのページをご覧ください。
通常スパコンは基本的には無料で利用できることを原則としていますが、事業継続性と計算資源の効率的利用促進の観点から「ストレージの大規模利用」と「計算ノードの優先利用」に対して課金によるサービス提供を実施しております。個人ゲノム解析環境の運用にはセキュリティコストが追加で必要であることから、無料枠の無い課金サービスとして提供しております。料金表についてはこちらをご覧ください。
DDBJ センターは遺伝研スパコンに加えてアクセス制限が必要な個人ゲノムデータのためのデータベース Japanese Genotype-phenotype Archive (JGA)を科学技術振興機構 バイオサイエンスデータベースセンター (NBDC) と共同で運営しています。NBDC はヒトデータ共有に関するガイドラインである「NBDC ヒトデータ共有ガイドライン」及び「NBDC ヒトデータ取扱いセキュリティガイドライン」を策定しており、DDBJ センターはガイドラインに準拠して JGA を運営しています。
シークエンシングコストの低下を反映し数十テラバイトの個人全ゲノムデータが JGA から制限公開されるようになっており、利用者が大容量のデータをダウンロードするのに要する時間が長大になってきています。DDBJ センターと NBDC はこの問題を協力して解決するためガイドラインを改訂し新たに「機関外サーバ」という仕組みを導入いたしました。従来のガイドラインは JGA データの利用を利用者所属組織のサーバに限定していましたが、セキュリティ等の一定の条件を満たした所属機関以外のサーバを「機関外サーバ」(利用者の自組織以外という意味)とし、そこでの JGA データ利用が可能になりました。NBDC への JGA データ利用申請時に遺伝研の個人ゲノム解析環境を「機関外サーバ」としてデータ利用の場所として申請し、承認されると JGA データを個人ゲノム解析環境にダウンロードして解析することができるようになります。利用者自身で取得した個人ゲノムデータをアップロードして JGA データと統合解析することも可能です。個人ゲノム解析環境は JGA サーバと内部ネットワークで接続されているため大容量 JGA データを高速にダウンロードすることができますし、解析に必要なツール群は予めインストールされています。
DDBJ センターは JGA に加えて DDBJ グループクラウドで AMED genome Group Sharing Database (AGD) を運営しています。AGD についても JGA と同様、個人ゲノム解析環境を機関外サーバとして利用することができます。