高速BLASTのAPIの参照データベースとして,DDBJに加えて以下のRefSeqデータベースを追加しました。

このほかにも,従来のBLAST APIの参照データベースとして,Reference proteins (サンプルプログラム) も追加しています。

DDBJ全件に対する検索と同様に,RefSeqデータベースに対しても高速に計算することが可能です。

例えば,以下の2つの例では,サーバの混み具合によっても変わりますが,約1分で計算することができました。

例1.ヒトの完全長cDNAとゲノムとの比較
この例のプログラムは,こちらからダウンロードできます。
実行条件:
  • プログラム: blastn
  • 参照データベース: Reference genomic sequences (200万件の配列,合計1400億塩基)
  • クエリ: 遺伝子ALDH2 の完全長cDNA (DDBJ Accession: BC002967, 配列長: 2050 bp)
  • パラメータ: -b 100, -v 100
実行結果:ヒトを始め,ウマ,イヌ,チンパンジー,オランウータン,アカゲザルなどのホモログ生物種の一覧を取得することができます。さらに,それらの生物種のゲノ ムもしくはWhole Genome Shotgun 配列上の相同性が高い染色体番号や染色体上の位置を確認することができます。
例2.環境由来配列とゲノムとの比較
この例のプログラムは,こちらからダウンロードできます。
実行条件:
  • プログラム: blastn
  • 参照データベース: Reference genomic sequences (200万件の配列,合計1400億塩基)
  • クエリ: 生物種が不明な環境由来DNA配列 (DDBJ Accession: HQ188503, 配列長: 508 bp)
  • パラメータ: -b 100 -v 100 -W 28 -X 20 (megablast と同等なオプション)
実行結果:低温菌シュワネラ属のさまざまな生物種のゲノム配列の相同性が高い領域を確認することができます。さらに,その領域のアノテーションを確認すると,16S ribosomal RNA の領域であることが分かります。詳細は,こちらをご参照ください。