• DDBJ Search で新規公開・再公開された DRA が検索できません
  • DRA 検証処理における不具合
  • (5/3-5/6) ゴールデンウィーク中の対応について

BLAST

  • ホーム
  • サービス
  • BLAST

DDBJ では,Web版 BLAST の他に,以下の方法でも BLAST サービスを提供しています。

  • WABI BLAST
  • NIG スーパーコンピュータ

Program:プログラム

解析の用途に合わせ,以下のプログラムのいずれかを左カラムより選択します。
デフォルトでは,blastn が設定されてます。megablast は新たに追加されたプログラムです。

プログラム クエリ データベース 説明       
megablast 塩基配列 塩基配列 あなたの塩基配列を塩基配列データベースと比較します。
長大な塩基配列で相同性検索を行いたい場合,blastn より高速に検索結果が得られます。
 
blastn 塩基配列 塩基配列 あなたの塩基配列を塩基配列データベースと比較します。  
tblastn アミノ酸配列 塩基配列 あなたのアミノ酸配列に対して,塩基配列データベースを表裏合わせて6通りの読み枠で翻訳しながら比較します。  
tblastx 塩基配列 塩基配列 あなたの塩基配列を表裏合わせて6通りの読み枠で翻訳しながら,同様に翻訳された塩基配列データベースと比較します。  
blastp アミノ酸配列 アミノ酸配列 あなたのアミノ酸配列をアミノ酸配列データベースと比較します。  
blastx 塩基配列 アミノ酸配列 あなたの塩基配列を表裏合わせて6通りの読み枠で翻訳しながら,アミノ酸配列データベースと比較します。  

Query:検索配列名,検索配列データ

  • FASTA 形式で検索配列を入力して下さい。
  • データを直接テキストボックスに入力するか,データを格納したファイルを指定(ファイルアップロード機能)します。
  • 検索する配列が複数の場合は,各配列を区別するために配列名が必要です。先頭に「>」をつけた配列名の行を各配列の前においてください (multi FASTA 形式)。
  • 検索する配列がひとつの場合は,配列名は必要ありません。配列名をつける場合は,先頭に「>」をつけた配列名の行を配列の前において下さい。

FASTA 形式

>my query sequence 1
CACCCTCTCTTCACTGGAAAGGACACCATGAGCACGGAAAGCATGATCCAGGACGTGGAA
GCTGGCCGAGGAGGCGCTCCCCAGGAAGACAGCAGGGCCCCAGGGCTCCAGGCGGTGCTG
GTTCCTCAGCCTCTTCTCCTTCCTGCTCGTGGCAGGCGCCGCCAC

複数配列の入力例 (multi FASTA 形式)

>>my query sequence 1
CACCCTCTCTTCACTGGAAAGGACACCATGAGCACGGAAAGCATGATCCAGGACGTGGAA
GCTGGCCGAGGAGGCGCTCCCCAGGAAGACAGCAGGGCCCCAGGGCTCCAGGCGGTGCTG
GTTCCTCAGCCTCTTCTCCTTCCTGCTCGTGGCAGGCGCCGCCAC
>my query sequence 2
GGCCAGGGCACCCAGTCTGAGAACAGCTGCACCCGCTTCCCAGGCAACCTGCCTCACATG
CTTCGAGACCTCCGAGATGCCTTCAGCAGAGTGAAGACTTTCTTTCAAATGAAGGATCAG
CTGGACAACATATTGTTAAAGGAGTCCTTGCTGGAGGACTTTAAG
>my query sequence 3
ATGGGTCTCACCTCCCAACTGCTTCCCCCTCTGTTCTTCCTGCTAGCATGTGCCGGCAAC
TTTGCCCACGGACACAACTGCCATATCGCCTTACGGGAGATCATCGAAACTCTGAACAGC
CTCACAGAGCAGAAGACTCTGTGCACCAAGTTGACCATAACGGAC

配列サイズが巨大な場合,配列数が多い場合などは,以下のような理由で結果を正常に取得出来ない場合があります。
そのような場合は,配列数を少なくするか配列を短くする等して再度お試し下さい。

  • 結果が巨大になりブラウザで表示出来ない
  • 検索時間が長くなり過ぎてタイムアウトする

Data Sets {#data sets}

塩基配列(データベース,DIVISION)

データベース

検索対象となるデータベースを指定します。 以下の選択肢からひとつを選びます。

塩基配列データベース  
DDBJ ALL DDBJ 定期リリース + 新着データ
DDBJ New DDBJ 定期リリース後の新着データ
16S rRNA DDBJ 定期リリースから 16S rRNA 配列を取り出したデータ
RefSeq NA RefSeq (Genomics + RNA)

DIVISION (DDBJ ALL / DDBJ New)

DDBJ ALL または DDBJ New を選択した場合,以下の選択肢から,検索対象とする DIVISION の指定が可能です(複数可)。デフォルトでは、Standard divisions のうち SYN, ENV を除いた 10 divisions が選択されています。 EST については登録数の多い21の生物種から選択することが出来ます。

Standard divisions    
Human HUM ヒト
Primates PRI 霊長類 (ヒトを除く)
Rodents ROD 齧歯類
Mammals MAM 哺乳類 (ヒト、霊長類、齧歯類を除く)
Vertebrates VRT 脊椎動物 (ヒト、霊長類、齧歯類、哺乳類を除く)
Invertebrates INV 無脊椎動物
Plants PLN 植物・酵母・藻類
Bacteria BCT バクテリア(原核生物)
Viruses VRL ウイルス
Phages PHG バクテリオファージ
Synthetic DNAs SYN 合成配列 (合成遺伝子)
ENV ENV 環境サンプル (environmental samples)
High throughput divisions    
HTC HTC High Throughput cDNAs
HTG HTG High Throughput Genomic sequences
TSA TSA Transcriptome Shotgun Assembly
EST divisions  
A.thaliana Arabidopsis thaliana (シロイヌナズナ)
B.taurus Bos taurus (ウシ)
C.elegans Caenorhabditis elegans (線虫)
C.reinhardtii Chlamydomonas reinhardtii (クラミドモナス)
C.intestinalis Ciona intestinalis (カタユウレイボヤ)
D.rerio Danio rerio (ゼブラフィッシュ)
D.discoideum Dictyostelium discoideum (キイロタマホコリカビ)
D.melanogaster D.melanogaster (ショウジョウバエ)
G.gallus Gallus gallus (ニワトリ)
G.max Glycine max (ダイズ)
H.sapiens Homo sapiens (ヒト)
H.vulgare Hordeum vulgare (亜種も統合)
M.truncatula Medicago truncatula (特殊ライブラリも統合)
M.musculus Mus musculus (ハツカネズミ)
O.sativa Oryza sativa (亜種レベルも統合)
R.norvegicus Rattus norvegicus (Rattus sp. も統合)
S.lycopersicum Solanum lycopersicum (トマト)
T.aestivum Triticum aestivum (コムギ)
X.laevis Xenopus laevis (アフリカツメガエル)
X.tropicalis Xenopus tropicalis (アフリカツメガエル)
Z.mays Zea mays (トウモロコシ)
Others 上記以外 (Others)
その他    
Patent PAT 特許データ
Unannotated Seq UNA 未注釈データ
GSS GSS ゲノム研究関連 (genome survey sequences)
STS STS sequence tagged sites

*特許データの利用に際しては,特許データ利用に関する注意をご参照ください。

データベースオプション(RefSeq)

定期リリース(genomic/RNA)  
Fungi 菌類
Invertebrate 無脊椎動物
Microbial 細菌
Mitochondrion ミトコンドリア
Plant 植物
Plasmid プラスミド
Plastid 色素体
Protozoa 原生生物
Vertebrate Mammalian 哺乳類
Vertebrate Other 哺乳類以外の脊椎動物
Viral ウィルス
Daily Updates Daily Updates
モデル生物(Genomic)  
H. sapiens ヒト
モデル生物(RNA)  
B. taurus ウシ
D. rerio メダカ
H. sapiens ヒト
M. musculus マウス
R. norvegicus ラット
X. tropicalis アフリカツメガエル

アミノ酸配列(データベース,DIVISION)

データベース

デフォルトは UniProt(Swiss-Prot + TrEMBL)です。

Proterin Databases  
UniProt (Swiss-Prot + TrEMBL) Swiss-Prot + TrEMBL
UniProt (Swiss-Prot) Swiss-Prot
UniProt (TrEMBL) TrEMBL
Patent JPO,EPO,USPTO,KIPO の全データ
(Patent を選択すると4つ全てにチェックが入ります。個々の選択は可能です。不要なチェックを外してください。)
DAD (periodical release + daily updates) DAD 定期リリース + 新着データ
DAD (daily updates) DAD 定期リリース後の新着データ
RefSeq AA Refseq(Protein)

*特許データの利用に際しては,特許データ利用に関する注意をご参照ください。

*現在のバージョンは こちら からご確認ください。

DIVISION(DAD)

検索対象とする DIVISION を指定します。以下の選択肢から指定が可能です(複数可)。デフォルトでは、Standard divisions のうち SYN, ENV を除いた 10 divisions が選択されています。 EST については登録数の多い21種のデータから選択することが出来ます。

Standard divisions    
Human HUM ヒト
Primates PRI 霊長類 (ヒトを除く)
Rodents ROD 齧歯類
Mammals MAM 哺乳類 (ヒト、霊長類、齧歯類を除く)
Vertebrates VRT 脊椎動物 (ヒト、霊長類、齧歯類、哺乳類を除く)
Invertebrates INV 無脊椎動物
Plants PLN 植物・酵母・藻類
Bacteria BCT バクテリア(原核生物)
Viruses VRL ウイルス
Phages PHG バクテリオファージ
Synthetic DNAs SYN 合成配列 (合成遺伝子)
ENV ENV 環境サンプル (environmental samples)
High throughput divisions    
HTC HTC High Throughput cDNAs
HTG HTG High Throughput Genomic sequences
TSA TSA Transcriptome Shotgun Assembly
EST divisions  
A.thaliana Arabidopsis thaliana (シロイヌナズナ)
B.taurus Bos taurus (ウシ)
C.elegans Caenorhabditis elegans (線虫)
C.reinhardtii Chlamydomonas reinhardtii (クラミドモナス)
C.intestinalis Ciona intestinalis (カタユウレイボヤ)
D.rerio Danio rerio (ゼブラフィッシュ)
D.discoideum Dictyostelium discoideum (キイロタマホコリカビ)
D.melanogaster D.melanogaster (ショウジョウバエ)
G.gallus Gallus gallus (ニワトリ)
G.max Glycine max (ダイズ)
H.sapiens Homo sapiens (ヒト)
H.vulgare Hordeum vulgare (亜種も統合)
M.truncatula Medicago truncatula (特殊ライブラリも統合)
M.musculus Mus musculus (ハツカネズミ)
O.sativa Oryza sativa (亜種レベルも統合)
R.norvegicus Rattus norvegicus (Rattus sp. も統合)
S.lycopersicum Solanum lycopersicum (トマト)
T.aestivum Triticum aestivum (コムギ)
X.laevis Xenopus laevis (アフリカツメガエル)
X.tropicalis Xenopus tropicalis (アフリカツメガエル)
Z.mays Zea mays (トウモロコシ)
Others 上記以外 (Others)
その他    
Patent PAT 特許データ
Unannotated Seq UNA 未注釈データ
GSS GSS ゲノム研究関連 (genome survey sequences)
STS STS sequence tagged sites

データベースオプション(RefSeq)

定期リリース(Protein)  
Fungi 菌類
Invertebrate 無脊椎動物
Microbial 細菌
Mitochondrion ミトコンドリア
Plant 植物
Plasmid プラスミド
Plastid 色素体
Protozoa 原生生物
Vertebrate Mammalian 哺乳類
Vertebrate Other 哺乳類以外の脊椎動物
Viral ウィルス
Daily Updates Daily Updates
モデル生物(RNA)  
B. taurus ウシ
D. rerio メダカ
H. sapiens ヒト
M. musculus マウス
R. norvegicus ラット
X. tropicalis アフリカツメガエル

Optional Parameters

SCORES:検索結果一覧の表示数

相同性スコアの順位表を,第何位まで表示するかを指定します。
デフォルトは100位までです。
検索結果に期待される対象が含まれない場合,この値をより大きな値にすると,結果が改善される可能性があります。

ALIGNMENTS:整列 (アライメント)

相同な配列との整列を,相同性スコアの順で第何位まで表示させるかを指定します。
検索結果に期待される対象が含まれない場合,この値をより大きな値にすると,結果が改善される可能性があります。

EXPECT:期待値(E-value) {#expect value}

出力される配列に関して統計的な閾値を指定します。デフォルトは10ですが,これは偶然に一致する配列が10本あるという条件を意味しており,この条件よりも偶然に一致する配列が少ないと統計的に計算された配列が出力されます。
多くの相同な配列を出力させるには,この値を大きく指定します。逆に,非常に高い相同性を持つ配列だけを出力させるには,この値を小さく指定します。
また,指数表記で指定可能です。(例:1.0E+1)

SCORING MATRIX:アミノ酸置換表 {#scoring matrix}

アミノ酸配列の置換行列の表を指定します。
blastx, blastp, tblastn, tblastx で指定可能です。指定可能な置換行列は以下のとおりです。
デフォルトでは BLOSUM62 が設定されます。

PAM30 PAM30 substitution matrix
PAM70 PAM70 substitution matrix
PAM250 PAM250 substitution matrix
BLOSUM45 BLOSUM Clustered Scoring Matrix
BLOSUM50 BLOSUM Clustered Scoring Matrix
BLOSUM62 BLOSUM Clustered Scoring Matrix
BLOSUM80 BLOSUM Clustered Scoring Matrix
BLOSUM90 BLOSUM Clustered Scoring Matrix

FILTER:フィルター

検索配列データのフィルタリング(マスキング)を指定します。デフォルトではフィルタリングを行います。
フィルタリングにより,問い合わせ配列のうち構造の複雑度が低い領域を無視することができます。
一般に proline-rich 領域や poly-A tail などの領域は構造的な偏りが反映されて異常に高いスコアで一致する傾向がありますが,フィルタリングによりそのような有意でない一致を結果から除くことができます。
blastn 使用時には Tatusov and Lipman によるDUSTプログラムにより,他の場合は Wootton & Federhen (Computers and Chemistry, 1993) による SEG プログラムによりフィルタリングされます。
フィルタプログラムによって見つけられた低複雑度領域は,塩基配列の場合 “N”,アミノ酸配列の場合 “X” の文字で置き換えられます。

WORD SIZE {#word size}

自然数を入力します。デフォルトでは blastn の megablast の場合は 28,blastn の blastn の場合は11,
blastp,blastx,tblastn,tblastx の場合は 3 です。
blastn の場合は,wordsize を 11 以外の数に変えるべきではありません。

Request ID,検索結果表示

Request ID {#request id}

検索実行後の画面に Request ID が表示されますので,必ず控えて下さい。(問い合わせや Result Viewer (後述)で結果を見たい時などに必要です)

Request ID:wabi_blast_2013-0314-1407-23-16-946732

結果画面に表示される情報 {#result screen}

結果中のアクセッション番号の検索・表示 {#view flatfile}

該当するアクセッション番号にチェックを入れて、”getentry” ボタンをクリックすると、getentry の結果が表示されます。

検索結果の閲覧 {#result viewer}

Result Viewer

ブラウザを閉じてしまっても、Result Viewer を用いてRequest ID から結果を閲覧することができます。
検索結果閲覧期間は、実行後7日間です。

ClustalW Set up

チェックボックスで ClustalW で解析を行いたい配列を選択して”ClustalW” ボタンをクリックすると、選択した配列が入力された状態でClustalW 画面が開きます。

1. 2.

原著論文,関連論文および参考文献

原著論文

  • Altschul SF, Madden TL, Schaffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25(17):3389-3402.

関連論文

  • Zhang J, Madden TL. (1997) PowerBLAST: A New Network BLAST Application for Interactive or Automated Sequence Analysis and Annotation. Genome Res.7(6):649-656.
  • Madden TL, Tatusov RL, Zhang J. (1996) Applications of network BLAST server. Methods Enzymol. 266:131-141.
  • Gish W, States DJ. (1993) Identification of protein coding regions by database similarity search. Nat Genet. 3(3):266-272.
  • Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. (1990) Basic local alignment search tool. J Mol Biol. 215(3):403-10.
  • Karlin S, Altschul SF. (1990) Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes. Proc Natl Acad Sci U S A. 87(6):2264-2268.

参考文献

  • 「改訂 第2版 バイオデータベースとウェブツールの手とり足とり活用法」(羊土社)
    編集/中村保一,石川 淳,磯合 敦,平川美夏,坊農秀雅 ISBN978-4-7581-0811-9
  • [BLAST] Ian Korf, Mark Yandell and Joseph Bedell, OREILLY

Related pages

  • ARSA ヘルプ
  • getentry ヘルプ
  • VecScreen ヘルプ
  • ClustalW ヘルプ
  • TXSearch ヘルプ
  • 過去のサービス
  • 関連論文
  • WABI (Web API for Biology)
  • WABI BLAST ヘルプ
  • WABI ClustalW ヘルプ
  • WABI VecScreen ヘルプ
  • WABI MAFFT ヘルプ
  • Pipeline ヘルプ