BLAST

DDBJ では，Web版 BLAST の他に，以下の方法でも BLAST サービスを提供しています。

Program：プログラム

解析の用途に合わせ，以下のプログラムのいずれかを左カラムより選択します。
デフォルトでは，blastn が設定されてます。megablast は新たに追加されたプログラムです。

プログラム	クエリ	データベース	説明
megablast	塩基配列	塩基配列	あなたの塩基配列を塩基配列データベースと比較します。長大な塩基配列で相同性検索を行いたい場合，blastn より高速に検索結果が得られます。
blastn	塩基配列	塩基配列	あなたの塩基配列を塩基配列データベースと比較します。
tblastn	アミノ酸配列	塩基配列	あなたのアミノ酸配列に対して，塩基配列データベースを表裏合わせて６通りの読み枠で翻訳しながら比較します。
tblastx	塩基配列	塩基配列	あなたの塩基配列を表裏合わせて６通りの読み枠で翻訳しながら，同様に翻訳された塩基配列データベースと比較します。
blastp	アミノ酸配列	アミノ酸配列	あなたのアミノ酸配列をアミノ酸配列データベースと比較します。
blastx	塩基配列	アミノ酸配列	あなたの塩基配列を表裏合わせて６通りの読み枠で翻訳しながら，アミノ酸配列データベースと比較します。

Query：検索配列名，検索配列データ

FASTA 形式で検索配列を入力して下さい。
データを直接テキストボックスに入力するか，データを格納したファイルを指定（ファイルアップロード機能）します。
検索する配列が複数の場合は，各配列を区別するために配列名が必要です。先頭に「>」をつけた配列名の行を各配列の前においてください (multi FASTA 形式)。
検索する配列がひとつの場合は，配列名は必要ありません。配列名をつける場合は，先頭に「>」をつけた配列名の行を配列の前において下さい。

FASTA 形式

>my query sequence 1
CACCCTCTCTTCACTGGAAAGGACACCATGAGCACGGAAAGCATGATCCAGGACGTGGAA
GCTGGCCGAGGAGGCGCTCCCCAGGAAGACAGCAGGGCCCCAGGGCTCCAGGCGGTGCTG
GTTCCTCAGCCTCTTCTCCTTCCTGCTCGTGGCAGGCGCCGCCAC

複数配列の入力例 (multi FASTA 形式)

>>my query sequence 1
CACCCTCTCTTCACTGGAAAGGACACCATGAGCACGGAAAGCATGATCCAGGACGTGGAA
GCTGGCCGAGGAGGCGCTCCCCAGGAAGACAGCAGGGCCCCAGGGCTCCAGGCGGTGCTG
GTTCCTCAGCCTCTTCTCCTTCCTGCTCGTGGCAGGCGCCGCCAC
>my query sequence 2
GGCCAGGGCACCCAGTCTGAGAACAGCTGCACCCGCTTCCCAGGCAACCTGCCTCACATG
CTTCGAGACCTCCGAGATGCCTTCAGCAGAGTGAAGACTTTCTTTCAAATGAAGGATCAG
CTGGACAACATATTGTTAAAGGAGTCCTTGCTGGAGGACTTTAAG
>my query sequence 3
ATGGGTCTCACCTCCCAACTGCTTCCCCCTCTGTTCTTCCTGCTAGCATGTGCCGGCAAC
TTTGCCCACGGACACAACTGCCATATCGCCTTACGGGAGATCATCGAAACTCTGAACAGC
CTCACAGAGCAGAAGACTCTGTGCACCAAGTTGACCATAACGGAC

配列サイズが巨大な場合，配列数が多い場合などは，以下のような理由で結果を正常に取得出来ない場合があります。
そのような場合は，配列数を少なくするか配列を短くする等して再度お試し下さい。

結果が巨大になりブラウザで表示出来ない
検索時間が長くなり過ぎてタイムアウトする

Data Sets {#data sets}

塩基配列（データベース，DIVISION）

データベース

検索対象となるデータベースを指定します。以下の選択肢からひとつを選びます。

塩基配列データベース
DDBJ ALL	DDBJ 定期リリース + 新着データ
DDBJ New	DDBJ 定期リリース後の新着データ
16S rRNA	DDBJ 定期リリースから 16S rRNA 配列を取り出したデータ
RefSeq NA	RefSeq (Genomics + RNA)

DIVISION (DDBJ ALL / DDBJ New)

DDBJ ALL または DDBJ New を選択した場合，以下の選択肢から，検索対象とする DIVISION の指定が可能です(複数可)。デフォルトでは、Standard divisions のうち　SYN, ENV を除いた 10 divisions が選択されています。 EST については登録数の多い21の生物種から選択することが出来ます。

Standard divisions
Human	HUM	ヒト
Primates	PRI	霊長類（ヒトを除く）
Rodents	ROD	齧歯類
Mammals	MAM	哺乳類（ヒト、霊長類、齧歯類を除く）
Vertebrates	VRT	脊椎動物（ヒト、霊長類、齧歯類、哺乳類を除く）
Invertebrates	INV	無脊椎動物
Plants	PLN	植物・酵母・藻類
Bacteria	BCT	バクテリア（原核生物）
Viruses	VRL	ウイルス
Phages	PHG	バクテリオファージ
Synthetic DNAs	SYN	合成配列（合成遺伝子）
ENV	ENV	環境サンプル (environmental samples)

High throughput divisions
HTC	HTC	High Throughput cDNAs
HTG	HTG	High Throughput Genomic sequences
TSA	TSA	Transcriptome Shotgun Assembly

EST divisions
A.thaliana	Arabidopsis thaliana （シロイヌナズナ）
B.taurus	Bos taurus （ウシ）
C.elegans	Caenorhabditis elegans （線虫）
C.reinhardtii	Chlamydomonas reinhardtii （クラミドモナス）
C.intestinalis	Ciona intestinalis （カタユウレイボヤ）
D.rerio	Danio rerio （ゼブラフィッシュ）
D.discoideum	Dictyostelium discoideum （キイロタマホコリカビ）
D.melanogaster	D.melanogaster （ショウジョウバエ）
G.gallus	Gallus gallus （ニワトリ）
G.max	Glycine max （ダイズ）
H.sapiens	Homo sapiens （ヒト）
H.vulgare	Hordeum vulgare （亜種も統合）
M.truncatula	Medicago truncatula （特殊ライブラリも統合）
M.musculus	Mus musculus （ハツカネズミ）
O.sativa	Oryza sativa （亜種レベルも統合）
R.norvegicus	Rattus norvegicus （Rattus sp. も統合）
S.lycopersicum	Solanum lycopersicum （トマト）
T.aestivum	Triticum aestivum （コムギ）
X.laevis	Xenopus laevis （アフリカツメガエル）
X.tropicalis	Xenopus tropicalis （アフリカツメガエル）
Z.mays	Zea mays （トウモロコシ）
Others	上記以外（Others）

その他
Patent	PAT	特許データ
Unannotated Seq	UNA	未注釈データ
GSS	GSS	ゲノム研究関連 (genome survey sequences)
STS	STS	sequence tagged sites

*特許データの利用に際しては，特許データ利用に関する注意をご参照ください。

データベースオプション（RefSeq）

定期リリース（genomic/RNA)
Fungi	菌類
Invertebrate	無脊椎動物
Microbial	細菌
Mitochondrion	ミトコンドリア
Plant	植物
Plasmid	プラスミド
Plastid	色素体
Protozoa	原生生物
Vertebrate Mammalian	哺乳類
Vertebrate Other	哺乳類以外の脊椎動物
Viral	ウィルス
Daily Updates	Daily Updates

モデル生物（Genomic)
H. sapiens	ヒト

モデル生物（RNA)
B. taurus	ウシ
D. rerio	メダカ
H. sapiens	ヒト
M. musculus	マウス
R. norvegicus	ラット
X. tropicalis	アフリカツメガエル

アミノ酸配列（データベース，DIVISION）

データベース

デフォルトは　UniProt(Swiss-Prot + TrEMBL)です。

Proterin Databases
UniProt (Swiss-Prot + TrEMBL)	Swiss-Prot + TrEMBL
UniProt (Swiss-Prot)	Swiss-Prot
UniProt (TrEMBL)	TrEMBL
Patent	JPO，EPO，USPTO，KIPO の全データ（Patent　を選択すると４つ全てにチェックが入ります。個々の選択は可能です。不要なチェックを外してください。）
DAD (periodical release + daily updates)	DAD 定期リリース + 新着データ
DAD (daily updates)	DAD 定期リリース後の新着データ
RefSeq AA	Refseq(Protein)

*特許データの利用に際しては，特許データ利用に関する注意をご参照ください。

*現在のバージョンはこちらからご確認ください。

DIVISION(DAD)

検索対象とする DIVISION を指定します。以下の選択肢から指定が可能です(複数可)。デフォルトでは、Standard divisions のうち　SYN, ENV を除いた 10 divisions が選択されています。 EST については登録数の多い21種のデータから選択することが出来ます。

Standard divisions
Human	HUM	ヒト
Primates	PRI	霊長類（ヒトを除く）
Rodents	ROD	齧歯類
Mammals	MAM	哺乳類（ヒト、霊長類、齧歯類を除く）
Vertebrates	VRT	脊椎動物（ヒト、霊長類、齧歯類、哺乳類を除く）
Invertebrates	INV	無脊椎動物
Plants	PLN	植物・酵母・藻類
Bacteria	BCT	バクテリア（原核生物）
Viruses	VRL	ウイルス
Phages	PHG	バクテリオファージ
Synthetic DNAs	SYN	合成配列（合成遺伝子）
ENV	ENV	環境サンプル (environmental samples)

High throughput divisions
HTC	HTC	High Throughput cDNAs
HTG	HTG	High Throughput Genomic sequences
TSA	TSA	Transcriptome Shotgun Assembly

EST divisions
A.thaliana	Arabidopsis thaliana （シロイヌナズナ）
B.taurus	Bos taurus （ウシ）
C.elegans	Caenorhabditis elegans （線虫）
C.reinhardtii	Chlamydomonas reinhardtii （クラミドモナス）
C.intestinalis	Ciona intestinalis （カタユウレイボヤ）
D.rerio	Danio rerio （ゼブラフィッシュ）
D.discoideum	Dictyostelium discoideum （キイロタマホコリカビ）
D.melanogaster	D.melanogaster （ショウジョウバエ）
G.gallus	Gallus gallus （ニワトリ）
G.max	Glycine max （ダイズ）
H.sapiens	Homo sapiens （ヒト）
H.vulgare	Hordeum vulgare （亜種も統合）
M.truncatula	Medicago truncatula （特殊ライブラリも統合）
M.musculus	Mus musculus （ハツカネズミ）
O.sativa	Oryza sativa （亜種レベルも統合）
R.norvegicus	Rattus norvegicus （Rattus sp. も統合）
S.lycopersicum	Solanum lycopersicum （トマト）
T.aestivum	Triticum aestivum （コムギ）
X.laevis	Xenopus laevis （アフリカツメガエル）
X.tropicalis	Xenopus tropicalis （アフリカツメガエル）
Z.mays	Zea mays （トウモロコシ）
Others	上記以外（Others）

その他
Patent	PAT	特許データ
Unannotated Seq	UNA	未注釈データ
GSS	GSS	ゲノム研究関連 (genome survey sequences)
STS	STS	sequence tagged sites

データベースオプション（RefSeq）

定期リリース(Protein)
Fungi	菌類
Invertebrate	無脊椎動物
Microbial	細菌
Mitochondrion	ミトコンドリア
Plant	植物
Plasmid	プラスミド
Plastid	色素体
Protozoa	原生生物
Vertebrate Mammalian	哺乳類
Vertebrate Other	哺乳類以外の脊椎動物
Viral	ウィルス
Daily Updates	Daily Updates

モデル生物（RNA)
B. taurus	ウシ
D. rerio	メダカ
H. sapiens	ヒト
M. musculus	マウス
R. norvegicus	ラット
X. tropicalis	アフリカツメガエル

Optional Parameters

SCORES：検索結果一覧の表示数

相同性スコアの順位表を，第何位まで表示するかを指定します。
デフォルトは100位までです。
検索結果に期待される対象が含まれない場合，この値をより大きな値にすると，結果が改善される可能性があります。

ALIGNMENTS：整列（アライメント）

相同な配列との整列を，相同性スコアの順で第何位まで表示させるかを指定します。
検索結果に期待される対象が含まれない場合，この値をより大きな値にすると，結果が改善される可能性があります。

EXPECT：期待値（E-value） {#expect value}

出力される配列に関して統計的な閾値を指定します。デフォルトは１０ですが，これは偶然に一致する配列が１０本あるという条件を意味しており，この条件よりも偶然に一致する配列が少ないと統計的に計算された配列が出力されます。
多くの相同な配列を出力させるには，この値を大きく指定します。逆に，非常に高い相同性を持つ配列だけを出力させるには，この値を小さく指定します。
また，指数表記で指定可能です。(例：1.0E+1)

SCORING MATRIX：アミノ酸置換表 {#scoring matrix}

アミノ酸配列の置換行列の表を指定します。
blastx, blastp, tblastn, tblastx で指定可能です。指定可能な置換行列は以下のとおりです。
デフォルトでは BLOSUM62 が設定されます。

PAM30	PAM30 substitution matrix
PAM70	PAM70 substitution matrix
PAM250	PAM250 substitution matrix
BLOSUM45	BLOSUM Clustered Scoring Matrix
BLOSUM50	BLOSUM Clustered Scoring Matrix
BLOSUM62	BLOSUM Clustered Scoring Matrix
BLOSUM80	BLOSUM Clustered Scoring Matrix
BLOSUM90	BLOSUM Clustered Scoring Matrix

FILTER：フィルター

検索配列データのフィルタリング(マスキング)を指定します。デフォルトではフィルタリングを行います。
フィルタリングにより，問い合わせ配列のうち構造の複雑度が低い領域を無視することができます。
一般に proline-rich 領域や poly-A tail などの領域は構造的な偏りが反映されて異常に高いスコアで一致する傾向がありますが，フィルタリングによりそのような有意でない一致を結果から除くことができます。
blastn 使用時には Tatusov and Lipman によるDUSTプログラムにより，他の場合は Wootton & Federhen (Computers and Chemistry, 1993) による SEG プログラムによりフィルタリングされます。
フィルタプログラムによって見つけられた低複雑度領域は，塩基配列の場合 “N”，アミノ酸配列の場合 “X” の文字で置き換えられます。

WORD SIZE {#word size}

自然数を入力します。デフォルトでは blastn の megablast の場合は 28，blastn の blastn の場合は11，
blastp，blastx，tblastn，tblastx の場合は 3 です。
blastn の場合は，wordsize を 11 以外の数に変えるべきではありません。

Request ID，検索結果表示

Request ID {#request id}

検索実行後の画面に Request ID が表示されますので，必ず控えて下さい。（問い合わせや Result Viewer （後述）で結果を見たい時などに必要です）

Request ID:wabi_blast_2013-0314-1407-23-16-946732

結果画面に表示される情報 {#result screen}

結果中のアクセッション番号の検索・表示 {#view flatfile}

該当するアクセッション番号にチェックを入れて、”getentry”　ボタンをクリックすると、getentry　の結果が表示されます。

検索結果の閲覧 {#result viewer}

Result Viewer

ブラウザを閉じてしまっても、Result Viewer を用いてRequest ID から結果を閲覧することができます。
検索結果閲覧期間は、実行後７日間です。

ClustalW Set up

チェックボックスで ClustalW で解析を行いたい配列を選択して”ClustalW”　ボタンをクリックすると、選択した配列が入力された状態でClustalW 画面が開きます。

1. 2.

原著論文，関連論文および参考文献

原著論文

Altschul SF, Madden TL, Schaffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25(17):3389-3402.

参考文献

「改訂　第２版　バイオデータベースとウェブツールの手とり足とり活用法」（羊土社）
編集／中村保一，石川　淳，磯合　敦，平川美夏，坊農秀雅 ISBN978-4-7581-0811-9
[BLAST] Ian Korf, Mark Yandell and Joseph Bedell, OREILLY

Program：プログラム

Query：検索配列名，検索配列データ

Data Sets {#data sets}

塩基配列（データベース，DIVISION）

データベース

DIVISION (DDBJ ALL / DDBJ New)

データベースオプション（RefSeq）

アミノ酸配列（データベース，DIVISION）

データベース

DIVISION(DAD)

データベースオプション（RefSeq）

Optional Parameters

SCORES：検索結果一覧の表示数

ALIGNMENTS：整列 （アライメント）

EXPECT：期待値（E-value） {#expect value}

SCORING MATRIX：アミノ酸置換表 {#scoring matrix}

FILTER：フィルター

WORD SIZE {#word size}

Request ID，検索結果表示

Request ID {#request id}

結果画面に表示される情報 {#result screen}

結果中のアクセッション番号の検索・表示 {#view flatfile}

検索結果の閲覧 {#result viewer}

Result Viewer

ClustalW Set up

原著論文，関連論文および参考文献

原著論文

関連論文

参考文献

ALIGNMENTS：整列（アライメント）