HOME > 塩基配列の登録 > DDBJ のデータ公開形式 (flat file) の説明 > ACCESSION

ACCESSION

INSDが発行する登録番号をアクセッション番号と呼んでいます。

通常データ

アルファベット1文字+5桁の数字(例 A12345)または,アルファベット2文字+6桁の数字(例 AB123456)で構成されています。

複数のエントリを統合した場合や,データ登録後に大幅な内容変更がされた場合などには,新規にアクセッション番号を発行することがあります。 この際,新規のアクセッション番号(プライマリアクセッション番号)に対して,既存のアクセッション番号はセカンダリアクセッション番号となります。 フラットファイルには先頭にプライマリアクセッション番号,2つ目以降にセカンダリアクセッション番号を記載します。 プライマリアクセッション番号,あるいはセカンダリアクセッション番号,どちらの番号で検索しても,同じ変更後のデータが検索されます。


ACCESSION   AB999999 AB888888 AB777777
AB999999 -- プライマリアクセッション番号
AB888888 AB777777 -- セカンダリアクセッション番号

WGS データ

WGS データに発行されるアクセッション番号は12桁 (アルファベット4文字+8桁の数字)で構成されます。アクセッション番号は以下の内容を表しています。

例:ZZZZ01000001

アルファベット4文字 -- プロジェクト番号
2桁の数字 -- データセットのバージョン番号
6桁の数字 -- エントリ(各コンティグの)番号

データセットが更新されるとデータセットのバージョン番号が上がります。 例:ZZZZ02000001


ACCESSION   ZZZZ01000001 ZZZZ01000000
ZZZZ01000001 -- プライマリアクセッション番号
ZZZZ01000000 -- セットID

MGAデータ

Master record に表示される番号はリソースセットに対する番号でデータバンク側が割り振ります。 番号はアルファベット5文字+7桁の数字(例 ZZZZZ0000000)で構成されています。 当該リソース配下の配列エントリのアクセッション番号は "MGA行" に記載されています。 アクセッション番号は以下の内容を表しています。

例:ZZZZZ0000001

アルファベット5文字 -- プロジェクト番号
     1-2番目の文字 -- プロジェクト毎に割り振られるID (プロジェクトID *1)
     3-5番目の文字 -- 各プロジェクトにおけるリソース*2に割り振られるID
7桁の数字 -- リソース配下の配列エントリに割り振られる番号
    *1 各プロジェクトIDに関してはプロジェクトインデックス をご参照ください。
    *リソースとは得られた配列の由来が同一であるものの単位を指します。

ACCESSION   ZZZZZ0000000
ZZZZZ0000000 -- リソースセットに対するアクセッション番号