ACCESSION

INSD が発行する登録番号をアクセッション番号と呼んでいます。

通常データ

アルファベット1文字+5桁の数字(例 A12345)または、アルファベット2文字+6桁の数字(例 AB123456)で構成されています。
アルファベットの部分をプレフィックスと呼びます。
プレフィックスのリストも ご参照ください。

複数のエントリを統合した場合や、データ登録後に内容が大幅に変更された場合などには、新規にアクセッション番号を発行することがあります。この際、新規のアクセッション番号(プライマリアクセッション番号)に対して、既存のアクセッション番号はセカンダリアクセッション番号となります。フラットファイルには先頭にプライマリアクセッション番号、2つ目以降にセカンダリアクセッション番号を記載します。プライマリアクセッション番号、あるいはセカンダリアクセッション番号、どちらの番号で検索しても,同じ変更後のデータが検索されます。


ACCESSION   AB999999 AB888888 AB777777

AB999999 -- プライマリアクセッション番号
AB888888 AB777777 -- セカンダリアクセッション番号

WGS データ

WGS データに発行されるアクセッション番号は12桁 (アルファベット4文字+8桁の数字)で構成されます。
アルファベットの部分をプレフィックスと呼びます。
WGS プレフィックスのリストも ご参照ください。

アクセッション番号は以下の内容を表しています。

例:ZZZZ01000001

アルファベット4文字 -- プロジェクト番号
2桁の数字 -- データセットのバージョン番号
6桁の数字 -- エントリ(各コンティグの)番号

データセットが更新されるとデータセットのバージョン番号が上がります。 例:ZZZZ02000001


ACCESSION   ZZZZ01000001 ZZZZ01000000

ZZZZ01000001 -- プライマリアクセッション番号
ZZZZ01000000 -- セットID

MGAデータ

Master record に表示される番号はリソースセットに対する番号でデータバンク側が割り振ります。
番号はアルファベット5文字+7桁の数字(例 ZZZZZ0000000)で構成されています。
当該リソース配下の配列エントリのアクセッション番号は "MGA行" に記載されています。
アクセッション番号は以下の内容を表しています。

例:ZZZZZ0000001

アルファベット5文字 -- プロジェクト番号
    
1-2番目の文字 -- プロジェクト毎に割り振られるID (プロジェクトID *1)
    
3-5番目の文字 -- 各プロジェクトにおけるリソース*2に割り振られるID
7桁の数字 -- リソース配下の配列エントリに割り振られる番号
    *1 各プロジェクトIDに関してはプロジェクトインデックス をご参照ください。
    *リソースとは得られた配列の由来が同一であるものの単位を指します。


ACCESSION   ZZZZZ0000000

ZZZZZ0000000 -- リソースセットに対するアクセッション番号

 
 
 
 

 
 
 
 

 
 
 
 

 
 
 
 

 
 
 
 

 
 
 
 

ページの先頭へ戻る