ACCESSION
INSDが発行する登録番号をアクセッション番号と呼んでいます。
通常データ
アルファベット1文字+5桁の数字(例 A12345)または,アルファベット2文字+6桁の数字(例 AB123456)で構成されています。
複数のエントリを統合した場合や,データ登録後に大幅な内容変更がされた場合などには,新規にアクセッション番号を発行することがあります。 この際,新規のアクセッション番号(プライマリアクセッション番号)に対して,既存のアクセッション番号はセカンダリアクセッション番号となります。 フラットファイルには先頭にプライマリアクセッション番号,2つ目以降にセカンダリアクセッション番号を記載します。 プライマリアクセッション番号,あるいはセカンダリアクセッション番号,どちらの番号で検索しても,同じ変更後のデータが検索されます。
例 ACCESSION AB999999 AB888888 AB777777
- AB999999 -- プライマリアクセッション番号
- AB888888 AB777777 -- セカンダリアクセッション番号
WGS データ
WGS データに発行されるアクセッション番号は12桁 (アルファベット4文字+8桁の数字)で構成されます。アクセッション番号は以下の内容を表しています。
例:ZZZZ01000001
- アルファベット4文字 -- プロジェクト番号
- 2桁の数字 -- データセットのバージョン番号
- 6桁の数字 -- エントリ(各コンティグの)番号
データセットが更新されるとデータセットのバージョン番号が上がります。 例:ZZZZ02000001
例 ACCESSION ZZZZ01000001 ZZZZ01000000
- ZZZZ01000001 -- プライマリアクセッション番号
- ZZZZ01000000 -- セットID
MGAデータ
Master record に表示される番号はリソースセットに対する番号でデータバンク側が割り振ります。 番号はアルファベット5文字+7桁の数字(例 ZZZZZ0000000)で構成されています。 当該リソース配下の配列エントリのアクセッション番号は "MGA行" に記載されています。 アクセッション番号は以下の内容を表しています。
例:ZZZZZ0000001
- アルファベット5文字 -- プロジェクト番号
- 1-2番目の文字 -- プロジェクト毎に割り振られるID (プロジェクトID *1)
- 3-5番目の文字 -- 各プロジェクトにおけるリソース*2に割り振られるID
- 7桁の数字 -- リソース配下の配列エントリに割り振られる番号
- *1 各プロジェクトIDに関してはプロジェクトインデックス をご参照ください。
*リソースとは得られた配列の由来が同一であるものの単位を指します。
例 ACCESSION ZZZZZ0000000
- ZZZZZ0000000 -- リソースセットに対するアクセッション番号
