DDBJ Annotated/Assembled Sequences

  • Home
  • Submission
    • 塩基配列の登録
    • Web 版塩基配列登録システム
    • Mass Submission System
    • 登録データの修正・更新
  • Search
    • getentry
    • ARSA
  • Flat file
    • Feature key の定義
    • Qualifier key の定義
    • 塩基配列について
    • Organism qualifier に記載する生物名
    • 識別子について
    • Location の記述法
    • タンパク質コード配列
    • The Genetic Codes
    • 配列の記載に用いる略号
    • 登録の見本
  • Data categories
    • Genome project のデータ登録
    • Pseudohaplotype
    • WGS
    • Finished level genomic sequences
    • メタゲノムアセンブリ
    • Single amplified genome
    • CON
    • GSS
    • HTG
    • Environmental sequence の登録
    • ENV
    • TLS
    • Transcriptome Project のデータ登録
    • TSA
    • EST
    • HTC
    • Third Party Data (TPA)
  • FAQ
  • Other
    • Patent
    • MGA
  • ホーム
  • ddbj
  • データの種類

データの種類

Division

通常の登録: 由来生物種による区分

完成したゲノム配列を含めて一般的な登録データは、ここに属します。
source feature と、それ以外に最低 1 つ Biological feature の記載が必要となります。
由来する生物の系統分類に基づいて自動的に下記の DIVISION に振り分けられます。

Division Description
HUM ヒト
PRI 霊長類(ヒトを除く)
ROD 齧歯類
MAM 哺乳類(ヒト、霊長類、齧歯類を除く)
VRT 脊椎動物(ヒト、霊長類、齧歯類、哺乳類を除く)
INV 無脊椎動物
PLN 植物・真菌類など
BCT バクテリア
VRL ウィルス
PHG ファージ

ENV/SYN: 由来生物種を特定できない場合、環境サンプルと合成配列

環境サンプル、および、人為的な操作により構築された配列は、それぞれ、ENV、SYN と DIVISION を記載し区別します。
source feature と、それ以外に最低1つの Biological feature による特徴づけが必要となります。

Division Description
ENV PCR、DGGE、あるいは、その他の方法で直接、分子を単離した環境上のサンプルに由来した配列。
ENV の場合は source feature に environmental_sample qualifier を記載する必要があります。
SYN synthetic constructs; 人為的な操作により構築された合成配列
SYN は合成配列、例えば発現ベクターの配列、プライマーの配列、キメラ配列、fusion 配列、人為的に変異を導入した配列などが該当します。複数の生物種や遺伝子由来の断片をつなぎ合わせた合成配列では、各々の配列の由来を示すために複数の source feature を使用して記載する場合があります。
登録の見本; E05) synthetic construct もご参照ください。

CON: Contig/Constructed 配列のタイリング

HTG または WGS などを基本としたゲノムプロジェクトでは、個々に登録された一連の配列データを相互に結合し、ゲノム構造を再構築するための情報が必要になります。そのようなタイリング情報に対して、1つのアクセッション番号を割り当てて特殊なエントリとして登録を受け付けています。このようなエントリを CON エントリと呼び、CON division に格納します。
Genome Project の各段階と登録データの種別 もご参照ください。

CON エントリ のみの登録は受け付けておりません。
まず、CON エントリを構成する個々のピースエントリを登録していただきます。その上で CON エントリを構築します。
CON エントリの登録には AGP ファイル が必要です。

EST/GSS/HTC/HTG/STS: 配列決定の目的や段階による区別

EST に代表される大量解析、長大なゲノム配列の決定の途上、などの配列を以下に示す DIVISION に区別します。
生物学的な特徴づけは source feature のみを基本とします。
ただし、HTC、HTG には研究段階に応じて記載する情報が異なりますが、通常の登録と同様に Biological features を記載することも可能です。
それぞれのデータに関する説明ページも合わせてご覧ください。

Division Description
EST expressed sequence tags; short single pass の cDNA 配列。
GSS genome survey sequences; short single pass のゲノム配列。
STS sequence tagged sites; genome sequencing の tag となる配列。
ゲノム上の位置情報、primer_bind feature, PCR_conditions qualifier などの記載を推奨します。
HTC high throughput cDNA sequences; EST 以外の大規模 cDNA 配列プロジェクトにする配列。
full length cDNA 解析途上の配列なども含めます。
HTG high throughput genomic sequences; ゲノムプロジェクトに由来し、頻繁に update されることが期待される配列。
Genome Project の各段階と登録データの種別 もご参照ください。
HTG の unfinished 配列は段階に応じて以下の 3 phase に分類されます。
  • phase0;piece contig が構築される以前の配列
  • phase1;構築された piece contig の向きや順序が未確定の配列
  • phase2;piece contig の向きや順序が確定した unfinished の配列

Bulk sequence dataにおけるdata type

WGS: Whole Genome Shotgun ゲノムの概要配列

ホールゲノムショットガン配列決定法を用いて全ゲノム配列を決定するゲノムプロジェクトに由来する整理が不十分な段階の大量の DNA 断片の bulk sequence data を WGSとして受け付けています。
WGS データは他のデータとアクセッション番号の書式が異なります。
Genome Project の各段階と登録データの種別 もご参照ください。

TSA: Transcriptome Shotgun Assembly

2008 年からアセンブルされた RNA transcript の bulk sequence data を Transcriptome Shotgun Assembly (TSA) として受け付けています。
生物学的な特徴づけは source feature のみを基本とします。
ただし、通常の登録と同様に Biological featuresを記載することも可能です。
TSA データは他のデータとアクセッション番号の書式が異なることがあります。
Transcriptome Project の各段階と登録データの種別 もご参照ください。

TLS: Targeted Locus Study

2016 年から 16S rRNA または、他の特定 locus を標的とした配列で構成され、主として operational taxonomic unit クラスター化に用いられる bulk sequence data を TLS (Targeted Locus Study) として受け付けています。
通常の登録と同様に Biological featuresを記載することも可能です。
TLS データは他のデータとアクセッション番号の書式が異なります。

登録者が配列決定していないことを区別

TPA: Third Party Data 第三者再構築またはアノテーション

TPA (Third Party Data) は, DDBJ/EMBL-Bank/GenBank、Trace Archive、もしくは、Sequence Read Archiveに既に登録されているエントリ (これをプライマリーエントリと呼びます) を元に, 第三者がアセンブル (assemble), もしくは, (再)アノテーションを行ったデータのコレクションです。配列のアセンブルには, 既存のプライマリーエントリの組み合わせのみで構成された場合と, 新規に TPA の登録者が実験的に決定した配列を混在させた場合とが存在します。DDBJ/EMBL-Bank/GenBank では, 既報のプライマリーエントリに記載されている配列に関する研究を公開するための手段として TPA 登録を受け入れています。
TPA Submission Guidelines もご参照ください。

MSS submission時に選択可能なdata type

Type Description
WGS: Whole Genome Shotgun WGS (draft genome)に該当しMAGやSAGでない場合
GNM: Finished Level Genome Sequence, non-WGS WGSでないFinished Level Genomic Sequencesに該当しMAGやSAGでない場合
MAG: Metagenome-Assembled Genome MAGに該当する場合
SAG: Single Amplified Genome SAGに該当する場合
TLS: Targeted Locus Study TLSに該当する場合
HTG: High Throughput Genomic Sequences HTGに該当する場合
TSA: Transcriptome Shotgun Assembly TSAに該当する場合
HTC: High Throughput cDNA Sequences HTCに該当する場合
EST: Expressed Sequence Tags ESTに該当する場合
MISC: Sequences that are not included in above types いずれのtypeにも該当しない場合
ASK: Ask DDBJ curator to judge a correct datatype DDBJ Curatorに判断を仰ぐ場合

登録予定の塩基配列データ種別や登録先の判断

  • Genome Project の各段階と登録データの種別
  • Transcriptome Project の各段階と登録データの種別
  • 登録ナビゲーション

Related pages

  • Genome Project のデータ登録
  • WGS
  • CON
  • GSS
  • HTG
  • Environmental sequence の登録
  • ENV
  • TLS
  • Transcriptome Project のデータ登録
  • TSA
  • EST
  • HTC
  • Third Party Data (TPA)