最終更新日:2016.1.25.

登録データ種別

登録された塩基配列データは、その種類と付帯情報を以下に示すデータ種別に区分して、提供されます。

実配列データ
シークエンサ出力データ
Annotated/Assembled データ
研究プロジェクト・サンプル
制限アクセス公開

 

実配列データ

シークエンサ出力データ

DRA: DDBJ Sequence Read Archive
Roche 454 GS System,Illumina Genome Analyzer,Applied Biosystems SOLiD System などの次世代シークエンサからの出力データのためのデータベース。
DTA: DDBJ Trace Archive
シングルパスリードの DNA sequence chromatograms (traces), base calls, quality estimates のためのデータベース。

 

Annotated/Assembled データ

DDBJ (traditional DDBJ)

狭義の DDBJ。GenBank, EMBL-Bank に相当し、feature annotation を記載した配列データをフラットファイルとして提供。
traditional DDBJ の配列データは以下のように細分されます。

Division

Data type

配列決定

登録予定の塩基配列データをどのように登録すべきか不明な場合は

などを ご参照下さい。

Mass Submission System (MSS) の場合、登録時に DATATYPE, DIVISION, KEYWORD の記載に基づいて、データ種別を区別しています。

 

研究プロジェクト・サンプル

BioProject
研究プロジェクトとプロジェクトに由来するデータをまとめるためのデータベース。
ウイルス、プラスミド、オルガネラのみの場合を除く全ゲノム規模の登録TSAの登録 では、登録が義務付けられています。
BioSample
実験データを得るために使用された生物学的な試料 (サンプル) についての情報を集中して管理するデータベース。

 

制限アクセス公開

JGA: Japanese Genotype-phenotype Archive
個人に由来する遺伝学的なデータと匿名化された表現型情報の登録。

 

Annotated/Assembled データの細かい区分

通常の登録

完成したゲノム配列を含めて一般的な登録データは、ここに属します。
source feature と、それ以外に最低 1 つの Biological feature による特徴づけが必要となります。
由来する生物の系統分類に基づいて自動的に下記の DIVISION に振り分けられます。

  • HUM ; ヒト
  • PRI ; 霊長類(ヒトを除く)
  • ROD ; 齧歯類
  • MAM ; 哺乳類(ヒト、霊長類、齧歯類を除く)
  • VRT ; 脊椎動物(ヒト、霊長類、齧歯類、哺乳類を除く)
  • INV ; 無脊椎動物
  • PLN ; 植物・真菌類など
  • BCT ; バクテリア
  • VRL ; ウィルス
  • PHG ; ファージ

 

ENV/SYN: 環境サンプルと合成配列

環境サンプル、および、人為的な操作により構築された配列は、それぞれ、ENV - 環境サンプルSYN と DIVISION を記載し区別します。
source feature と、それ以外に最低 1 つの Biological feature による特徴づけが必要となります。

  • ENV; PCR, DGGE, あるいは、その他の方法で直接、分子を単離した環境上のサンプルに由来した配列。
    ENV の場合は source feature に environmental_sample qualifier を記載する必要があります。
  • SYN; 人為的な操作により構築された合成配列
    SYN は合成配列、例えば発現ベクターの配列、プライマーの配列、キメラ配列、fusion 配列、人為的に変異を導入した配列などが該当します。複数の生物種や遺伝子由来の断片をつなぎ合わせた合成配列では、各々の配列の由来を示すために複数の source feature を使用して記載する場合があります。
    登録の見本; E05) synthetic construct もご参照ください。

 

EST/GSS/HTC/HTG/STS: 配列決定の確度、あるいは、目的による区別

EST に代表される大量解析、長大なゲノム配列の決定の途上、などの配列を以下に示す DIVISION に区別します。
生物学的な特徴づけは source feature のみを基本とします。
ただし、HTC、HTG には研究段階に応じて記載する情報が異なりますが 通常の登録と同様に Biological features を記載することも可能です。
また、STS には、ゲノム上の位置情報、primer_bind feature, PCR_conditions qualifier などの情報を記載することを推奨します。
それぞれのデータに関する説明ページも合わせてご覧ください。

  • EST; expressed sequence tags、short single pass の cDNA 配列。
  • GSS; genome survey sequences、short single pass のゲノム配列。
  • STS; sequence tagged sites; genome sequencing の tag となる配列。
  • HTC; high throughput cDNA sequences、EST 以外の大規模 cDNA 配列プロジェクトにする配列。full length cDNA 解析途上の配列なども含めます。
  • HTG; high throughput genomic sequences, ゲノムプロジェクトに由来し、頻繁に update されることが期待される配列。
    Genome Project の各段階と登録データの種別 もご参照ください。
    HTG の unfinished 配列は段階に応じて以下の 3 phase に分類されます。

    • phase0;piece contig が構築される以前の配列
    • phase1;構築された piece contig の向きや順序が未確定の配列
    • phase2;piece contig の向きや順序が確定した unfinished の配列

 

TSA: Transcriptome Shotgun Assembly

DDBJ/EMBL-Bank/GenBank では, 2008 年からアセンブルされた RNA transcript 配列データを, Transcriptome Shotgun Assembly (TSA) division にて受け付けています。
生物学的な特徴づけは source feature のみを基本とします。
ただし、通常の登録と同様に Biological featuresを記載することも可能です。
TSA データは他のデータとアクセッション番号の書式が異なることがあります。
Transcriptome Project の各段階と登録データの種別もご参照ください。

 

CON: Contig / Constructed 配列のタイリング

HTG 、または、WGS などを基本としたゲノムプロジェクトでは、個々に登録された一連の配列データを相互に結合し、ゲノム構造を再構築するための情報が必要になります。そのようなタイリング情報に対して、1つのアクセッション番号を割り当てて特殊なエントリとして登録を受け付けています。このようなエントリを CON エントリと呼び、CON division に格納します。
Genome Project の各段階と登録データの種別 もご参照ください。

CON エントリ のみの登録は受け付けておりません。
まず、CON エントリを構成する個々のピースエントリを登録していただきます。その上で CON エントリを構築します。
CON エントリの登録には AGP ファイル が必要です。

 

WGS: ゲノムアセンブル途上の概要配列

DDBJ/EMBL-Bank/GenBank では、ホールゲノムショットガン配列決定法を用いて全ゲノム配列を決定するゲノムプロジェクトに由来する整理が不十分な段階の大量の DNA 断片の配列データを、WGS データとして受け付けています。
WGS データは他のデータとアクセッション番号の書式が異なります。
Genome Project の各段階と登録データの種別 もご参照ください。

 

TPA: 第三者再構築、または、アノテーション

TPA (Third Party Data) は, DDBJ/EMBL-Bank/GenBankTrace Archive、もしくは、Sequence Read Archiveに既に登録されているエントリ (これをプライマリーエントリと呼びます) を元に, 第三者がアセンブル (assemble), もしくは, (再)アノテーションを行ったデータのコレクションです。配列のアセンブルには, 既存のプライマリーエントリの組み合わせのみで構成された場合と, 新規に TPA の登録者が実験的に決定した配列を混在させた場合とが存在します。DDBJ/EMBL-Bank/GenBank では, 既報のプライマリーエントリに記載されている配列に関する研究を公開するための手段として TPA 登録を受け入れています。
TPA Submission Guidelines もご参照ください。

ページの先頭へ戻る