Genome Project のデータ登録

ゲノム配列決定の各段階と登録データの種別の対応を示します。
実際には併用されることも多いのですが、下図では典型的な手法の各段階を模式的に示しています。
なお、大規模なゲノム配列決定プロジェクトは BioProjectBioSample にも ご登録ください。

重要: ヒトを対象とした研究データの登録について

INSDC standards for genome assembly submission もご参照ください。

[DRA] Raw outputs 次世代シークエンサの出力
次世代シークエンサからの出力データは DDBJ Sequence Read Archive (DRA)へご登録ください。
[DTA] Chromatograms, Sequences, Qualities: Sanger 法の出力
single-path read の DNA sequence chromatograms (traces), base calls, quality estimates は、DDBJ Trace Archive (DTA) へご登録ください。
[WGS] Contigs: assemblies (overlapping reads)
冗長な raw read sequences ではなく、ある程度計算機処理を経た overlapping reads の配列は、WGS として Mass Submission System から ご登録ください。
[HTG] draft sequences of large clones
finished レベルに達していない BAC, YAC, fosmid clone などの概要配列は HTG として Mass Submission System から ご登録ください。
[CON] Scaffolds: supercontigs or clone tiling path
gap を含めた連結構造、いわゆる supercontigs (assembled contigs separated by gaps)、または、複数の clone の tiling path として長大な配列を記載する場合は、CON として Mass Submission System から ご登録ください。
Finished genomic sequences
一般的なデータ、または、complete genome として Mass Submission System から ご登録ください。