DDBJ Annotated/Assembled Sequences
Genome Project のデータ登録
Genome Project のデータ登録
ゲノム配列決定の各段階と登録データの種別の対応を示します。
実際には併用されることも多いのですが、下図では典型的な手法の各段階を模式的に示しています。
なお、大規模なゲノム配列決定プロジェクトは BioProject と BioSample にも ご登録ください。
INSDC standards for genome assembly submission もご参照ください。
- [DRA] Raw outputs 次世代シークエンサの出力
- 次世代シークエンサからの出力データは DDBJ Sequence Read Archive (DRA)へご登録ください。
- [DTA] Chromatograms, Sequences, Qualities: Sanger 法の出力
- single-path read の DNA sequence chromatograms (traces), base calls, quality estimates は、DDBJ Trace Archive (DTA) へご登録ください。
- [WGS] Contigs: assemblies (overlapping reads)
- 冗長な raw read sequences ではなく、ある程度計算機処理を経た overlapping reads の配列は、WGS として Mass Submission System から ご登録ください。
- [HTG] draft sequences of large clones
- finished レベルに達していない BAC, YAC, fosmid clone などの概要配列は HTG として Mass Submission System から ご登録ください。
- [CON] Scaffolds: supercontigs or clone tiling path
- gap を含めた連結構造、いわゆる supercontigs (assembled contigs separated by gaps)、または、複数の clone の tiling path として長大な配列を記載する場合は、CON として Mass Submission System から ご登録ください。
- Finished genomic sequences
- 一般的なデータ、または、complete genome として Mass Submission System から ご登録ください。