最終更新日:2015.12.24.

Genome Project のデータ登録

ゲノム配列決定の各段階と登録データの種別の対応を示します。
実際には併用されることも多いのですが、下図では典型的な手法の各段階を模式的に示しています。
なお、大規模なゲノム配列決定プロジェクトは BioProjectBioSample にも ご登録ください。

重要: ヒトを対象とした研究データの登録について

genome

INSDC standards for genome assembly submissionもご参照ください。

[DRA] Raw outputs 次世代シークエンサの出力

次世代シークエンサからの出力データは DDBJ Sequence Read Archive (DRA)へご登録ください。

[DTA] Chromatograms, Sequences, Qualities: Sanger 法の出力

single-path read の DNA sequence chromatograms (traces), base calls, quality estimates は、DDBJ Trace Archive (DTA) へご登録ください。

[WGS] Contigs: assemblies (overlapping reads)

冗長な raw read sequences ではなく、ある程度計算機処理を経た overlapping reads の配列は、WGS として Mass Submission System から ご登録ください。

[HTG] draft sequences of large clones

finished レベルに達していない BAC, YAC, fosmid clone などの概要配列は HTG として Mass Submission System から ご登録ください。

[CON] Scaffolds: supercontigs or clone tiling path

gap を含めた連結構造、いわゆる supercontigs (assembled contigs separated by gaps)、または、複数の clone の tiling path として長大な配列を記載する場合は、CON として Mass Submission System から ご登録ください。

Finished genomic sequences

一般的なデータ、または、complete genome として Mass Submission System から ご登録ください。

ページの先頭へ戻る