Genome Project のデータ登録

ゲノム配列決定の各段階と登録データの種別の対応を示します。
実際には併用されることも多いのですが、下図では典型的な手法の各段階を模式的に示しています。
なお、大規模なゲノム配列決定プロジェクトは BioProject へご登録ください。

重要: ヒトを対象としたデータ登録について
ヒトを対象とした全ての研究において DDBJ に送付するデータの元になる個人のプライバシーは、適用されるべき法律、規定や所属する組織の方針に従い、登録者の責任において保護されている必要があります。 個人を直接特定できるような情報を、登録データから完全に取り除いてください。 データ元となる個人との間で大規模な塩基配列情報が公開されることについてのインフォームドコンセントが得られている必要があります。 「ヒトゲノム・遺伝子解析研究に関する倫理指針」上、問題となるような登録は受け付けません。

genome


[DRA] Raw outputs 次世代シークエンサの出力

次世代シークエンサからの出力データは DDBJ Sequence Read Archive (DRA)へご登録ください。

[DTA] Chromatograms, Sequences, Qualities: Sanger 法の出力

single-path read の DNA sequence chromatograms (traces), base calls, quality estimates は、DDBJ Trace Archive (DTA) へご登録ください。

[WGS] Contigs: assemblies (overlapping reads)

冗長な raw read sequences ではなく、ある程度計算機処理を経た overlapping reads の配列は、WGS として Mass Submission System から ご登録ください。

[HTG] draft sequences of large clones

finished レベルに達していない BAC, YAC, fosmid clone などの概要配列は HTG として Mass Submission System から ご登録ください。

[CON] Scaffolds: supercontigs or clone tiling path

gap を含めた連結構造、いわゆる supercontigs (assembled contigs separated by gaps)、または、複数の clone の tiling path として長大な配列を記載する場合は、CON として Mass Submission System から ご登録ください。

Finished genomic sequences

一般的なデータ、または、complete genome として Mass Submission System から ご登録ください。