• getentryでENAとGenBankから特定期間に公開されたエントリーを反映できていない

DDBJ Annotated/Assembled Sequences

  • Home
  • Submission
    • 塩基配列の登録
    • Web 版塩基配列登録システム
    • Mass Submission System
    • 登録データの修正・更新
  • Search
    • getentry
    • ARSA
  • Flat file
    • Feature Table
    • Feature key の定義
    • Qualifier key の定義
    • 塩基配列について
    • Organism qualifier に記載する生物名
    • 識別子について
    • Location の記述法
    • タンパク質コード配列
    • The Genetic Codes
    • 配列の記載に用いる略号
    • 配列データ記載例
  • Data categories
    • Genome project のデータ登録
    • Pseudohaplotype
    • WGS
    • Finished level genomic sequences
    • メタゲノムアセンブリ
    • Single amplified genome
    • HTG
    • Environmental sample
    • ENV
    • TLS
    • Transcriptome Project のデータ登録
    • TSA
    • EST
    • HTC
    • Third Party Data (TPA)
  • FAQ
  • Other
    • Patent
    • MGA
  • ホーム
  • ddbj
  • Finished level genomic sequences

Finished level genomic sequences

Finished level genomic sequences (non-WGS)

Finished level genomic sequences として登録可能な配列データ

  • Finished level genomic sequencesとは、ゲノムを構成する各レプリコンの全長配列であり、レプリコンにつき、1エントリーであることが必要です。シーケンシングギャップが含まれていても構いません。一般的には、chromosome の全長配列を指します。
  • 各chromosomeのエントリは、一つながりの連続した配列です。Finished level genomic sequences にはchromosomeに加えて、オルガネラやプラスミドの配列も含めることができます。
  • ゲノムを構成する各エントリは、chromosome、オルガネラ、プラスミドの何れかでなければならない。また、エントリはchromosome番号が割り当てられない(unanchored など)も、Finished level genomic sequences セットの一部に含めることができます。
  • 原核生物では、レプリコン単位(ゲノム及びプラスミド)の全長配列が読み取られていることが期待されます。
  • 真核生物では、各chromosomeの配列にシーケンシングギャップ(セントロメア、テロメア、繰り返し配列が連続する部分などの読み取りが困難領域)を含む一つながりの配列を、Finished level として登録可能です。シーケンシングギャップ領域のアノテーションが、必須です。


データ登録の要点

  • Finished level genomic sequences の登録は Mass Submission System (MSS) から申し込んで下さい。
  • Finished level genomic sequences の登録に先立ち、BioProject と BioSample への登録を完了し、それらアクセッション番号をFinished level genomic sequences エントリに記載をします。
  • Raw read sequences は、DDBJ Sequence Read Archive (DRA)に登録可能です。アセンブリの構築に使用した run data のアクセッション番号は、 Finished level genomic sequences エントリに記載をします。
  • source以外のCDS、tRNA、rRNA等の biological feature を記載する場合には、BioSample の登録時にlocus_tag prefix を必ず取得して下さい。
  • biological feature の記載は任意ですが、過去に登録例がない生物種のゲノムデータには、記載が必要です。

以下のサイトも併せてご覧下さい。

  • Genome Project データの登録
  • INSDC standards for genome assembly submission


DDBJ フォーマットの例

Finished level genomic sequences 配列エントリの特徴

  • アクセッション番号 はAccession prefix 2 文字と数字 6 桁 を基本とします。
  • DEFINITION 行には以下の各項目が表示されます。
    • 原核生物では、chromosomeが1本で構成されるゲノム配列エントリの場合、全長ゲノム配列であることを示す “complete genome”が表示されます。
  • 真核生物では、 一つながりの chromosomeの配列エントリにchromosome番号が表示されます。
  • COMMENT ブロックには以下の各項目が表示されます。
タグ名 値(内容)
Assembly Method アセンブルに使用したアルゴリズムの名称とバージョン
Assembly Name 生物名を含まないゲノムアセンブリの名称・バージョン。真核生物ゲノムの場合は必須
Genome Coverage ゲノム配列決定の深度、被覆度。ゲノム全体推定塩基の被覆率として算出
Sequencing Technology 配列解析に使用された sequencing platform 名
  • 原核生物ゲノムエントリのフラットファイルの例
    • Accession: AP025277-AP025279
    • Example: Aeromonas hydrophila strain; NUITM-VA1, chromosome and plasmid
  • 真核生物ゲノムエントリのフラットファイルの例
    • Accession: AP023152-AP023171
    • Example: Felis catus, chromosome genome assemblies
    • AP023152 chromosome A1 エントリ

Related pages

  • Genome Project のデータ登録
  • Environmental sequence の登録
  • Transcriptome Project のデータ登録
  • Third Party Data (TPA)