• getentryでENAとGenBankから特定期間に公開されたエントリーを反映できていない
  • 5月29日 DDBJ アカウント (9-10時) と JGA/AGD (9-14時) システム停止

DDBJ Annotated/Assembled Sequences

  • Home
  • Submission
    • 塩基配列の登録
    • Web 版塩基配列登録システム
    • Mass Submission System
    • 登録データの修正・更新
  • Search
    • getentry
    • ARSA
  • Flat file
    • Feature Table
    • Feature key の定義
    • Qualifier key の定義
    • 塩基配列について
    • Organism qualifier に記載する生物名
    • 識別子について
    • Location の記述法
    • タンパク質コード配列
    • The Genetic Codes
    • 配列の記載に用いる略号
    • 配列データ記載例
  • Data categories
    • Genome project のデータ登録
    • Pseudohaplotype
    • WGS
    • Finished level genomic sequences
    • メタゲノムアセンブリ
    • Single amplified genome
    • HTG
    • Environmental sample
    • ENV
    • TLS
    • Transcriptome Project のデータ登録
    • TSA
    • EST
    • HTC
    • Third Party Data (TPA)
  • FAQ
  • Other
    • Patent
    • MGA
  • ホーム
  • ddbj
  • HTG

HTG

HTG division は finished レベルに達していないゲノム配列を利用可能にするという需要に対応するために作られました。

DDBJ において HTG division には finished レベルに達していないゲノム配列データが含まれています。 配列が finished level に更新された後には、HTG ではなく、taxonomic lineage に基づく division に移行します。

HTG 登録には、Mass Submission System (MSS) をご利用ください。

HTG の登録における注意事項
  • 登録に先立ち、BioProject Database へ登録し BioProject ID を取得してください。
  • clone qualifier を記載してください。
    基本的に HTG division への主な対象はfinished レベルに達していない BAC, YAC, fosmid cloneです。

DDBJ フォーマットの例

HTG の特徴

  • 配列が finished level と見做せる場合、LOCUS 行に表示される DIVISION は taxonomic lineage に基づいて、”HUM”, “PRI”, “ROD”, “MAM”, “VRT”, “INV”, “PLN”, “BCT” の何れかになります。
    配列が finished level ではない場合、DIVISION は、”HTG” です。
  • 配列が finished level と見做せる場合は、KEYWORDS 行には 特に何も表示されません。
    配列が finished level ではない場合、KEYWORDS には”HTG” および “HTGS_PHASE0”, “HTGS_PHASE1”, “HTGS_PHASE2” の何れかが表示されます。
    • HTGS_PHASE0: 1つの配列決定用サブクローン当たり、1回から数回読んだのみ
    • HTGS_PHASE1: unfinished で gap が残っており、contig の順序と向きが不明な箇所がある
    • HTGS_PHASE2: unfinished で gap が残っている場合も残っていない場合もあり、contig の順序と向きは判明している
  • さらに KEYWORDS 行に “HTGS_DRAFT”, “HTGS_ENRICHED”, “HTGS_POOLED_CLONE”, “HTGS_POOLED_MULTICLONE” などが表示される場合もあります。
  • HTG では DEFINITION に “*** SEQUENCING IN PROGRESS ***” などの進捗を示す語句が示されることがあります。
LOCUS       AP000000              121001 bp    DNA    linear   HTG 15-OCT-2008
DEFINITION  Arabidopsis thaliana DNA, chromosome 1, BAC clone: CIC5D1, ***
            SEQUENCING IN PROGRESS ***, 10 unordered pieces.
ACCESSION   AP000000
VERSION     AP000000.1
DBLINK      BioProject:PRJDB04321
KEYWORDS    HTG; HTGS_PHASE1.
SOURCE      Arabidopsis thaliana (thale cress)
  ORGANISM  Arabidopsis thaliana
            Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta;
            Spermatophyta; Magnoliophyta; eudicotyledons; core eudicotyledons;
            rosids; malvids; Brassicales; Brassicaceae; Camelineae;
            Arabidopsis.
REFERENCE   1  (bases 1 to 423)
  AUTHORS    Mishima,H., Yamada,T. and Liu,G.Q.
  TITLE     Direct Submission
  JOURNAL   Submitted (30-SEP-2008) to the DDBJ/EMBL/GenBank databases.
            Contact:Hanako Mishima
            National Institute of Genetics, DNA Data Bank of Japan; Yata 1111,
            Mishima, Shizuoka 411-8540, Japan
REFERENCE   2
  AUTHORS   Mishima,H., Yamada,T., Park,C.S. and Liu,G.Q.
  TITLE     Arabidopsis thaliana DNA
  JOURNAL   Unpublished (2008)
FEATURES             Location/Qualifiers
     source          1..121001
                     /chromosome="1"
                     /clone="CIC5D1"
                     /clone_lib="AT01 BAC"
                     /collection_date="2001"
                     /db_xref="taxon:3702"
                     /ecotype="Columbia"
                     /geo_loc_name="USA"
                     /map="between mi303 and mi259"
                     /mol_type="genomic DNA"
                     /organism="Arabidopsis thaliana"
     gap             2079..2128
                     /estimated_length=unknown
     gap             7295..7344
                     /estimated_length=unknown
     gap             15694..15743
                     /estimated_length=unknown
     gap             32780..32829
                     /estimated_length=unknown
     gap             40371..40420
                     /estimated_length=unknown
     gap             59441..59490
                     /estimated_length=unknown
     gap             79080..79129
                     /estimated_length=unknown
     gap             88074..88123
                     /estimated_length=unknown
     gap             107128..107177
BASE COUNT         105 a          98 c          112 g          108 t
ORIGIN
        1 attaatataa gctaaatatg tttttcaata tatattgata atagaatatc aacaatttgg
        :
        -- The rest of nucleotide sequence is omitted --
        :
//

Related pages

  • Genome Project のデータ登録
  • Environmental sequence の登録
  • Transcriptome Project のデータ登録
  • Third Party Data (TPA)