• getentryでENAとGenBankから特定期間に公開されたエントリーを反映できていない

DDBJ Annotated/Assembled Sequences

  • Home
  • Submission
    • 塩基配列の登録
    • Web 版塩基配列登録システム
    • Mass Submission System
    • 登録データの修正・更新
  • Search
    • getentry
    • ARSA
  • Flat file
    • Feature Table
    • Feature key の定義
    • Qualifier key の定義
    • 塩基配列について
    • Organism qualifier に記載する生物名
    • 識別子について
    • Location の記述法
    • タンパク質コード配列
    • The Genetic Codes
    • 配列の記載に用いる略号
    • 配列データ記載例
  • Data categories
    • Genome project のデータ登録
    • Pseudohaplotype
    • WGS
    • Finished level genomic sequences
    • メタゲノムアセンブリ
    • Single amplified genome
    • HTG
    • Environmental sample
    • ENV
    • TLS
    • Transcriptome Project のデータ登録
    • TSA
    • EST
    • HTC
    • Third Party Data (TPA)
  • FAQ
  • Other
    • Patent
    • MGA
  • ホーム
  • ddbj
  • EST

EST

DDBJ において EST division “Expressed Sequence Tags” は様々な生物に由来する “single-pass” cDNA 配列 (つまり mRNA, RNA 転写産物) と その付帯情報からなる配列データです。

EST 登録には、Mass Submission System (MSS) をご利用ください。

EST 登録における注意事項
  • 登録前に cloning vector に由来する領域は配列から取り除いておいてください。
  • clone qualifier の記載が必須です。
  • 発現条件に相当する 組織 (tissue_type)、発生段階 (dev_stage)、性別 (mating_type または sex)、などの qualifier の記載を推奨します。
  • 原則として、Sanger 法により決定された配列を対象しています。
    いわゆる次世代シークエンサにより読まれた配列は DDBJ Sequence Read Archive に ご登録ください。
  • EST assemble に相当する配列は TSA: Transcriptome Shotgun Assembly として登録を受け付けます。

DDBJ フォーマットの例

EST エントリの特徴

  • 原則として、source feature 以外の feature は記載されません。

  • LOCUS 行に表示される DIVISION は、”EST” です。

  • KEYWORDS 行には “EST” と次のいずれかが表示されます。

    以下の controlled vocabulary は EST を得る際の手法、strategy を示すものであり、実際に RNA transcript の 5’ 末端、または、3’ 末端に相当する配列であることを保証するものではありません。

    5’EST の場合 5’-end sequence (5’-EST)
    3’EST の場合 3’-end sequence (3’-EST)
    上記を特定できない場合 unspecified EST
  • COMMENT 行には,登録される塩基配列が anti-sense 鎖側,sense 鎖側のどちらであるかを示すため,次のいずれかを COMMENT に記載します。

    3’EST 登録の場合にのみ該当します。

    anti-sense 鎖を登録する場合 3’-EST sequences are presented as anti-sense strand.
    sense 鎖を登録する場合 3’-EST sequences are presented as sense strand.
LOCUS       HY000000              300 bp    mRNA    linear   EST 15-OCT-2008
DEFINITION  Mus musculus mRNA, clone: 2310009A01, 3' end sequence, expressed 
            in tongue.
ACCESSION   HY000000
VERSION     HY000000.1
KEYWORDS    EST; 3'-end sequence (3'-EST).
SOURCE      Mus musculus (house mouse)
  ORGANISM  Mus musculus
            Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
            Mammalia; Eutheria; Euarchontoglires; Glires; Rodentia;
            Sciurognathi; Muroidea; Muridae; Murinae; Mus; Mus.
REFERENCE   1  (bases 1 to 300)
  AUTHORS   Mishima,H., Yamada,T. and Liu,G.Q.
  TITLE     Direct Submission
  JOURNAL   Submitted (30-SEP-2008) to the DDBJ/EMBL/GenBank databases.
            Contact:Hanako Mishima
            National Institute of Genetics, DNA Data Bank of Japan; Yata 1111,
            Mishima, Shizuoka 411-8540, Japan
REFERENCE   2
  AUTHORS   Mishima,H., Yamada,T., Park,C.S. and Liu,G.Q.
  TITLE     Mus musculus EST
  JOURNAL   Unpublished (2008)
COMMENT             3'-EST sequences are presented as anti-sense strand.
FEATURES             Location/Qualifiers
     source          1..300
                     /clone="2310009A01"
                     /clone_lib="full-length enriched mouse cDNA library A01"
                     /collection_date="2007"
                     /db_xref="taxon:10090"
                     /dev_stage="adult"
                     /geo_loc_name="Japan"
                     /mol_type="mRNA"
                     /organism="Mus musculus"
                     /sex="male"
                     /tissue_type="tongue"
BASE COUNT          86 a          90 c          73 g           51 t
ORIGIN
        1 attaatataa gctaaatatg tttttcaata tatattgata atagaatatc aacaatttgg
        :
        -- The rest of nucleotide sequence is omitted --
        :
//

Related pages

  • Genome Project のデータ登録
  • Environmental sequence の登録
  • Transcriptome Project のデータ登録
  • Third Party Data (TPA)