最終更新日:2016.1.20.

getentry ヘルプ

 

getentry の機能について

  • getentry は,アクセッション番号からの DDBJ フラットファイルの検索にご利用いただけます。
  • getentry は webAPI として実装しており,入力フォームからだけでなく,プログラムなどから直接呼び出すことも可能です。
  • データの変更履歴の検索は,webAPI プログラムの gethistory を用いて行うことができます。
  • "DDBJ フラットファイルのキーワード検索" は ARSA をご利用ください。
  • DRA データの検索は getentry ではおこなうことができません。DRA Search をご利用ください。

入力フォームによる検索

http://getentry.ddbj.nig.ac.jp/top-j.html からご利用下さい。

デフォルト指定

ID Accession 番号
データべ-ス DNA データベース:DDBJ/EMBL/GenBank
出力形式 フラットファイル(DDBJ)
取得方法 html
上限 10

ID

Accession 番号 を入力します。入力には、複数 Accession 番号の指定、範囲指定、バージョン番号の指定が可能です。

バージョン番号
  • 指定がない場合は,最新バージョンを検索します。
  • 指定されている場合は,指定のバージョンを検索します。
AB669632.1
AB669632.2
複数 Accession 番号
  • ","区切りで複数の Accession 番号を指定できます。
  • ","区切りで複数指定された場合,指定の順で出力されます。
  • 二つの Accession 番号"-"で連結することにより範囲検索ができます。
  • バージョン番号の指定もできます。
AB669632.1,AB669632.2,AB669633.1,AB669633.2
AK377101 - AK377200,AK377210,AK377211
範囲指定
  • 範囲指定の両端の Accession 番号は前方のみの不完全でも構いません。
  • 範囲指定も "," 区切りで複数指定できます。
  • バージョン番号を指定しても無視されます。
FY782000-FY7830
AK377101 - AK377200,AK377211- AK388100

データベースと出力形式

検索対象となるデータベースをひとつ指定します。 検索結果の出力形式は,エントリに対して,各データベースで定められている形式か FASTA 形式 のいずれかを以下の選択肢からひとつ指定します。

DNAデータベース

検索対象データベース

DDBJ/EMBL/GenBank 国際塩基配列データベース(INSD)
MGA Mass sequence for Genome Annotation(MGA)

*DDBJ/EMBL/GenBank を選択すると、以下が検索対象となります。

*DDBJ リリース には、 TPA、 アルファベット4文字+8桁の数字で構成されるアクセッション番号を持つデータ(WGS,TSA の一部) は含まれておりません。
*MGA データの新規登録は受け付けておりません。
getentry で検索可能な各データベースのリリース番号や公開日等の最新の状況については、現在公開されているリリースの情報 でご確認ください。
 

出力形式

フラットファイル(DDBJ) DDBJ のデータ公開形式で出力
全塩基配列FASTA 塩基配列の全長をFASTA 形式で出力
CDS アミノ酸配列FASTA 各CDS 領域のアミノ酸翻訳配列をFASTA 形式で出力
CDS 塩基配列FASTA 各CDS 領域の塩基配列をFASTA 形式で出力
INSD-XML_v1.4 INSD-XML_v1.4 形式で出力

*上記の5つ(FF, 全FASTA, CDSアミノ酸FASTA, CDS塩基FASTA, INSD-XML_v1.4) はDDBJ/EMBL/GenBank 指定時にのみ選択可能です。
*検索対象データベースでMGA選択時は、FFのみ選択可能となります。

Protein データベース

検索対象データベース

  
    

UniProt UniProt/Swiss-Prot とUniProt/TrEMBL を合わせたアミノ酸配列データベース
PDB タンパク質の立体構造データベース
DAD DDBJ からアミノ酸翻訳配列データを抽出して作成したデータベース
Patent JPOKIPO に由来するアミノ酸配列

getentry で検索可能な各データベースのリリース番号や公開日等の最新の状況については、現在公開されているリリースの情報 でご確認ください。

出力形式

   
default 指定したデータベースの公開形式で出力  
FASTA アミノ酸配列FASTA アミノ酸配列をFASTA 形式 で出力 UniProt, DAD, Patent で選択可能
塩基配列FASTA (for DAD) アミノ酸配列をコードする塩基配列をFASTA 形式 で出力 DAD のみ選択可能
seqres PDB アミノ酸 FASTA PDB のみ選択可能

選択データベースにより、出力形式は異なります。

取得方法

デフォルト html
html HTMLファイル(ACCESSION, ORGANISM等 にリンクあり)
text テキストファイル
gz gz圧縮ファイル

gz圧縮ファイルのファイル名はformatの指定値によって以下のようになります。

[DNA系]flatfile
[DNA系]xml
[DNA系]fasta
[DNA系]trans
[DNA系]cds
[Protein系]flatfile
[Protein系]fasta
[Protein系]cds
flatfile.txt.gz
insd.xml.gz
fasta_na.txt.gz
cds_aa.txt.gz
cds_na.txt.gz
flatfile.txt.gz
fasta_aa.txt.gz
cds_aa.txt.gz

上限(最大表示件数)

デフォルト 10件
任意の件数を指定 指定した件数
0 を指定 上限なし

  

WebAPI プログラムによる検索

getentry は webAPI として実装しており,入力フォームからだけでなく,プログラムなどから直接呼び出すことも可能です。

プログラム

getentry の web API は以下の2つのプログラムからなります。

getentry アクセッション番号(データベース中のエントリの ID)を与えると,データを返します。
gethistory アクセッション番号(データベース中のエントリの ID)を与えると,データの変更履歴を返します。
特許庁由来アミノ酸配列の更新履歴は今のところとっておりません。

  

パラメータの指定方法

以下の2種類があります。

通常の GET method http://getentry.ddbj.nig.ac.jp/getentry?database=データベース名&accession_number=アクセッション番号&追加のパラメーター(任意)
smart URL http://getentry.ddbj.nig.ac.jp/getentry/データベース名/アクセッション番号
http://getentry.ddbj.nig.ac.jp/getentry/データベース名/アクセッション番号/?追加のパラメーター(任意)
http://getentry.ddbj.nig.ac.jp/getentry/データベース名/アクセッション番号/リビジョン ID /?追加のパラメーター(任意)

入力例

  

getentry で指定可能なパラメータ

  • accession 番号(必須): 検索対象の Accession 番号を指定します。
  • database(任意): 検索対象のデータベースを指定します。
  • revision(任意): 指定された revision 時点を検索します。
  • format(任意): 結果の出力フォーマットを指定します。
  • filetype(任意): 出力のファイルタイプを指定します。
  • show_suppressed(任意): suppressed または replaced のデータを表示します。
  • limit(任意): データの取得上限を設定します。
  • trace(任意): Secondary Accession が指定された場合に,Primary への転送を設定します。



accession 番号(必須): 検索対象の Accession 番号を指定します。

バージョン番号
  • 指定がない場合は,最新バージョンを検索します。
  • 指定されている場合は,指定のバージョンを検索します。
複数 Accession 番号
  • ","区切りで複数の Accession 番号を指定できます。
  • ","区切りで複数指定された場合,指定の順で出力されます。
  • 二つの Accession 番号"-"で連結することにより範囲検索ができます。
  • バージョン番号の指定もできます。
範囲指定
  • 範囲指定の両端の Accession 番号は前方のみの不完全でも構いません。
  • 範囲指定も "," 区切りで複数指定できます。
  • バージョン番号を指定しても無視されます。
対象の Accession 番号が存在しない,または表示できない場合,該当の Accession 番号に対する結果は何も表示されず,limit で上限が制限されているときの数にもカウントされません。
デフォルトでの表示件数が10件に設定されているため,それ以上の件数を指定する場合には "limit" で設定を変更して下さい。

入力例

件数が多い場合,表示に時間がかかる場合があります。また,ブラウザの性能により,全件表示できない場合があります。
 



database(任意): 検索対象のデータベースを指定します。

DNA系 na DDBJ/EMBL/GenBank 国際塩基配列データベース(INSD), WGS, TPA, TSA
mga MGA Mass sequence for Genome Annotation(MGA)
Protein系 aa DAD, Patent, UniProt, PDB 4つのデータベースをこの順番で検索
uniprot UniProt UniProt/Swiss-Prot とUniProt/TrEMBL を合わせたアミノ酸配列データベース
pdb PDB タンパク質の立体構造データベース
dad DAD DDBJ からアミノ酸翻訳配列データを抽出して作成したデータベース
patent_aa Patent JPOKIPO に由来するアミノ酸配列

*データベース指定を省略すると、naを指定したものとみなして処理します。
*DDBJ/EMBL/GenBank を選択すると、以下が検索対象となります。

*DDBJ リリース には、 TPA、 アルファベット4文字+8桁の数字で構成されるアクセッション番号を持つデータ(WGS,TSA の一部) は含まれておりません。
*MGA データの新規登録は受け付けておりません。
getentry で検索可能な各データベースのリリース番号や公開日等の最新の状況については、現在公開されているリリースの情報 でご確認ください。

入力例(上段はGET method , 下段は smart URL )



revision(任意): 指定された revision 時点を検索します。

通常 yyyy-MM-dd hh:mm:ss
リリース時 yyyy-MM-dd hh:mm:ss release

バージョン番号と revision が同時に指定されているとき,revision が優先されます。

入力例(上段はGET method , 下段は smart URL )



format(任意): 結果の出力フォーマットを指定します。

デフォルト flatfile
flatfile DDBJ フラットファイル形式
xml INSDSeq-XML version 1.4 形式
fasta [DNA 系] 全塩基配列 FASTA
[Protein 系] アミノ酸配列 FASTA
trans [DNA 系] CDS アミノ酸 FASTA
cds [DNA 系] CDS 塩基配列 FASTA
[DAD 限定] 塩基配列 FASTA (for DAD)
seqres [Protein 系] PDB アミノ酸 FASTA


選択したデータベースでの有効な出力フォーマットの指定は以下の通りです。

DNAデータベース
DDBJ / EMBL / GenBank
MGA
フラットファイル(DDBJ),
全塩基配列FASTA,
CDS アミノ酸配列FASTA,
CDS 塩基配列FASTA,
INSD-XML_v1.4
Proteinデータベース
UniProt default, アミノ酸配列FASTA
PDB default, seqres
DAD default, アミノ酸配列FASTA, 塩基配列FASTA
Patent default, アミノ酸配列FASTA

入力例(上段はGET method , 下段は smart URL )

  • アクセッション番号 AB628096 の検索のflatfile を表示
    http://getentry.ddbj.nig.ac.jp/getentry?accession_number=AB628096
    http://getentry.ddbj.nig.ac.jp/getentry/na/AB628096

    LOCUS       AB628096                 390 bp    RNA     linear   VRL 24-FEB-2012
    DEFINITION  Human rhinovirus C gene for polyprotein, partial cds, strain:
                HRV/Yamaguchi/2010/89.
    ACCESSION   AB628096
    VERSION     AB628096.1
    KEYWORDS    .
    SOURCE      Human rhinovirus C
      ORGANISM  Human rhinovirus C
                Viruses; ssRNA positive-strand viruses, no DNA stage;
                Picornavirales; Picornaviridae; Enterovirus.
    REFERENCE   1  (bases 1 to 390)
      AUTHORS   Kobayashi,M., Arakawa,M., Okamoto,R., Tsukagoshi,H., Ryo,A.,
                Mizuta,K., Hasegawa,S., Hirano,R., Wakiguchi,H., Kudo,K.,
                Tanaka,R., Morita,Y., Noda,M., Kozawa,K., Ichiyama,T., Shirabe,K.
                and Kimura,H.
      TITLE     Direct Submission
      JOURNAL   Submitted (06-MAY-2011) to the DDBJ/EMBL/GenBank databases.
                Contact:Miho Kobayashi
                Gunma Prefectural Institute of Public Health and Environmental
                Sciences; Kamiokimachi 378, Maebashi, Gunma 371-0052, Japan
    REFERENCE   2  
      AUTHORS   Arakawa,M., Okamoto-Nakagawa,R., Toda,S., Tsukagoshi,H.,
                Kobayashi,M., Ryo,A., Mizuta,K., Hasegawa,S., Hirano,R.,
                Wakiguchi,H., Kudo,K., Tanaka,R., Morita,Y., Noda,M., Kozawa,K.,
                Ichiyama,T., Shirabe,K. and Kimura,H.
      TITLE     Molecular epidemiological study of human rhinovirus species A, B
                and C from patients with acute respiratory illnesses in Japan
      JOURNAL   J. Med. Microbiol. 61, 410-419 (2012)
      REMARK    DOI:10.1099/jmm.0.035006-0
    COMMENT     
    FEATURES             Location/Qualifiers
         source          1..390
                         /collection_date="14-Jan-2010"
                         /country="Japan:Yamaguchi"
                         /db_xref="taxon:463676"
                         /host="Homo sapiens"
                         /isolation_source="Nasopharyngeal swab"
                         /mol_type="genomic RNA"
                         /organism="Human rhinovirus C"
                         /strain="HRV/Yamaguchi/2010/89"
         CDS             1..>390
                         /codon_start=1
                         /product="polyprotein"
                         /protein_id="BAK22546.1"
                         /transl_table=1
                         /translation="MGAQVSKQNVGSHENSVSATGGSVIKYFNINYYKDSASSGLTKQ
                         DFSQDPSKFTQPLAEALTNPALMSPTVEACGMSDRLKQITIGNSTITTQDTLNSILAY
                         GEWPKYLSDLDASSVDKPTHPETSSDRF"
    BASE COUNT          124 a           95 c           77 g           94 t
    ORIGIN      
            1 atgggcgcac aggtgagcaa gcaaaatgtc ggctcgcacg aaaattcagt ctcagccacg
           61 ggtggatccg tgattaagta tttcaacatc aattactaca aggattctgc tagctctggc
          121 ttgactaaac aagatttttc ccaagaccca tcgaaattca cacaacctct agcagaagca
          181 cttacaaatc cagctttaat gtcaccaact gttgaagcat gtgggatgtc cgataggctt
          241 aaacaaatta ctatcgggaa ttccactata acaacacaag atacactaaa ctctatactg
          301 gcatatgggg agtggcccaa atacttgagt gacctggacg cttcctcagt ggataagcct
          361 acccacccag agacatcatc tgatagattt
    //
     
  • 特許庁由来アミノ酸配列の検索結果を アミノ酸配列FASTA 形式 で表示
    http://getentry.ddbj.nig.ac.jp/getentry?database=patent_aa&accession_number=BD500001&format=fasta
    http://getentry.ddbj.nig.ac.jp/getentry/patent_aa/BD500001?format=fasta

    >BD500001|JP 2000316586-A/3: Recombinant microorganism expressing small rubber particle-bound protein  (SRPP).
    MAEEVEEERLKYLDFVRAAGVYAVDSFSTLYLYAKDISGPLKPGVDTIENVVKTVVTPVY YIPLEAVKFVDKTVDVSVTSLDGVVPPVIKQVSAQTYSVAQDAPRIVLDVASSVFNTGVQ EGAKALYANLEPKAEQYAVITWRALNKLPLVPQVANVVVPTAVYFSEKYNDVVRGTTEQG YRVSSYLPLLPTEKITKVFGDEAS  
  • アクセッション番号 AB601234 を塩基配列 FASTA 形式で表示
    http://getentry.ddbj.nig.ac.jp/getentry?accession_number=AB601234&format=fasta
    http://getentry.ddbj.nig.ac.jp/getentry/na/AB601234?format=fasta

     
    >AB601234|AB601234.1 Ainsliaea faurieana chs gene for chalcone synthase, partial cds, haplotype: 2.
    ggaccttgctaaaaacaataagggctcacatgtccttgttgtctgctctgagatcattgc ttccatttttcgtagaccagataagaaccacattgtcagccaagctctctttggggatgg agcttctgcgctcattgtgggttcagacccagacttctccaaggaacatccattattcaa gattgtgtctacaactcagacaatcttacagaacactgaaagggcgatgaacttacaatt gagggaagaagggttgaccattcacctgcacagggatgtaccccagatgacatcaaagaa tatagaggaggcattagtgcacatatttttgccactgggcataagagactggaactcg  
  • アクセッション番号 AB601234 を塩基配列 xml 形式で表示
    http://getentry.ddbj.nig.ac.jp/getentry?database=na&accession_number=AB601234&format=xml
    http://getentry.ddbj.nig.ac.jp/getentry/na/AB601234/?format=xml

    <?xml version="1.0"?>
    
    <!DOCTYPE INSDSet SYSTEM "INSD_INSDSeq.dtd">
    -<INSDSet>
     -<INSDSeq> <INSDSeq_locus>AB601234</INSDSeq_locus>
      <INSDSeq_length>358</INSDSeq_length>
       <INSDSeq_moltype>DNA</INSDSeq_moltype>
        <INSDSeq_topology>linear</INSDSeq_topology>
         <INSDSeq_division>PLN</INSDSeq_division>
          <INSDSeq_update-date>18-MAY-2011</INSDSeq_update-date>
           <INSDSeq_definition>Ainsliaea faurieana chs gene for chalcone ......
             <INSDSeq_primary-accession>AB601234</INSDSeq_primary-accession>
             <INSDSeq_accession-version>AB601234.1</INSDSeq_accession-version>
              <INSDSeq_source>Ainsliaea faurieana</INSDSeq_source>
               <INSDSeq_organism>Ainsliaea faurieana</INSDSeq_organism>
                <INSDSeq_taxonomy>Eukaryota; Viridiplantae; Streptophyta; .......
                 -<INSDSeq_references>
                  -<INSDReference>
                  <INSDReference_reference>1</INSDReference_reference>
                   <INSDReference_position>1..358</INSDReference_position>
                    -<INSDReference_authors> <INSDAuthor>Mitsui,Y.</INSDAuthor>
                     <INSDAuthor>Setoguchi,H.</INSDAuthor> </INSDReference_authors>
                      <INSDReference_title>Direct Submission</INSDReference_title>
                       <INSDReference_journal>Submitted (17-NOV-2010) to the DDBJ/.....
                        -<INSDReference>
    
                                       -------   以下略    -----
    
  • アクセッション番号 HE963104 をCDS塩基配列FASTA形式で表示
    http://getentry.ddbj.nig.ac.jp/getentry?database=na&accession_number= HE963104&format=cds
    http://getentry.ddbj.nig.ac.jp/getentry/na/HE963104/?format=cds

     >HE963104-1|CCJ27876.1|111|<1..111|Streptococcus thermophilus|predicted.....
    gggttgtcctgtgatgagggaatgctggcagtaggaggacttggtgctgtaggtggcccg
    tggggagctgtcggtggggtgttagtaggtgcagccttatactgtttctaa
    
    >HE963104-2|CCJ27877.1|201|130..330|Streptococcus thermophilus|hypothetical.....
    atgaataataaacaacttgaaagatttaaaaaactggatacaaatgcattgtctaatgta
    agtggtcaaggctatggtgctcaatgtgttattggtactgccggaatgacgattgtcggt
    gcagctttctttggcatcgcaggtgcaggagctggatttgcaggcggtagcacagcattt
    tgttatggtacagctgaataa
    
    >HE963104-3|CCJ27878.1|219|686..>904|Streptococcus thermophilus|.....
    atggcaactcaaacaattgaaaactttaacacccttaacctcgaaacacttgctagtgtt
    gaaggaggtggatgtggttggagaggcgcaggtggagcgactgttcaaggagctatcggg
    ggagcgtttggaggtaatgtagttttaccagttgtaggctcagttcctggttatctagct
    ggtggtgttctaggtggtgcaggtggtactgttgcctat
     
  • アクセッション番号 JQ677812 をCDSアミノ酸FASTA 形式で表示
    http://getentry.ddbj.nig.ac.jp/getentry?database=na&accession_number=JQ677812&format=trans
    http://getentry.ddbj.nig.ac.jp/getentry/na/JQ677812/?format=trans

    >JQ677812-1|AFN26948.1|74|Triticum aestivum (bread wheat) HKT1;5
    HLAGYSLMLVYLSVVSGARAVLTGKRISLHTFSVFTVVSTFANCGFVPNNEAMIAFRSFP
    GLLLLVMPHVLLGI
    
  • DAD (AB000714-1) 塩基配列 FASTA形式で表示
    http://getentry.ddbj.nig.ac.jp/getentry?database=dad&accession_number=AB000714-1&format=cds
    http://getentry.ddbj.nig.ac.jp/getentry/dad/AB000714-1/?format=cds

     
    >AB000714-1|BAA22986.1|663|199..861|Homo sapiens|RVP1
    atgtccatgggcctggagatcacgggcaccgcgctggccgtgctgggctggctgggcacc
    atcgtgtgctgcgcgttgcccatgtggcgcgtgtcggccttcatcggcagcaacatcatc
    acgtcgcagaacatctgggagggcctgtggatgaactgcgtggtgcagagcaccggccag
    atgcagtgcaaggtgtacgactcgctgctggcactgccacaggaccttcaggcggcccgc
    gccctcatcgtggtggccatcctgctggccgccttcgggctgctagtggcgctggtgggc
    gcccagtgcaccaactgcgtgcaggacgacacggccaaggccaagatcaccatcgtggca
    ggcgtgctgttccttctcgccgccctgctcaccctcgtgccggtgtcctggtcggccaac
    accattatccgggacttctacaaccccgtggtgcccgaggcgcagaagcgcgagatgggc
    gcgggcctgtacgtgggctgggcggccgcggcgctgcagctgctggggggcgcgctgctc
    tgctgctcgtgtcccccacgcgagaagaagtacacggccaccaaggtcgtctactccgcg
    ccgcgctccaccggcccgggagccagcctgggcacaggctacgaccgcaaggactacgtc
    taa
    
  • PDBの検索結果を PDBアミノ酸FASTA 形式 で表示
    http://getentry.ddbj.nig.ac.jp/getentry?database=pdb&accession_number=0-Z&format=seqres&limit=5
    http://getentry.ddbj.nig.ac.jp/getentry/pdb/0-Z/?format=seqres&limit=5

     >100d_A mol:na length:10  DNA/RNA (5'-R(*CP*)-D(*CP*GP*GP*CP*GP*CP*CP*G
    CCGGCGCCGG
    >100d_B mol:na length:10  DNA/RNA (5'-R(*CP*)-D(*CP*GP*GP*CP*GP*CP*CP*G
    CCGGCGCCGG
    >101d_A mol:na length:12  DNA (5'-D(*CP*GP*CP*GP*AP*AP*TP*TP*(CBR)P*GP*
    CGCGAATTCGCG
    >101d_B mol:na length:12  DNA (5'-D(*CP*GP*CP*GP*AP*AP*TP*TP*(CBR)P*GP*
    CGCGAATTCGCG
    >101m_A mol:protein length:154  MYOGLOBIN
    
    ----(以下略)----



filetype(任意): 出力のファイルタイプを指定します。

デフォルト text
html HTMLファイル(ACCESSION, ORGANISM等 にリンクあり)
text テキストファイル
gz gz圧縮ファイル

gz圧縮ファイルのファイル名はformatの指定値によって以下のようになります。

[DNA系]flatfile
[DNA系]xml
[DNA系]fasta
[DNA系]trans
[DNA系]cds
[Protein系]flatfile
[Protein系]fasta
[Protein系]cds
flatfile.txt.gz
insd.xml.gz
fasta_na.txt.gz
cds_aa.txt.gz
cds_na.txt.gz
flatfile.txt.gz
fasta_aa.txt.gz
cds_aa.txt.gz

入力例(上段はGET method , 下段は smart URL )



show_suppressed (任意): suppressed データを表示します。

true suppressed データを表示
false suppressed データを表示しない

入力例(上段はGET method , 下段は smart URL )



limit(任意): データの取得上限を設定します。

デフォルト 10件
任意の件数を指定 指定した件数
0を指定 無制限

入力例(上段はGET method , 下段は smart URL )



trace(任意): Secondary Accession が指定された場合に,Primary への転送を設定します。

true primary データを表示
false primary データを表示しない

入力例(上段はGET method , 下段は smart URL )


  

gethistory で指定可能なパラメータ

  • accession 番号(必須):検索対象のAccession番号を指定します。
  • database(任意): 検索対象のデータベースを指定します。
  • filetype(任意): 出力のファイルタイプを指定します。



accession 番号(必須):検索対象のAccession番号を指定します。
指定方法は getentry と同じです。

入力例(上段はGET method , 下段は smart URL )



database(任意):検索対象のデータベースを指定します。

デフォルト na
DNA 系 na

指定したデータベースが履歴管理に対応していない場合は,空の結果を返します。

入力例(上段はGET method , 下段は smart URL )


filetype(任意): 出力のファイルタイプを指定します。

デフォルト text
html HTMLファイル(revision 時点のフラットファイルにリンク)
text テキストファイル

入力例(上段はGET method , 下段は smart URL )

ページの先頭へ戻る