• getentryでENAとGenBankから特定期間に公開されたエントリーを反映できていない
  • 5月29日 DDBJ アカウント (9-10時) と JGA/AGD (9-14時) システム停止

DDBJ Annotated/Assembled Sequences

  • Home
  • Submission
    • 塩基配列の登録
    • Web 版塩基配列登録システム
    • Mass Submission System
    • 登録データの修正・更新
  • Search
    • getentry
    • ARSA
  • Flat file
    • Feature Table
    • Feature key の定義
    • Qualifier key の定義
    • 塩基配列について
    • Organism qualifier に記載する生物名
    • 識別子について
    • Location の記述法
    • タンパク質コード配列
    • The Genetic Codes
    • 配列の記載に用いる略号
    • 配列データ記載例
  • Data categories
    • Genome project のデータ登録
    • Pseudohaplotype
    • WGS
    • Finished level genomic sequences
    • メタゲノムアセンブリ
    • Single amplified genome
    • HTG
    • Environmental sample
    • ENV
    • TLS
    • Transcriptome Project のデータ登録
    • TSA
    • EST
    • HTC
    • Third Party Data (TPA)
  • FAQ
  • Other
    • Patent
    • MGA
  • ホーム
  • ddbj
  • Qualifier key の定義

Qualifier key の定義

DDBJ への新規登録で使用を推奨する qualifier key を以下に挙げています。 より詳しい INSDC qualifier key に関する情報は、Feature Table Definition の 7.3.1 Qualifier List をご参照ください。

Feature/Qualifier 対応

Feature/Qualifier 対応一覧表には、 DDBJ へ登録を推奨する feature と qualifier の組み合わせを示しています。

INSDC において記載可能な feature と qualifier の組み合わせに関しましては、Feature Table Definition の 7.2 Appendix II: Feature keys reference をご参照ください。

Qualifier key の定義

/alleleFeature Table Definition

定義
allele の名称
書式
<text> (全角, ダブルクォーテーション( “ ) 不可)
例
adh1-1

/altitudeFeature Table Definition

定義
サンプルを採取した場所の地理的な高度
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
-256 m
330.12 m 
備考
海表面を基準とした上下の高度をメートルを単位とした数値で示します。

/anticodonFeature Table Definition

定義
tRNAのアンチコドンの位置とコードするアミノ酸
入力書式
(pos:<location>,aa:<amino_acid>)
<location> は anticodon の位置に相当する塩基番号を入力します。
<amino_acid> は Amino Acid Codes, Modified and Unusual Amino Acidsのリストにある省略形を使用します。
入力例
(pos:34..36,aa:Phe)
(pos:join(5,495..496),aa:Leu)
(pos:complement(4156..4158),aa:Gln)
出力例
(pos:34..36,aa:Phe,seq:aaa)
(pos:join(5,495..496),aa:Leu,seq:tag)
(pos:complement(4156..4158),aa:Gln,seq:ttg)

/artificial_locationFeature Table Definition

定義
CDS または mRNA の location が frameshift または途中に出現する終止コドンを調整するために生物学的なプロセシングではない理由で補正されていることを示すフラグ
書式
“heterogeneous population sequenced” または “low-quality sequence region”
備考
ゲノム, transcriptome など大規模な登録において, 雑多な集団の配列決定, または, 配列の決定精度が低い場合にのみ, 使用可能です。

/bio_materialFeature Table Definition

定義
配列が得られた生物材料(生きている個体・系統)の保管施設と識別子
識別子について 参照
書式
[<institution_code>:[<collection_code>:]]<material_id>
例
Caenorhabditis stock centre の例
CGC:CB3912
備考
<material_id> は必須です。
保管施設としては, 動物園, 水族館, stock centre, seed bank, germplasm repository, DNA bank などが含まれます。
<institution_code> は下記を参照してください。
institution_code list (NCBI FTP site)

/bound_moietyFeature Table Definition

定義
当該 feature で示される領域に結合すると推定される分子、複合体の名称
書式
<text> (全角, ダブルクォーテーション( “ ) 不可)
例
GAL4 

/cell_lineFeature Table Definition

定義
配列の得られた cell line の名称
書式
<text> (全角, ダブルクォーテーション( “ ) 不可)
例
MCF7

/cell_typeFeature Table Definition

定義
配列の得られた細胞のタイプ
書式
<text> (全角, ダブルクォーテーション( “ ) 不可)
例
leukocyte 

/chromosomeFeature Table Definition

定義
配列の得られた染色体番号, あるいは, 染色体名
書式
<text> (全角, ダブルクォーテーション( “ ) 不可)
例
1 

/circular_RNAFeature Table Definition

定義
その feature が circular RNA 形成を経て backsplicing によって生じた RNA 転写産物であることを示します。
書式
値なし
備考
backsplicing によって産物を生じた場合に CDS, mRNA, tRNA で記載します。
その location は join により、通常と異なる順番でつながっていることが示されていなければなりません。

/cloneFeature Table Definition

定義
配列の得られた clone の名称
識別子について 参照
書式
<text> (全角, ダブルクォーテーション( “ ) 不可)
例
lambda-hIL7.3 

/codon_startFeature Table Definition

定義
タンパク質のコード領域がスタートコドンで始まらない場合に読み枠の開始位置を 1, 2, 3 の中から選択します。
書式
1 or 2 or 3 (全角不可)

/collected_byFeature Table Definition

定義
標本個体を採集した人物、または、団体の名称。 フルネーム記載を推奨。
書式
<text> (全角, ダブルクォーテーション( “ ) 不可)
例
Dan Janzen

/collection_dateFeature Table Definition

定義
標本を採取した日付
日時の幅を示す場合は、2つの値を slash “/” で区切って記載してください。
採取した時刻を記載する場合、日付の後に “T” を付加し、続けて、時間と分を記載してください。
時刻は協定世界時 (UTC) ・グリニジ平均時 “Zulu Time” (Z) で記載してください。
何らかの理由で記載が困難な場合、missing value で示します。
書式

YYYY-MM-DDThh:mm:ssZ
YYYY-MM-DDThh:mmZ
YYYY-MM-DDThhZ
YYYY-MM-DD
YYYY-MM
YYYY

YYYY/YYYY
YYYY-MM-DD/YYYY-MM-DD
YYYY-MM/YYYY-MM
YYYY-MM-DDThh:mmZ/YYYY-MM-DDThh:mmZ

‘YYYY’: 年号を表す4桁の数字
‘MM’: 月を表す2桁の数字 (01 ~ 12)
‘DD’: 日を表す2桁の数字 (01 ~ 31)
‘hh’: 時を表す2桁の数字 (00 ~ 23)
‘mm’: 分を表す2桁の数字 (00 ~ 59)
‘ss’: 秒を表す2桁の数字 (00 ~ 59)

例
2015-10-11T17:53:03Z
1952-10-21T11:43Z
1952-10-21T11Z
1952-10-21
1952-10
1952
1952/1953
1952-10-21/1953-02-15
1952-10/1953-02
1952-10-21T11:43Z/1952-10-21T17:43Z
missing: control sample
備考
日付まで特定した記載 (YYYY-MM-DD) を強く推奨します。
INSDC では ‘Mmm’ (月の略記) を含む “21-Oct-1952” のような旧書式のデータが維持されており、その登録受付も可能としていますが、DDBJ では、旧書式でのデータ登録を受け付けておりません。

/countryFeature Table Definition

2024 年 6 月より /country qualifier を /geo_loc_name qualifier に名称変更しました。

/cultivarFeature Table Definition

定義
配列の得られた植物の栽培品種名
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
Nipponbare 

/culture_collectionFeature Table Definition

定義
配列の得られた培養細胞の保管施設と ID
識別子について 参照
書式
<institution-code>:[<collection-code>:]<culture_id>
例
ATCC:26370 
備考
<institution-code> と <culture_id> が必須です。
生きている微生物やウイルスの培養系、および、細胞株を記載する際に用います。
<institution_code> は下記を参照してください。
institution_code list (NCBI FTP site)

/db_xrefFeature Table Definition

定義
他のデータベース内の関連情報を示す
書式
<データベース名>:<ID> (全角, ダブルクォーテーション ( “ ) 不可)
例
UniProtKB/Swiss-Prot:P28763
備考
原則として、新規登録データには記載できません。
アノテーションの根拠として参照した場合は db_xref ではなく、/inference を用いて記載してください。
データベース名にはデータベースリストの何れかを記載します。

/dev_stageFeature Table Definition

定義
配列が得られた生物の発生段階
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
fourth instar larva

/directionFeature Table Definition

定義
DNA の複製開始方向
書式
left, right, both の中から選択します (全角不可)

/EC_numberFeature Table Definition

定義
タンパク質産物としての酵素コミッション番号
書式
<identifier>.<identifier>.<identifier>.<identifier>
例
1.1.2.4
1.1.2.-
1.1.2.n
備考
”-“ は番号が不明な場合, “n” は番号が未割当の場合に用います。

/ecotypeFeature Table Definition

定義
遺伝学的に生育環境への適応を反映した表現型特性を示す種内集団
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
Columbia 

/environmental_sampleFeature Table Definition

定義
PCR, DGGE, あるいは、その他の方法で直接, 分子を単離したため、生物種が同定できない大量の環境DNAサンプルに由来した配列であることを示します。
詳細は Environmental sequence の登録を ご参照ください。
書式
値なし
備考
/environmental_sample 使用時には /isolation_source qualifier も必要です。
/strain qualifier と同時には使用できません。

/estimated_lengthFeature Table Definition

定義
配列内のギャップの推定長
入力書式
unknown or known
入力例
unknown
known
出力書式
unknown or <整数>
出力例
unknown
342

/exceptionFeature Table Definition

定義
アミノ酸翻訳の特殊な例外
書式
以下から選択します

RNA editing
reasons given in citation
rearrangement required for product
annotated by transcript or proteomic data

備考
/exception=”annotated by transcript or proteomic data” を記載する場合、その証拠になる転写産物、あるいは、タンパク質の存在を示すために /inference qualifier を記述する必要があります。

/experimentFeature Table Definition

定義
feature 記載の根拠となる生物学的な実験の簡単な記述
書式
[CATEGORY:]<text> (全角, ダブルクォーテーション ( “ ) 不可)
CATEGORY は省略可能です。記載する場合は下記のリストから選択します。

COORDINATES
DESCRIPTION
EXISTENCE

例
COORDINATES: 5' and 3' RACE    
Northern blot    
heterologous expression system of Xenopus laevis oocytes
備考
実験の詳細までは含めないでください。
2005年の12月に /evidence=EXPERIMENTAL を experiment に置き換える際,
/experiment="experimental evidence, no additional details recorded"

が使われました。

/focusFeature Table Definition

定義
配列が複数の生物種に由来する場合に, 最も注目すべき source feature であることを示します。
書式
値なし

/frequencyFeature Table Definition

定義
当該 feature が存在する頻度
書式
<観測した事例の数> in <調査した個体の総数>,
<観測した事例の数>/<調査した個体の総数>,
or <小数>
例
1 in 12
23/108
.85

/functionFeature Table Definition

定義
そのfeatureで示される配列に起因する機能
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
essential for recognition of cofactor

/gap_typeFeature Table Definition

定義
genome assembly の一部において、構成要素間の連結部に位置する gap の種別
書式
以下から選択します。

between scaffolds
within scaffold
telomere
centromere
short arm
heterochromatin
repeat within scaffold
repeat between scaffolds
contamination
unknown

備考
AGP Specificationに従い、assembly_gap feature でのみ、使用します

/geneFeature Table Definition

定義
配列に対応する遺伝子シンボル
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
ilvE
入力時の注意点
CDSに関してましては 遺伝子命名に関する考え方もご参照ください。
  • 一般に通用する複数の略号がある場合でも複数の略号を記載しないで下さい
  • また, そのために不必要に区切り記号を使用しないで下さい。
  • 略号の複数記載を希望される場合は, 代表的な略号を /gene qualifier に記載し, その他の略号を /gene_synonym qualifier に記載してください。

/gene_synonymFeature Table Definition

定義
配列に対応する遺伝子シンボル, gene, または, locus_tag で使用した記載とは別な呼称
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
ilvE

/geo_loc_nameFeature Table Definition

定義
疫学的、あるいは、個体群研究において配列サンプルを得た地域を 政治上の国、大洋、または、海の名称で示し、続けて地方・地域を示します。
何らかの理由で記載が困難な場合、missing value で示します。
1つの qualifier 内で複数の地点を記載することは禁止しています。
同一配列が観測された場合でも、原則、地点別に複数の登録に分けてください。
書式
<国名>[:<詳細な地名>] (全角, ダブルクォーテーション ( “ ) 不可)
例
Japan:Kanagawa, Hakone, Lake Ashi
missing: lab stock
備考
国名は国名リストから選択します。
2024 年 6 月より /country qualifier を /geo_loc_name qualifier に名称変更しました。

/germlineFeature Table Definition

定義
配列が適応的免疫反応の要素である体細胞ゲノム再編成を受けていないことを示します。親の germline から受け継がれ,再編成を受けていない配列であることを示します。
書式
値なし
備考
/rearrangedと同時に記載することはできません。

/haplogroupFeature Table Definition

定義
配列多型を共有する類似な haplotype グループの名称。haplogroup は, しばしば, 個体群移動の追跡に利用されます。
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
H*

/haplotypeFeature Table Definition

定義
同じ染色体上で連鎖する対立遺伝子の組み合わせの名称。
組み換えがない場合それぞれのハプロタイプはひとつの単位として遺伝するので、集団の中での遺伝子流動を追うために使われます。
識別子について 参照
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
M3 [.42]
Dw3 B5 Cw1 A1

/hostFeature Table Definition

定義
配列決定した分子を得た生物の(実験室ではない)自然界における宿主の学名
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
Homo sapiens
Homo sapiens 12 years old girl

/inferenceFeature Table Definition

定義
根拠となる生物学的な実験ではない推定の構造化された記述
書式
[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]
CATEGORY は省略可能です。記載する場合は下記のリストから選択します。

COORDINATES
DESCRIPTION
EXISTENCE

[TYPE] は下記のリストから選択します。

similar to sequence
similar to AA sequence
similar to DNA sequence
similar to RNA sequence
similar to RNA sequence, mRNA
similar to RNA sequence, EST
similar to RNA sequence, other RNA
profile
nucleotide motif
protein motif
ab initio prediction
alignment

例
similar to DNA sequence:INSD:AY411252.1
similar to RNA sequence, mRNA:RefSeq:NM_000041.2
similar to DNA sequence (same species):INSD:AACN010222672.1
profile:tRNAscan:2.1
protein motif:InterPro:IPR001900
ab initio prediction:Genscan:2.0
alignment:Splign:1.26p:RefSeq:NM_000041.2,INSD:BC003557.1
備考
inference の推奨例
  • [:EVIDENCE_BASIS] は任意ですが, 参照したデータベースエントリ (Accession number と version を含む), あるいはアルゴリズム (version を含む) を記述します。
  • [(same species)] は任意 同種との相同性により得られた推定の場合記述します。

/isolateFeature Table Definition

定義
配列の得られた individual isolate
多くの場合、サンプル個体の識別子
識別子について 参照
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
 SI-152
DGGE: C12

/isolation_sourceFeature Table Definition

定義
配列が得られた生物学的サンプルに関する、物理的、かつまたは、環境的な由来。 /dev_stage, /tissue_type など他の qualifier に記載すべき内容は、各 qualifier に記載してください。
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
rumen isolates from standard pelleted ration-fed steer #6

/lab_hostFeature Table Definition

定義
配列決定した分子を得た生物を増殖させるために実験室で使われた宿主の学名
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
Gallus gallus
Gallus gallus embryo
Escherichia coli strain DH5 alpha
Homo sapiens HeLa cells

/lat_lonFeature Table Definition

定義
配列決定したサンプルが採取された位置の地理的座標。緯度 (latitude) と経度 (longitude)。
書式
d[d.dddddddd] <N or S> d[dd.dddddddd] <W or E>
例
47.94 N 28.12 W
45.0123 S 4.1234 E
45.01234567 S 4.12345678 E
備考
N と S は北緯と南緯、E と W は東経と西経を示します。
小数点以下の数字は分秒ではなく小数で記載してください。
小数点以下第8位まで記載可能です。

/linkage_evidenceFeature Table Definition

定義
assembly_gap で示される連鎖の証拠。assembly_gap feature で gap_type の値が “within scaffold”“repeat within scaffold” あるいは “contamination” の場合のみ使用可能です。gap_type の値が “contamination” の場合、/linkage_evidence の値は “unspecified” にする必要があります。
書式
以下から選択します。

align genus
align xgenus
align trnscpt
clone contig
map
paired-ends
pcr
proximity ligation
strobe
within clone
unspecified

備考
AGP Specificationに従い、assembly_gap feature でのみ、使用します

/locus_tagFeature Table Definition

定義
(主としてゲノムプロジェクト用に)登録者が体系的に一定な識別子を 遺伝子とその関連 feature の検索を目的として割り当てたもの
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
ABC_0022
A1C_00001
備考
同一の値を取る /locus_tag はエントリ内に存在しても構いませんが, それは, 同一の遺伝子に関連することを示すものであり, それ以外の場合は /locus_tag の値は一意性を確保されていなければなりません。
また, /locus_tag の値に用いる prefix は事前登録制とし, INSDC 全体においても, 広く一意性を確保するように努めています。

/macronuclearFeature Table Definition

定義
繊毛虫などで配列が大核 (生殖核でない)に由来することを示します。
書式
値なし

/mapFeature Table Definition

定義
その feature のゲノム上の位置情報
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
8q12-q13

/mating_typeFeature Table Definition

定義
配列の得られた生物の mating type を示します。原核生物, あるいは, 減数分裂による性的に二形性の配偶子を伴わない真核生物で用います (cf. sex)。
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
MAT-1
plus
-
odd
even

/metagenome_sourceFeature Table Definition

定義
Metagenome Assembled Genome (MAG) として得られた配列、すなわち、metagenome から単一 taxon として assemble された場合に、その由来となった metagenome を記載します。
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
human gut metagenome
soil metagenome

taxonomy database に存在する metagenome を含む値でなければなりません。

備考
/metagenome_source を記載する場合は /environmental_sample の記載が必須です。

/mobile_element_typeFeature Table Definition

定義
mobile_element の名称
書式
<mobile_element_type> [:<mobile_element_name>]<mobile_element_type>は以下の規定値から何れか1つを選びます。

transposon
retrotransposon
integron
insertion sequence
non-LTR retrotransposon
SINE
MITE
LINE
other

例
transposon:Tnp9

/mod_baseFeature Table Definition

定義
修飾塩基
書式
Modified Base Abbreviation のリストにある省略形を使用します。
例
m2g

/mol_typeFeature Table Definition

定義
生体内における分子種, 合成された分子種, あるいは予想される分子種
書式
以下から適切なものを選択して記載します。

genomic DNA
genomic RNA
mRNA
tRNA
rRNA
transcribed RNA
other RNA
other DNA
viral cRNA
unassigned DNA
unassigned RNA

備考
primary entry では生体内における分子種、あるいは、合成された分子種を、TPA の場合は予想される分子種を示します。
  • genomic DNA は核の DNA だけではなく, organelle, plasmid の DNA にも用います。
  • rRNA gene (rDNA) は rRNA ではなく genomic DNA を選びます。
  • mRNA を鋳型とした cDNA 配列は EST も含めて mRNA を選びます。
  • premature RNA を鋳型とした cDNA 配列は transcribed RNA を選びます。
  • 人工的に改変・構築した配列の場合は, other DNA, あるいは, other RNA を選びます。
  • 通常の RNA ウイルスでは genomic RNA を選びます。
  • ただし、Negarnaviricota (ssRNA negative-strand virus) では、原則、viral cRNA を選びます。
    viral cRNA はマイナス鎖 RNA ウイルスが子孫のゲノムを産生する際に生じるプラス鎖の鋳型を指します。
    ssRNA negative-strand virus 由来のゲノム配列に関しては、原則、記載を以下に統一しています。
    • アミノ酸翻訳方向と正: viral cRNA
    • アミノ酸翻訳方向と逆: genomic RNA

/ncRNA_classFeature Table Definition

定義
タンパク質をコードしない RNA (ncRNA) の種別
書式
<TYPE>
入力例
miRNA
siRNA
備考
<TYPE> は Controlled vocabulary for ncRNA classes になければなりません。
otherを選択した場合は /product に名称、/note に簡単な説明を記載してください。

/noteFeature Table Definition

定義
自由記述の補足説明
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)

/numberFeature Table Definition

定義
exon, intron の番号
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
5a

/old_locus_tagFeature Table Definition

定義
ゲノムプロジェクトがfeature 検索を目的として割り当てたID
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
RSc0382

/operonFeature Table Definition

定義
その featureが属している operon (1つの転写物に転写される遺伝子群) の名称
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
lac

/organelleFeature Table Definition

定義
配列の得られたオルガネラ
書式
以下のオルガネラタイプから選択します。

mitochondrion
mitochondrion:kinetoplast
hydrogenosome
plastid:chloroplast
plastid:apicoplast
plastid:chromoplast
plastid:cyanelle
plastid:leucoplast
plastid:proplastid
plastid
chromatophore
nucleomorph

/organismFeature Table Definition

定義
配列決定された試料の元となる生物の学名、または、上位分類、あるいは、物質の名称。
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
Homo sapiens
Lactobacillaceae bacterium
West Nile virus
synthetic construct
uncultured bacterium
備考
詳しくは, Organism Qualifier についてを参照して下さい。

/PCR_conditionsFeature Table Definition

定義
PCR の条件
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
Initial denaturation:94degC,1.5min

/PCR_primersFeature Table Definition

定義
配列を増幅するために使用されたPCR プライマー1回のPCR反応で使用したプライマーをすべて含む
書式
[fwd_name: XXX1, ]fwd_seq: xxxxx1,[fwd_name: XXX2, ]fwd_seq: xxxxx2, [rev_name: YYY1, ]rev_seq: yyyyy1, [rev_name: YYY2, ]rev_seq: yyyyy2
例
1)
fwd_name: CO1P1, fwd_seq: ttgattttttggtcayccwgaagt, rev_name: CO1R4, rev_seq: ccwvytardcctarraartgttg

2)

fwd_seq: tgtgtgtgtgactgaca, rev_seq: tagcgatacggtcaatgc

3)

fwd_name: hoge1, fwd_seq: cgkgtgtatcttact, rev_name: hoge2, rev_seq: cggtgtatcttact

4)

fwd_name: CO1P1, fwd_seq:ttgattttttggtcayccwgaagt, fwd_name: CO1P2, fwd_seq: gatacacaggtcayccwgaagt, rev_name: CO1R4, rev_seq: ccwvytardcctarraartgttg
備考
  • fwd_seq と rev_seq は両者ともに必須, fwd_name と rev_name は任意。
  • 配列は常に 5’から3’ の方向。
  • 修飾塩基は <i> のように< >で囲います。
    それ以外の塩基配列は <IUPAC で決められたアルファベットで記載されます。

/plasmidFeature Table Definition

定義
配列の得られた天然のプラスミドの名称 (cloning vector を意味するものではありません)
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
C-589

/productFeature Table Definition

定義
feature に対応した遺伝子産物の名称, 例えば mRNA featureには mRNA の名称, CDS にはタンパク質の名称, mat_peptide には, 成熟タンパク質の名称
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
  • CDS feature の場合
trypsinogen
  • mat_peptide feature の場合
trypsin
  • mRNA feature の場合
XYZ neural-specific transcript
入力時のご注意
CDS に関しましては, 遺伝子命名に関する考え方もご参照ください。
  • 原則, 略号の類ではない一般名を記載して下さい。
  • 生物名を含めないで下さい。
  • 一般名が複数ある場合でも, 複数の名称を記載しないで下さい。
    また, そのために不必要な区切り記号を使用しないで下さい。
    一般名の複数記載を希望される場合は, 代表的な名称を /product qualifier に記載し, その他の名称を /note qualifier に記載して下さい。
  • 機能, 名称等が不明な蛋白質の場合は, hypothetical protein と記載することを推奨します。

/protein_idFeature Table Definition

定義
翻訳される CDS feature に対して国際塩基配列データベース INSDC が発行する識別子です。
登録時には入力できません。
書式
<identifier>.<version>
例
BAA12345.1
AAA1234567.1
備考
IDは3文字のアルファベットと5つの数字で構成されています。
ピリオドの後の数字はその /protein_id の version番号です。
塩基配列更新、あるいは、他の理由で CDS feaure の翻訳アミノ酸配列が変化した場合、 /protein_id は変わりませんが、version 番号が上がります。

/proviralFeature Table Definition

定義
配列が得られたウイルス、または、ファージが別の生物のゲノム内に一体化していることを示します。
書式
値なし

/pseudoFeature Table Definition

定義
記載されている feature が本来の機能を持たないことを示します。
CDS feature に pseudo を指定すると translation が出力されません。
書式
値なし
備考
新規登録では記載しないでください。必要な場合は /pseudogene を記載してください。

/pseudogeneFeature Table Definition

定義
記載されている feature が pseudogene であると登録者が判断したことを示します。
CDS feature に pseudogene を指定すると translation が出力されません。
書式
以下のタイプから選択します。

processed
unprocessed
unitary
allelic
unknown

備考
タイプの詳細 は Controlled vocabulary for /pseudogene qualifier で解説されています。

/rearrangedFeature Table Definition

定義
配列が適応的免疫反応の要素である体細胞ゲノム再編成を受けていることを示します。親の germline から受け継がれた後,再編成を受けた配列であることを示します。
書式
値なし
備考
/germline qualifier と同時に記載することはできません。

/regulatory_classFeature Table Definition

定義
転写、翻訳、複製、または染色体構造に関連する調節において機能する配列領域の分類区分
書式
以下のタイプから選択します

attenuator
CAAT_signal
DNase_I_hypersensitive_site
enhancer
enhancer_blocking_element
GC_signal
imprinting_control_region
insulator
locus_control_region
matrix_attachment_region
minus_35_signal
minus_10_signal
polyA_signal_sequence
promoter
recoding_stimulatory_region
recombination_enhancer
replication_regulatory_region
response_element
ribosome_binding_site
riboswitch
silencer
TATA_box
terminator
transcriptional_cis_regulatory_region
uORF
other

備考
タイプの詳細 は Controlled vocabulary for /regulatory_class で解説されています。

/replaceFeature Table Definition

定義
比較対象の配列上でその feature の位置において置換される塩基
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
a

/ribosomal_slippageFeature Table Definition

定義
翻訳の途中で読み枠が変わるなど ribosomal slippage が起きていることを示す
書式
値なし
備考
CDS の location で “join(486..1784,1784..4810)” などのように ribosomal slippage の位置が示される

/rpt_familyFeature Table Definition

定義
くり返し配列タイプの名称
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可) )
例
Alu
Kpn

/rpt_typeFeature Table Definition

定義
配列のくり返し構造
書式
以下から選択します。

tandem
inverted
flanking
terminal
direct
dispersed
nested
long_terminal_repeat
non_ltr_retrotransposon_polymeric_tract
x_element_combinatorial_repeat
y_prime_element
telomeric_repeat
centromeric_repeat
other

備考
規定値の詳細は Controlled vocabulary for /rpt_type qualifier に解説があります。

/rpt_unit_seqFeature Table Definition

定義
くり返し単位の配列
書式
<text>; acgtmrwsykvhdbn0123456798() のみ可
例
aagggc
ag(5)tg(8)
(aaaga)6(aaaa)1(aaaga)12

/satelliteFeature Table Definition

定義
satellite DNA マーカーの識別子; 同一, あるいは, 関連した短い配列単位が多数, 直列に繰り返している構造を指します。
書式
<satellite_type>[:<class>][<identifier>]
例
satellite: S1a
satellite: alpha
satellite: gamma III
microsatellite: DC130
備考
<satellite_type>は必須であり, 下記の3つから何れかを記載します。

satellite
microsatellite
minisatellite

/segmentFeature Table Definition

定義
配列の得られた virus または phage のセグメント
書式
<text> (全角,ダブルクォーテーション ( “ ) 不可)
例
6

/serotypeFeature Table Definition

定義
配列の得られた生物、ウイルスなどの血清学的タイプ
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
B1

/serovarFeature Table Definition

定義
(一般に原核生物で) 抗原特性により分類される血清学的変種
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
O157:H7

/sexFeature Table Definition

定義
配列の得られた生物の性別を示します。減数分裂と性的に二形性の配偶子を伴う真核生物において用います(cf. mating_type)。
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
female
male
hermaphrodite
monoecious
dioecious

/specimen_voucherFeature Table Definition

定義
配列の得られた標本(動植物個体の一部 または 全体)が維持管理されている管理団体とID
識別子について 参照
書式
[<institution_code>:[<collection_code>:]]<specimen_id>
例
UAM:Mamm:52179
AMCC:101706
USNM:field series 8798
personal:Dan Janzen:99-SRNP-2003
備考
  • <collection_code> が存在しない場合は記載不要です。
  • <institution_code> は下記を参照してください。
    institution_code list (NCBI FTP site)

/strainFeature Table Definition

定義
配列の得られた strain の名称
多くの場合、培養細胞の株名
識別子について 参照
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可) )
例
BALB/c

/submitter_seqidFeature Table Definition

定義
TSA, TLS, WGS, CON におけるセット内で一意な識別子
識別子について 参照
書式
<text>
全角, ダブルクォーテーション ( “ ), パイプ ( | ), イコール ( = ), 角括弧 ( [ ] ), 引用符 ( > ) スペース 不可
例
contig53    
scaffold25

/sub_speciesFeature Table Definition

定義
配列の得られた生物の subspecies の名称
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
troglodytes

/tag_peptideFeature Table Definition

定義
タンパク質分解の標的となる tmRNA のコードするペプチドタグとその終止コドンの塩基位置
書式
<base_range>
例
90..122

/tissue_typeFeature Table Definition

定義
配列の得られた組織の名称
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
brain
liver

/trans_splicingFeature Table Definition

定義
成熟 RNA の形成の過程で異なる RNA 分子の exon が結合することを示します。
書式
値なし
備考
CDS,mRNA などの location で join(complement(69611..69724),139856..140087) などのように trans splicing が起きていることが示されます。

/transgenicFeature Table Definition

定義
外来 DNA が組み込まれた形質転換生物由来の配列であることを示します。
書式
値なし

/transl_exceptFeature Table Definition

定義
塩基配列上の特定の位置において CDS の翻訳が transl_table で指定されたコドン暗号表に従わない場合, 翻訳例外がある場合などに入力します。
書式
(pos:<location>,aa:<amino_acid>) <amino_acid>は Amino Acid Codes, Modified and Unusual Amino Acids のリストにある省略形を使用します。
例
  • 特定の位置で翻訳例外がある場合
/transl_except=(pos:213..215,aa:Sec)

213番目から215番目が例外的に selenocysteine (一文字表記ではU) に翻訳されます。

  • polyadenylation により stop codon になる場合
/transl_except=(pos:1017,aa:TERM)
/transl_except=(pos:2000..2001,aa:TERM)

1017番目のt, あるいは2000, 2001番目の ta の3’側に a が付加されることにより taa stop codon となる

  • Amino Acid Codes, Modified and Unusual Amino Acids で定義されないアミノ酸に翻訳される場合
/transl_except=(pos:213..215,aa:OTHER)
/note="unusual amino acid" 

213番目から215番目が /note qualifier に記載されたアミノ酸に例外的に翻訳される

/transl_tableFeature Table Definition

定義
genetic code, コドン暗号表の番号
書式
<整数> (1 - 6, 9 - 16, 21 - 31, 33)
例
11
備考
CDS の /translation は /transl_table で指定されたコドン暗号表に従って自動的にアミノ酸翻訳されます
/transl_except, /exception が指定されている場合は除きます。

国際塩基配列データベースで使用するコドン暗号表は taxonomy database: The Genetic Codes で規定されています。
/transl_table が入力されていない場合には, 自動的に Standard code (/transl_table=1) によって翻訳されます。

入力方法
  • 塩基配列登録システムの場合
    通常は, 自動的にその生物名に対応した /transl_table をセットしますので選択する必要はありません。
    Taxonomy database に登録されていない生物名の場合は、/transl_table がおわかりでしたら genetic code の項目に入力してください。 各CDS feature の transl_table に反映されます。
  • MSS の場合
    コドン暗号表の番号を適切に入力して下さい。

/translationFeature Table Definition

定義
CDS のアミノ酸翻訳配列
Amino Acid Codes のリストにある1文字表記を使用します。
その他のアミノ酸の場合は全て X で表記されます。
/exception qualifier が入力された場合を除き、入力された CDS feature の情報を基に自動翻訳しますので、登録の際は記載不要です。
例
MERRYCHRISTMASANDHAPPYNEWYEAR
備考
/pseudo または /pseudogene qualifier が存在する場合、その CDS feature には /translation qualifier を出力しません。

/varietyFeature Table Definition

定義
配列の得られた variety (変種 = varietas; 亜種の下位ランク) の名称
書式
<text> (全角, ダブルクォーテーション ( “ ) 不可)
例
insularis