Qualifier key の定義

DDBJ への新規登録で使用を推奨する qualifier key を以下に挙げています。

より詳しい INSDC qualifier key に関する情報は,
The DDBJ/EMBL/GenBank Feature Table Definition
7.3.1 Qualifier List をご参照ください。


allele

定義
allele の名称
書式
<text> (全角, ダブルクォーテーション( " ) 不可)
adh1-1

altitude

定義
サンプルを採取した場所の地理的な高度
書式
<text> (全角, ダブルクォーテーション( " ) 不可)
-256 m.
330.12 m.
備考
海表面を基準とした上下の高度をメートルを単位とした数値で示します。

anticodon

定義
tRNA のアンチコドンの位置とコードするアミノ酸
入力書式
(pos:<location>,aa:<amino_acid>)
<location> は anticodon の位置に相当する塩基番号を入力します。
<amino_acid> は Amino Acid Codes, Modified and Unusual Amino Acids のリストにある省略形を使用します。
入力例
(pos:34..36,aa:Phe)
(pos:join(5,495..496),aa:Leu)
(pos:complement(4156..4158),aa:Gln)
出力書式
(pos:<location>,aa:<amino_acid>,seq:<nucleotides>)
出力例
(pos:34..36,aa:Phe,seq:aaa)
(pos:join(5,495..496),aa:Leu,seq:tag)
(pos:complement(4156..4158),aa:Gln,seq:ttg)

artificial_location

定義
CDS または mRNAlocation が frameshift または 途中に出現する終止コドンを調整するために 生物学的なプロセシングではない理由で補正されていることを示すフラグ
書式
"heterogenous population sequenced" または "low-quality sequence region"
備考
ゲノム, transcriptome など大規模な登録において, 雑多な集団の配列決定, または, 配列の決定精度が低い場合にのみ, 使用可能です。

bio_material

定義
配列が得られた生物材料(生きている個体・系統)の保管施設と識別子
書式
[<institution_code>:[<collection_code>:]]<material_id>
CGC:CB3912 (Caenorhabditis stock centre の例)
備考
<material_id> は必須です。
保管施設としては, 動物園, 水族館, stock centre, seed bank, germplasm repository, DNA bank などが含まれます。
<institution_code> は下記などを参照してください。
Registry of Biological Repositories
Biodiversity Collections Index

bound_moiety

定義
当該 feature で示される領域に結合すると推定される分子、複合体の名称
書式
<text> (全角, ダブルクォーテーション( " ) 不可)
GAL4

cell_line

定義
配列の得られた cell line の名称
書式
<text> (全角, ダブルクォーテーション( " ) 不可)
MCF7

cell_type

定義
配列の得られた細胞のタイプ
書式
<text> (全角, ダブルクォーテーション( " ) 不可)
leukocyte

chromosome

定義
配列の得られた染色体番号, あるいは, 染色体名
書式
<text> (全角, ダブルクォーテーション( " ) 不可)
1

clone

定義
配列の得られた clone の名称
書式
<text> (全角, ダブルクォーテーション( " ) 不可)
lambda-hIL7.3

clone_lib

定義
配列の得られた clone library の名称
書式
<text> (全角, ダブルクォーテーション( " ) 不可)
lambda gt11 rice root cDNA (Gene Tech, No. 20)

codon_start

定義
タンパク質のコード領域がスタートコドンで始まらない場合に読み枠の開始位置を 1, 2, 3 の中から選択します。

書式
1 or 2 or 3 (全角不可)

collected_by

定義
標本個体を採集した人物、または、団体の名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Dan Janzen

collection_date

定義
標本を採取した日付

書式
DD-Mmm-YYYY, Mmm-YYYY or YYYY

01-Oct-1952
Oct-1952
1952

compare

定義
国際塩基配列データベースで公開されている比較対象

書式
<アクセッション番号>.<バージョン番号>

AB123456.1

country

定義
(疫学的, あるいは, 個体群研究において)配列サンプルを得た地域を 政治上の国, 大洋, または, 海, の名称で示し, 続けて地方・地域を示します。

書式
<国名>[:<詳細な地名>] (全角, ダブルクォーテーション( " ) 不可)
国名は国名リストになければなりません。
Japan:Kanagawa, Hakone, Lake Ashi

cultivar

定義
配列の得られた植物の栽培品種名

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Nipponbare

culture_collection

定義
配列の得られた培養細胞の保管施設と ID

書式
<institution-code>:[<collection-code>:]<culture_id>

ATCC:26370

備考
<institution-code> と <culture_id> が必須です。
生きている微生物やウイルスの培養系, および細胞株を記載するのに用います。
<institution_code> は下記などを参照してください。
Registry of Biological Repositories
Biodiversity Collections Index

dev_stage

定義
配列が得られた生物の発生段階

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

fourth instar larva

direction

定義
DNA の複製開始方向

書式
left, right, both の中から選択します (全角不可)

EC_number

定義
タンパク質産物としての酵素コミッション番号

書式
<identifier>.<identifier>.<identifier>.<identifier>

1.1.2.4
1.1.2.-
1.1.2.n
備考
"-" は番号が不明な場合, "n" は番号が未割当の場合に用います。

ecotype

定義
遺伝学的に生育環境への適応を反映した表現型特性を示す種内集団

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Columbia

environmental_sample

定義
PCR, DGGE, あるいは, その他の方法で直接, 分子を単離したため, 生物種が同定できない大量の環境DNAサンプルに由来した配列であることを示します。
詳細は環境サンプルの説明を ご参照ください。
書式
値なし
備考
environmental_sample のエントリには isolation_source も必要です。
また, strain と同時には使用できません。

estimated_length

定義
配列内のギャップの推定長
入力書式
unknown or known
入力例
unknown
known
出力書式
unknown or <整数>
出力例
unknown
342

exception

定義
アミノ酸翻訳の特殊な例外

書式
以下から選択します

  • RNA editing
  • reasons given in citation
  • rearrangement required for product
  • annotated by transcript or proteomic data
備考
/exception="annotated by transcript or proteomic data" を記載する場合,
その証拠になる転写産物, あるいは, タンパク質の存在を示すために
/inference qualifier を記述する必要があります。

experiment

定義
feature 記載の根拠となる生物学的な実験の簡単な記述

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Northern blot
heterologous expression system of Xenopus laevis oocytes
備考
実験の詳細は含めないでください。
* 2005年の12月に /evidence=EXPERIMENTAL を experiment に置き換える際,
/experiment="experimental evidence, no additional details recorded"
が使われました。

focus

定義
配列が複数の生物種に由来する場合に, 最も注目すべき source feature であることを示します。

書式
値なし

frequency

定義
当該 feature が存在する頻度

書式
<観測した事例の数> in <調査した個体の総数>,
<観測した事例の数>/<調査した個体の総数>,
or <小数>
1 in 12
23/108
.85

function

定義
そのfeatureで示される配列に起因する機能

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

essential for recognition of cofactor

gap_type

定義
genome assembly の一部において、構成要素間の連結部に位置する gap の種別
書式
以下から選択します

  • between scaffolds
  • within scaffold
  • telomere
  • centromere
  • short arm
  • heterochromatin
  • repeat within scaffold
  • ab initio prediction
  • repeat between scaffolds
備考
AGP Specification に従い、assembly_gap feature でのみ、使用します

gene

定義
配列に対応する遺伝子シンボル

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

ilvE

入力時のご注意: CDS に関してましては, 遺伝子命名に関する考え方もご参照ください。
  • 遺伝子シンボルとしての略号を記載して下さい。
  • 一般に通用する複数の略号がある場合でも複数の略号を記載しないで下さい。
    また, そのために不必要に区切り記号を使用しないで下さい。
    略号の複数記載を希望される場合は, 代表的な略号を gene に記載し, その他の略号を gene_synonym に記載してください。

gene_synonym

定義
配列に対応する遺伝子シンボル, gene, または, locus_tag で使用した記載とは別な呼称

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

ilvE

入力時のご注意: CDS に関してましては, 遺伝子命名に関する考え方もご参照ください。
  • 遺伝子シンボルとしての略号を記載して下さい。
  • 一般に通用する複数の略号がある場合でも複数の略号を記載しないで下さい。
    また, そのために不必要に区切り記号を使用しないで下さい。
    略号の複数記載を希望される場合は, 代表的な略号を gene に記載し, その他の略号を gene_synonym に記載してください。

germline

定義
配列が適応的免疫反応の要素である体細胞ゲノム再編成を受けていないことを示します。親の germline から受け継がれ, 再編成を受けていない配列であることを示します。

書式
値なし

備考
rearrangedと同時に記載することはできません。

haplogroup

定義
配列多型を共有する類似な haplotype グループの名称。haplogroup は, しばしば, 個体群移動の追跡に利用されます。

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

H*

haplotype

定義
同じ染色体上で連鎖する対立遺伝子の組み合わせの名称。
組み換えがない場合それぞれのハプロタイプはひとつの単位として遺伝するので, 集団の中での遺伝子流動を追うために使われます。
書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Dw3 B5 Cw1 A1

host

定義
配列決定した分子を得た生物の(実験室ではない)自然界における宿主の学名

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Homo sapiens
Homo sapiens 12 years old girl

identified_by

定義
標本個体の分類学的な同定を行った専門家の名前

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

John Burns

inference

定義
根拠となる生物学的な実験ではない推定の構造化された記述

書式
TYPE[ (same species)][:EVIDENCE_BASIS]

[TYPE] は下記のリストから選択します

  • similar to sequence
  • similar to AA sequence
  • similar to DNA sequence
  • similar to RNA sequence
  • similar to RNA sequence, mRNA
  • similar to RNA sequence, EST
  • similar to RNA sequence, other RNA
  • profile
  • nucleotide motif
  • protein motif
  • ab initio prediction
  • alignment
similar to DNA sequence:INSD:AY411252.1
similar to RNA sequence, mRNA:RefSeq:NM_000041.2
similar to DNA sequence (same species):INSD:AACN010222672.1
profile:tRNAscan:2.1
protein motif:InterPro:IPR001900
ab initio prediction:Genscan:2.0
alignment:Splign:1.26p:RefSeq:NM_000041.2,INSD:BC003557.1
備考
[(same species)] は任意 同種との相同性により得られた推定の場合記述します。
[:EVIDENCE_BASIS] は任意ですが, 参照したデータベースエントリ (Accession number と version を含む) , あるいはアルゴリズム (version を含む) を記述します。
/inference の推奨例
* 2005年の12月に /evidence=NOT_EXPERIMENTAL を inference に置き換える際,
/inference="non-experimental evidence, no additional details recorded"
が使われました。

isolate

定義
配列の得られたindividual isolate

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

SI-152
DGGE: C12

isolation_source

定義
配列が得られた生物学的サンプルに関する, 物理的, 環境的, かつまたは, 地理的な由来

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

rumen isolates from standard pelleted ration-fed steer #6

lab_host

定義
配列決定した分子を得た生物を増殖させるために実験室で使われた宿主の学名

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Gallus gallus
Gallus gallus embryo
Escherichia coli strain DH5 alpha
Homo sapiens HeLa cells

lat_lon

定義
配列決定したサンプルが採取された位置の地理的座標

書式
d[d.dddd] <N or S> d[dd.dddd] <W or E>

47.94 N 28.12 W
45.0123 S 4.1234 E
備考
小数点以下の数字は分秒ではなく小数で記載してください。

linkage_evidence

定義
assembly_gap で示される連鎖の証拠。assembly_gap feature で gap_type の値が "within scaffold" あるいは "repeat within scaffold" の場合のみ使用可能です。
書式
以下から選択します

  • paired-ends
  • pcr
  • align genus
  • align xgenus
  • align trnscpt
  • within clone
  • clone contig
  • map
  • strobe
  • unspecified
備考
AGP Specification に従い、assembly_gap feature でのみ、使用します

locus_tag

定義
(主としてゲノムプロジェクト用に)登録者が体系的に一定な識別子を 遺伝子とその関連 feature の検索を目的として割り当てたもの

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

ABC_0022
A1C_00001

備考
同一の値を取る /locus_tag はエントリ内に存在しても構いませんが, それは, 同一の遺伝子に関連することを示すものであり, それ以外の場合は /locus_tag の値は一意性を確保されていなければなりません。
また, /locus_tag の値に用いる prefix は事前登録制とし, INSDC 全体においても, 広く一意性を確保するように努めています。

macronuclear

定義
繊毛虫などで配列が大核 (生殖核でない) に由来することを示します。

書式
値なし

map

定義
その feature のゲノム上の位置情報

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

8q12-q13

mating_type

定義
配列の得られた生物の mating type を示します。原核生物, あるいは, 減数分裂による性的に二形性の配偶子を伴わない真核生物で用います (cf. sex)。

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

MAT-1
plus
-
odd
even

mobile_element_type

定義
mobile_element の名称

書式
<mobile_element_type> [:<mobile_element_name>]
<mobile_element_type>は以下の規定値から何れか1つを選びます。

  • transposon
  • retrotransposon
  • integron
  • insertion sequence
  • non-LTR retrotransposon
  • SINE
  • MITE
  • LINE
  • other
transposon:Tnp9

mod_base

定義
修飾塩基

書式
Modified Base Abbreviation のリストにある省略形を使用します。

m2g

mol_type

定義
生体内における分子種, 合成された分子種, あるいは予想される分子種

書式
以下から適切なものを選択して記載します。
genomic DNA, genomic RNA, mRNA, tRNA, rRNA, transcribed RNA,
other RNA, other DNA ,viral cRNA, unassigned DNA, unassigned RNA
備考
primary entry の生体内における分子種あるいは合成された分子種, TPA の場合は予想される分子種を示します。

  • genomic DNA は核の DNA だけではなく, organelle, plasmid の DNA にも用います。
  • rRNA gene (rDNA) は rRNA ではなく genomic DNA を選びます。
  • 通常の RNA ウイルスでは genomic RNA を選びます。
  • ただし、ssRNA negative-strand virus では、原則、viral cRNA を選びます。viral cRNA はマイナス鎖 RNA ウイルスが子孫のゲノムを産生する際に生じるプラス鎖の鋳型を指します。
  • mRNA を鋳型とした cDNA 配列は EST も含めて mRNA を選びます。
  • premature RNA を鋳型とした cDNA 配列は transcribed RNA を選びます。
  • 人工的に改変・構築した配列の場合は, other DNA, あるいは, other RNA を選びます。

ncRNA_class

定義
タンパク質をコードしない RNA (ncRNA) の種別

書式
<TYPE>

入力例
miRNA
siRNA
備考
<TYPE> は Controlled vocabulary for ncRNA classes になければなりません。
otherを選択した場合は note に簡単な説明が必要です。

note

定義
自由記述の補足説明

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

number

定義
exon, intron の番号

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

5a

old_locus_tag

定義
ゲノムプロジェクトが feature 検索を目的として割り当てたID

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

RSc0382

operon

定義
その feature が属している operon (1つの転写物に転写される遺伝子群) の名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

lac

organelle

定義
配列の得られたオルガネラ

書式
以下のオルガネラタイプから選択します。

  • mitochondrion
  • mitochondrion:kinetoplast
  • hydrogenosome
  • plastid:chloroplast
  • plastid:apicoplast
  • plastid:chromoplast
  • plastid:cyanelle
  • plastid:leucoplast
  • plastid:proplastid
  • plastid
  • chromatophore
  • nucleomorph

organism

定義
配列の得られた生物の学名

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Homo sapiens

備考
詳しくは, Organism Qualifier についてを参照して下さい。

PCR_conditions

定義
PCR の条件

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

Initial denaturation:94degC,1.5min

PCR_primers

定義
配列を増幅するために使用されたPCR プライマー
1回のPCR反応で使用したプライマーをすべて含む
書式
[fwd_name: XXX1, ]fwd_seq: xxxxx1,[fwd_name: XXX2, ]fwd_seq: xxxxx2, [rev_name: YYY1, ]rev_seq: yyyyy1, [rev_name: YYY2, ]rev_seq: yyyyy2

例1)
fwd_name: CO1P1, fwd_seq: ttgattttttggtcayccwgaagt, rev_name: CO1R4, rev_seq: ccwvytardcctarraartgttg
例2)
fwd_seq: tgtgtgtgtgactgaca, rev_seq: tagcgatacggtcaatgc
例3)
fwd_name: hoge1, fwd_seq: cgkgtgtatcttact, rev_name: hoge2, rev_seq: cggtgtatcttact
例4)
fwd_name: CO1P1, fwd_seq: ttgattttttggtcayccwgaagt, fwd_name: CO1P2, fwd_seq: gatacacaggtcayccwgaagt, rev_name: CO1R4, rev_seq: ccwvytardcctarraartgttg"
備考
fwd_seq と rev_seq は両者ともに必須, fwd_name と rev_name は任意。
配列は常に 5'から3' の方向。
修飾塩基は <i> のように< >で囲います。
それ以外の塩基配列は IUPAC で決められたアルファベットで記載されます。

plasmid

定義
配列の得られた天然のプラスミドの名称 (cloning vector を意味するものではありません)

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

C-589

product

定義
feature に対応した遺伝子産物の名称, 例えば mRNA featureには mRNA の名称, CDS にはポリペプチドの名称, mat_peptide には, 成熟タンパク質の名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

trypsinogen (CDS feature の場合)
trypsin (mat_peptide feature の場合)
XYZ neural-specific transcript (mRNA feature の場合)
入力時のご注意: CDS に関しましては, 遺伝子命名に関する考え方もご参照ください。
  • 原則, 略号の類ではない一般名を記載して下さい。
  • 生物名を含めないで下さい。
  • 一般名が複数ある場合でも, 複数の名称を記載しないで下さい。
    また, そのために不必要な区切り記号を使用しないで下さい。
    一般名の複数記載を希望される場合は, 代表的な名称を product に記載し, その他の名称を note に記載して下さい。
  • 機能, 名称等が不明な蛋白質の場合は, hypothetical protein と記載することを推奨します。

protein_id

定義
翻訳される CDS feature に対して国際塩基配列データベース INSDC が発行する識別子です。(登録時には入力しません)

書式
<identifier>.<version>

BAA12345.1

備考
IDは3文字のアルファベットと5つの数字で構成されています。
ピリオドの後の数字はその protein_id の version番号です。
配列の更新などによってCDSの翻訳アミノ酸配列が変更になった場合には, protein_id は変わりませんが, version 番号が上がります。

proviral

定義
配列が得られたウイルス, または, ファージが別の生物のゲノム内に一体化していることを示します。

書式
値なし

pseudo

定義
記載されている feature が本来の機能を持たないことを示します。
CDS feature に pseudo を指定すると translation が出力されません。
書式
値なし

pseudogene

定義
記載されている feature が pseudogene であると登録者が判断したことを示します。
CDS feature に pseudogene を指定すると translation が出力されません。
書式

以下のタイプから選択します。

  • processed
  • unprocessed
  • unitary
  • allelic
  • unknown
備考
タイプの詳細 は Controlled vocabulary for /pseudogene qualifier で解説されています。

rearranged

定義
配列が適応的免疫反応の要素である体細胞ゲノム再編成を受けていることを示します。親の germline から受け継がれた後, 再編成を受けた配列であることを示します。

書式
値なし

備考
germlineと同時に記載することはできません。

replace

定義
比較対象の配列上でその feature の位置において置換される塩基

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

a

ribosomal_slippage

定義
翻訳の途中で読み枠が変わるなど ribosomal slippage が起きていることを示す

書式
値なし

備考
CDSlocation で "join(486..1784,1784..4810)" などのように ribosomal_slippage の位置が示される

rpt_family

定義
くり返し配列タイプの名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可) )

Alu
Kpn

rpt_type

定義
配列のくり返し構造

書式
以下から選択します。
tandem, inverted, flanking, terminal, direct, dispersed, other

rpt_unit_seq

定義
くり返し単位の配列

書式
<text>; acgtmrwsykvhdbn0123456798() のみ可

aagggc
ag(5)tg(8)
(aaaga)6(aaaa)1(aaaga)12

satellite

定義
satellite DNA マーカーの識別子; 同一, あるいは, 関連した短い配列単位が多数, 直列に繰り返している構造を指します。

書式
<satellite_type>[:<class>][ <identifier>]

satellite: S1a
satellite: alpha
satellite: gamma III
microsatellite: DC130
備考
<satellite_type>は必須であり, 下記の3つから何れかを記載します。

  • satellite
  • microsatellite
  • minisatellite

segment

定義
配列の得られたウイルスまたは, ファージのセグメント

書式
<text> (全角,ダブルクォーテーション( " ) 不可)

6

serotype

定義
配列の得られた生物, ウイルスなどの血清学的タイプ

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

B1

serovar

定義
(一般に原核生物で)抗原特性により分類される血清学的変種

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

O157:H7

sex

定義
配列の得られた生物の性別を示します。減数分裂と性的に二形性の配偶子を伴う真核生物において用います(cf. mating_type)。

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

female
male
hermaphrodite
monoecious
dioecious

specimen_voucher

定義
配列の得られた標本(動植物個体の一部 または 全体)が維持管理されている管理団体とID

書式
[<institution_code>:[<collection_code>:]]<specimen_id>

UAM:Mamm:52179
AMCC:101706
USNM:field series 8798
personal:Dan Janzen:99-SRNP-2003
備考
<collection_code> が存在しない場合は記載不要です。
<institution_code> は下記などを参照してください。
Registry of Biological Repositories
Biodiversity Collections Index

strain

定義
配列の得られた strain の名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可) )

BALB/c

sub_clone

定義
配列の得られた sub-clone の名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

lambda-hIL7.20g

sub_species

定義
配列の得られた生物の subspecies の名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

troglodytes

sub_strain

定義
配列の得られた遺伝学的あるいは他の方法で改変された sub-strain の名称。
その親に当たる strain は strain qualifier に記載されます。
書式
<text> (全角, ダブルクォーテーション( " ) 不可)

abis

備考
strain が不明な場合は sub_strain は使わず strain に記載します。

  • 通常の例: /strain="K-12", /sub_strain="MG1655"
  • strain が不明な例: /strain="MG1655"

tag_peptide

定義
タンパク質分解の標的となる tmRNA のコードするペプチドタグとその終止コドンの塩基位置

書式
<base_range>

90..122

tissue_type

定義
配列の得られた組織の名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

brain

trans_splicing

定義
成熟 RNA の形成の過程で異なる RNA 分子の exon が結合することを示します。

書式
値なし

備考
CDS, mRNA などの location で join(complement(69611..69724),139856..140087) などのように trans splicing が起きていることが示されます。

transgenic

定義
外来 DNA が組み込まれた形質転換生物由来の配列であることを示します。

書式
値なし

transl_except

定義
塩基配列上の特定の位置において CDS の翻訳が transl_table で指定されたコドン暗号表に従わない場合, 翻訳例外がある場合などに入力します。

書式
(pos:location,aa:<amino_acid>)
<amino_acid>は Amino Acid Codes, Modified and Unusual Amino Acids のリストにある省略形を使用します。
1. 特定の位置で翻訳例外がある場合
/transl_except=(pos:213..215,aa:Sec)
213番目から215番目が例外的に selenocysteine (一文字表記ではU) に翻訳されます。
2. polyadenylation により stop codon になる場合
/transl_except=(pos:1017,aa:TERM)
/transl_except=(pos:2000..2001,aa:TERM)
1017番目のt, あるいは2000, 2001番目の ta の3'側に a が付加されることにより taa stop codon となる
3. Amino Acid Codes, Modified and Unusual Amino Acids で定義されないアミノ酸に翻訳される場合
/transl_except=(pos:213..215,aa:OTHER)
/note="unusual amino acid"
213番目から215番目が note qualifier に記載されたアミノ酸に例外的に翻訳される

transl_table

定義
genetic code, コドン暗号表の番号

書式
<整数> (1 - 6, 9 - 16, 21 - 24)

備考
CDStranslation は transl_table で指定されたコドン暗号表に従って自動的にアミノ酸翻訳されます
* transl_except, exception が指定されている場合は除きます。
国際塩基配列データベースで使用するコドン暗号表は taxonomy database: The Genetic Codes で規定されています。
transl_table が入力されていない場合には, 自動的に Standard code (/transl_table=1) によって翻訳されます。
入力方法
塩基配列登録システムの場合
通常は, 自動的にその生物名に対応した transl_table をセットしますので選択する必要はありません。
Taxonomy database に登録されていない生物名の場合は、transl_table がおわかりでしたら genetic code の項目に入力してください。各CDS feature の transl_table に反映されます。
MSS の場合
コドン暗号表の番号を適切に入力して下さい。

translation

定義
CDS のアミノ酸翻訳配列
Amino Acid Codes のリストにある1文字表記を使用します。
その他のアミノ酸の場合は全て X で表記されます。
exception qualifier が入力された場合を除き, 入力された CDS feature の情報を基に自動翻訳します。
ただし, pseudo または pseudogene qualifier が指定されている場合はアミノ酸翻訳しませんので translation qualifier も出力しません。
MERRYCHRISTMASANDHAPPYNEWYEAR

variety

定義
配列の得られた variety (変種 = varietas; 亜種の下位ランク) の名称

書式
<text> (全角, ダブルクォーテーション( " ) 不可)

insularis