Qualifier key の定義
DDBJ への新規登録で使用を推奨する qualifier key を以下に挙げています。
より詳しい INSDC qualifier key に関する情報は, The DDBJ/EMBL/GenBank Feature Table Definition の 7.3.1 Qualifier List をご参照ください。
- 定義
- allele の名称
- 書式
- <text> (全角, ダブルクォーテーション( " ) 不可)
- 例
- adh1-1
- 定義
- サンプルを採取した場所の地理的な高度
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- -256 m.
330.12 m.
- 備考
- 海表面を基準とした上下の高度をメートルを単位とした数値で示します。
- 定義
- tRNA のアンチコドンの位置とコードするアミノ酸
- 入力書式
- (pos:<location>,aa:<amino_acid>)
<location> は anticodon の位置に相当する塩基番号を入力します。
<amino_acid> は Amino Acid Codes, Modified and Unusual Amino Acids のリストにある省略形を使用します。
- 入力例
-
(pos:34..36,aa:Phe)
(pos:join(5,495..496),aa:Leu)
(pos:complement(4156..4158),aa:Gln)
- 出力書式
- (pos:<location>,aa:<amino_acid>,seq:<nucleotides>)
- 出力例
-
(pos:34..36,aa:Phe,seq:aaa)
(pos:join(5,495..496),aa:Leu,seq:tag)
(pos:complement(4156..4158),aa:Gln,seq:ttg)
- 定義
- CDS または mRNA の location が frameshift または 途中に出現する終止コドンを調整するために 生物学的なプロセシングではない理由で補正されていることを示すフラグ
- 書式
- "heterogenous population sequenced" または "low-quality sequence region"
- 備考
- ゲノム, transcriptome など大規模な登録において, 雑多な集団の配列決定, または, 配列の決定精度が低い場合にのみ, 使用可能です。
- 定義
- 配列が得られた生物材料(生きている個体・系統)の保管施設と識別子
- 書式
- [<institution_code>:[<collection_code>:]]<material_id>
- 例
- CGC:CB3912 (Caenorhabditis stock centre の例)
- 備考
- <material_id> は必須です。
保管施設としては, 動物園, 水族館, stock centre, seed bank, germplasm repository, DNA bank などが含まれます。
<institution_code> は下記などを参照してください。
institution_code list (NCBI FTP site)
Registry of Biological Repositories
Biodiversity Collections Index
- 定義
- 当該 feature で示される領域に結合すると推定される分子、複合体の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- GAL4
- 定義
- 配列の得られた cell line の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- MCF7
- 定義
- 配列の得られた細胞のタイプ
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- leukocyte
- 定義
- 配列の得られた染色体番号, あるいは, 染色体名
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- 1
- 定義
- 配列の得られた clone の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- lambda-hIL7.3
- 定義
- 配列の得られた clone library の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- lambda gt11 rice root cDNA (Gene Tech, No. 20)
- 定義
- タンパク質のコード領域がスタートコドンで始まらない場合に読み枠の開始位置を 1, 2, 3 の中から選択します。
- 書式
- 1 or 2 or 3 (全角不可)
- 定義
- 標本個体を採集した人物、または、団体の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Dan Janzen
- 定義
- 標本を採取した日付
- 書式
- DD-Mmm-YYYY, Mmm-YYYY or YYYY
- 例
- 01-Oct-1952
Oct-1952
1952
- 定義
- 国際塩基配列データベースで公開されている比較対象
- 書式
- <アクセッション番号>.<バージョン番号>
- 例
- AB123456.1
- 定義
- (疫学的, あるいは, 個体群研究において)配列サンプルを得た地域を 政治上の国, 大洋, または, 海, の名称で示し, 続けて地方・地域を示します。
- 書式
- <国名>[:<詳細な地名>] (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Japan:Kanagawa, Hakone, Lake Ashi
- 備考
- 国名は国名リストから選択します。
- 定義
- 配列の得られた植物の栽培品種名
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Nipponbare
- 定義
- 配列の得られた培養細胞の保管施設と ID
- 書式
- <institution-code>:[<collection-code>:]<culture_id>
- 例
- ATCC:26370
- 備考
- <institution-code> と <culture_id> が必須です。
生きている微生物やウイルスの培養系, および細胞株を記載するのに用います。
<institution_code> は下記などを参照してください。
institution_code list (NCBI FTP site)
Registry of Biological Repositories
Biodiversity Collections Index
- 定義
- 他のデータベース内の関連情報を示す
- 書式
- <データベース名>:<ID> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- UniProtKB/Swiss-Prot:P28763
- 備考
- データベース名はデータベースリストから選択します。
アノテーションの根拠として参照したのみの場合は db_xref ではなく、inferenceを用いて記載してください。
- 定義
- 配列が得られた生物の発生段階
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- fourth instar larva
- 定義
- DNA の複製開始方向
- 書式
- left, right, both の中から選択します (全角不可)
- 定義
- タンパク質産物としての酵素コミッション番号
- 書式
- <identifier>.<identifier>.<identifier>.<identifier>
- 例
- 1.1.2.4
1.1.2.-
1.1.2.n
- 備考
- "-" は番号が不明な場合, "n" は番号が未割当の場合に用います。
- 定義
- 遺伝学的に生育環境への適応を反映した表現型特性を示す種内集団
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Columbia
- 定義
-
PCR, DGGE, あるいは, その他の方法で直接, 分子を単離したため, 生物種が同定できない大量の環境DNAサンプルに由来した配列であることを示します。
詳細は環境サンプルの説明を ご参照ください。
- 書式
- 値なし
- 備考
- environmental_sample のエントリには isolation_source も必要です。
また, strain と同時には使用できません。
- 定義
- 配列内のギャップの推定長
- 入力書式
- unknown or known
- 入力例
- unknown
known
- 出力書式
- unknown or <整数>
- 出力例
- unknown
342
- 定義
- アミノ酸翻訳の特殊な例外
- 書式
- 以下から選択します
- RNA editing
- reasons given in citation
- rearrangement required for product
- annotated by transcript or proteomic data
- 備考
- /exception="annotated by transcript or proteomic data" を記載する場合, その証拠になる転写産物, あるいは, タンパク質の存在を示すために /inference qualifier を記述する必要があります。
- 定義
- feature 記載の根拠となる生物学的な実験の簡単な記述
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Northern blot
heterologous expression system of Xenopus laevis oocytes
- 備考
- 実験の詳細は含めないでください。
* 2005年の12月に /evidence=EXPERIMENTAL を experiment に置き換える際,
/experiment="experimental evidence, no additional details recorded"
が使われました。
- 定義
- 配列が複数の生物種に由来する場合に, 最も注目すべき source feature であることを示します。
- 書式
- 値なし
- 定義
- 当該 feature が存在する頻度
- 書式
- <観測した事例の数> in <調査した個体の総数>,
<観測した事例の数>/<調査した個体の総数>,
or <小数>
- 例
- 1 in 12
23/108
.85
- 定義
- そのfeatureで示される配列に起因する機能
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- essential for recognition of cofactor
- 定義
- genome assembly の一部において、構成要素間の連結部に位置する gap の種別
- 書式
- 以下から選択します
- between scaffolds
- within scaffold
- telomere
- centromere
- short arm
- heterochromatin
- repeat within scaffold
- ab initio prediction
- repeat between scaffolds
- 備考
- AGP Specification に従い、assembly_gap feature でのみ、使用します
- 定義
- 配列に対応する遺伝子シンボル
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- ilvE
- 入力時のご注意: CDS に関してましては, 遺伝子命名に関する考え方もご参照ください。
-
- 遺伝子シンボルとしての略号を記載して下さい。
- 一般に通用する複数の略号がある場合でも複数の略号を記載しないで下さい。
また, そのために不必要に区切り記号を使用しないで下さい。
略号の複数記載を希望される場合は, 代表的な略号を gene に記載し, その他の略号を gene_synonym に記載してください。
- 定義
- 配列に対応する遺伝子シンボル, gene, または, locus_tag で使用した記載とは別な呼称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- ilvE
- 入力時のご注意: CDS に関してましては, 遺伝子命名に関する考え方もご参照ください。
-
- 遺伝子シンボルとしての略号を記載して下さい。
- 一般に通用する複数の略号がある場合でも複数の略号を記載しないで下さい。
また, そのために不必要に区切り記号を使用しないで下さい。
略号の複数記載を希望される場合は, 代表的な略号を gene に記載し, その他の略号を gene_synonym に記載してください。
- 定義
- 配列が適応的免疫反応の要素である体細胞ゲノム再編成を受けていないことを示します。親の germline から受け継がれ, 再編成を受けていない配列であることを示します。
- 書式
- 値なし
- 備考
- rearrangedと同時に記載することはできません。
- 定義
- 配列多型を共有する類似な haplotype グループの名称。haplogroup は, しばしば, 個体群移動の追跡に利用されます。
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- H*
- 定義
- 同じ染色体上で連鎖する対立遺伝子の組み合わせの名称。
組み換えがない場合それぞれのハプロタイプはひとつの単位として遺伝するので, 集団の中での遺伝子流動を追うために使われます。
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Dw3 B5 Cw1 A1
- 定義
- 配列決定した分子を得た生物の(実験室ではない)自然界における宿主の学名
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Homo sapiens
Homo sapiens 12 years old girl
- 定義
- 標本個体の分類学的な同定を行った専門家の名前
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- John Burns
- 定義
- 根拠となる生物学的な実験ではない推定の構造化された記述
- 書式
- TYPE[ (same species)][:EVIDENCE_BASIS]
- [TYPE] は下記のリストから選択します
- similar to sequence
- similar to AA sequence
- similar to DNA sequence
- similar to RNA sequence
- similar to RNA sequence, mRNA
- similar to RNA sequence, EST
- similar to RNA sequence, other RNA
- profile
- nucleotide motif
- protein motif
- ab initio prediction
- alignment
- 例
- similar to DNA sequence:INSD:AY411252.1
similar to RNA sequence, mRNA:RefSeq:NM_000041.2
similar to DNA sequence (same species):INSD:AACN010222672.1
profile:tRNAscan:2.1
protein motif:InterPro:IPR001900
ab initio prediction:Genscan:2.0
alignment:Splign:1.26p:RefSeq:NM_000041.2,INSD:BC003557.1
- 備考
- [(same species)] は任意 同種との相同性により得られた推定の場合記述します。
[:EVIDENCE_BASIS] は任意ですが, 参照したデータベースエントリ (Accession number と version を含む) , あるいはアルゴリズム (version を含む) を記述します。
/inference の推奨例
* 2005年の12月に /evidence=NOT_EXPERIMENTAL を inference に置き換える際,
/inference="non-experimental evidence, no additional details recorded"
が使われました。
- 定義
- 配列の得られたindividual isolate
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- SI-152
DGGE: C12
- 定義
- 配列が得られた生物学的サンプルに関する, 物理的, 環境的, かつまたは, 地理的な由来
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- rumen isolates from standard pelleted ration-fed steer #6
- 定義
- 配列決定した分子を得た生物を増殖させるために実験室で使われた宿主の学名
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Gallus gallus
Gallus gallus embryo
Escherichia coli strain DH5 alpha
Homo sapiens HeLa cells
- 定義
- 配列決定したサンプルが採取された位置の地理的座標
- 書式
- d[d.dddd] <N or S> d[dd.dddd] <W or E>
- 例
- 47.94 N 28.12 W
45.0123 S 4.1234 E
- 備考
- 小数点以下の数字は分秒ではなく小数で記載してください。
- 定義
- assembly_gap で示される連鎖の証拠。assembly_gap feature で gap_type の値が "within scaffold" あるいは "repeat within scaffold" の場合のみ使用可能です。
- 書式
- 以下から選択します
- paired-ends
- pcr
- align genus
- align xgenus
- align trnscpt
- within clone
- clone contig
- map
- strobe
- unspecified
- 備考
- AGP Specification に従い、assembly_gap feature でのみ、使用します
- 定義
- (主としてゲノムプロジェクト用に)登録者が体系的に一定な識別子を 遺伝子とその関連 feature の検索を目的として割り当てたもの
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- ABC_0022
A1C_00001
- 備考
- 同一の値を取る /locus_tag はエントリ内に存在しても構いませんが, それは, 同一の遺伝子に関連することを示すものであり, それ以外の場合は /locus_tag の値は一意性を確保されていなければなりません。
また, /locus_tag の値に用いる prefix は事前登録制とし, INSDC 全体においても, 広く一意性を確保するように努めています。
- 定義
- 繊毛虫などで配列が大核 (生殖核でない) に由来することを示します。
- 書式
- 値なし
- 定義
- その feature のゲノム上の位置情報
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- 8q12-q13
- 定義
- 配列の得られた生物の mating type を示します。原核生物, あるいは, 減数分裂による性的に二形性の配偶子を伴わない真核生物で用います (cf. sex)。
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- MAT-1
plus
-
odd
even
- 定義
- mobile_element の名称
- 書式
- <mobile_element_type> [:<mobile_element_name>]
<mobile_element_type>は以下の規定値から何れか1つを選びます。
- transposon
- retrotransposon
- integron
- insertion sequence
- non-LTR retrotransposon
- SINE
- MITE
- LINE
- other
- 例
- transposon:Tnp9
- 定義
- 修飾塩基
- 書式
- Modified Base Abbreviation のリストにある省略形を使用します。
- 例
- m2g
- 定義
- 生体内における分子種, 合成された分子種, あるいは予想される分子種
- 書式
- 以下から適切なものを選択して記載します。
genomic DNA, genomic RNA, mRNA, tRNA, rRNA, transcribed RNA,
other RNA, other DNA ,viral cRNA, unassigned DNA, unassigned RNA
- 備考
- primary entry の生体内における分子種あるいは合成された分子種, TPA の場合は予想される分子種を示します。
-
- genomic DNA は核の DNA だけではなく, organelle, plasmid の DNA にも用います。
- rRNA gene (rDNA) は rRNA ではなく genomic DNA を選びます。
- 通常の RNA ウイルスでは genomic RNA を選びます。
- ただし、ssRNA negative-strand virus では、原則、viral cRNA を選びます。viral cRNA はマイナス鎖 RNA ウイルスが子孫のゲノムを産生する際に生じるプラス鎖の鋳型を指します。
- mRNA を鋳型とした cDNA 配列は EST も含めて mRNA を選びます。
- premature RNA を鋳型とした cDNA 配列は transcribed RNA を選びます。
- 人工的に改変・構築した配列の場合は, other DNA, あるいは, other RNA を選びます。
- 定義
- タンパク質をコードしない RNA (ncRNA) の種別
- 書式
- <TYPE>
- 入力例
- miRNA
siRNA
- 備考
- <TYPE> は Controlled vocabulary for ncRNA classes になければなりません。
otherを選択した場合は note に簡単な説明を記載してください。
- 定義
- 自由記述の補足説明
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 定義
- exon, intron の番号
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- 5a
- 定義
- ゲノムプロジェクトが feature 検索を目的として割り当てたID
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- RSc0382
- 定義
- その feature が属している operon (1つの転写物に転写される遺伝子群) の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- lac
- 定義
- 配列の得られたオルガネラ
- 書式
- 以下のオルガネラタイプから選択します。
- mitochondrion
- mitochondrion:kinetoplast
- hydrogenosome
- plastid:chloroplast
- plastid:apicoplast
- plastid:chromoplast
- plastid:cyanelle
- plastid:leucoplast
- plastid:proplastid
- plastid
- chromatophore
- nucleomorph
- 定義
- 配列の得られた生物の学名
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Homo sapiens
- 備考
- 詳しくは, Organism Qualifier についてを参照して下さい。
- 定義
- PCR の条件
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- Initial denaturation:94degC,1.5min
- 定義
- 配列を増幅するために使用されたPCR プライマー
1回のPCR反応で使用したプライマーをすべて含む
- 書式
- [fwd_name: XXX1, ]fwd_seq: xxxxx1,[fwd_name: XXX2, ]fwd_seq: xxxxx2, [rev_name: YYY1, ]rev_seq: yyyyy1, [rev_name: YYY2, ]rev_seq: yyyyy2
- 例1)
fwd_name: CO1P1, fwd_seq: ttgattttttggtcayccwgaagt, rev_name: CO1R4, rev_seq: ccwvytardcctarraartgttg
- 例2)
fwd_seq: tgtgtgtgtgactgaca, rev_seq: tagcgatacggtcaatgc
- 例3)
fwd_name: hoge1, fwd_seq: cgkgtgtatcttact, rev_name: hoge2, rev_seq: cggtgtatcttact
- 例4)
fwd_name: CO1P1, fwd_seq: ttgattttttggtcayccwgaagt, fwd_name: CO1P2, fwd_seq: gatacacaggtcayccwgaagt, rev_name: CO1R4, rev_seq: ccwvytardcctarraartgttg"
- 備考
- fwd_seq と rev_seq は両者ともに必須, fwd_name と rev_name は任意。
配列は常に 5'から3' の方向。
修飾塩基は <i> のように< >で囲います。
それ以外の塩基配列は IUPAC で決められたアルファベットで記載されます。
- 定義
- 配列の得られた天然のプラスミドの名称 (cloning vector を意味するものではありません)
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- C-589
- 定義
- feature に対応した遺伝子産物の名称, 例えば mRNA featureには mRNA の名称, CDS にはポリペプチドの名称, mat_peptide には, 成熟タンパク質の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- trypsinogen (CDS feature の場合)
trypsin (mat_peptide feature の場合)
XYZ neural-specific transcript (mRNA feature の場合)
- 入力時のご注意:
-
CDS に関しましては, 遺伝子命名に関する考え方もご参照ください。
- 原則, 略号の類ではない一般名を記載して下さい。
- 生物名を含めないで下さい。
- 一般名が複数ある場合でも, 複数の名称を記載しないで下さい。
また, そのために不必要な区切り記号を使用しないで下さい。
一般名の複数記載を希望される場合は, 代表的な名称を product に記載し, その他の名称を note に記載して下さい。
- 機能, 名称等が不明な蛋白質の場合は, hypothetical protein と記載することを推奨します。
- 定義
- 翻訳される CDS feature に対して国際塩基配列データベース INSDC が発行する識別子です。(登録時には入力しません)
- 書式
- <identifier>.<version>
- 例
- BAA12345.1
- 備考
- IDは3文字のアルファベットと5つの数字で構成されています。
ピリオドの後の数字はその protein_id の version番号です。
配列の更新などによってCDSの翻訳アミノ酸配列が変更になった場合には, protein_id は変わりませんが, version 番号が上がります。
- 定義
- 配列が得られたウイルス, または, ファージが別の生物のゲノム内に一体化していることを示します。
- 書式
- 値なし
- 定義
- 記載されている feature が本来の機能を持たないことを示します。
CDS feature に pseudo を指定すると translation が出力されません。
- 書式
- 値なし
- 定義
- 記載されている feature が pseudogene であると登録者が判断したことを示します。
CDS feature に pseudogene を指定すると translation が出力されません。
- 書式
以下のタイプから選択します。
- processed
- unprocessed
- unitary
- allelic
- unknown
- 備考
- タイプの詳細 は Controlled vocabulary for /pseudogene qualifier で解説されています。
- 定義
- 配列が適応的免疫反応の要素である体細胞ゲノム再編成を受けていることを示します。親の germline から受け継がれた後, 再編成を受けた配列であることを示します。
- 書式
- 値なし
- 備考
- germlineと同時に記載することはできません。
- 定義
- 比較対象の配列上でその feature の位置において置換される塩基
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- a
- 定義
- 翻訳の途中で読み枠が変わるなど ribosomal slippage が起きていることを示す
- 書式
- 値なし
- 備考
- CDS の location で "join(486..1784,1784..4810)" などのように ribosomal_slippage の位置が示される
- 定義
- くり返し配列タイプの名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可) )
- 例
- Alu
Kpn
- 定義
- 配列のくり返し構造
- 書式
- 以下から選択します。
- tandem
- inverted
- flanking
- terminal
- direct
- dispersed
- other
- 定義
- くり返し単位の配列
- 書式
- <text>; acgtmrwsykvhdbn0123456798() のみ可
- 例
- aagggc
ag(5)tg(8)
(aaaga)6(aaaa)1(aaaga)12
- 定義
- satellite DNA マーカーの識別子; 同一, あるいは, 関連した短い配列単位が多数, 直列に繰り返している構造を指します。
- 書式
- <satellite_type>[:<class>][ <identifier>]
- 例
- satellite: S1a
satellite: alpha
satellite: gamma III
microsatellite: DC130
- 備考
- <satellite_type>は必須であり, 下記の3つから何れかを記載します。
- satellite
- microsatellite
- minisatellite
- 定義
- 配列の得られたウイルスまたは, ファージのセグメント
- 書式
- <text> (全角,ダブルクォーテーション ( " ) 不可)
- 例
- 6
- 定義
- 配列の得られた生物, ウイルスなどの血清学的タイプ
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- B1
- 定義
- (一般に原核生物で)抗原特性により分類される血清学的変種
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- O157:H7
- 定義
- 配列の得られた生物の性別を示します。減数分裂と性的に二形性の配偶子を伴う真核生物において用います(cf. mating_type)。
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- female
male
hermaphrodite
monoecious
dioecious
- 定義
- 配列の得られた標本(動植物個体の一部 または 全体)が維持管理されている管理団体とID
- 書式
- [<institution_code>:[<collection_code>:]]<specimen_id>
- 例
- UAM:Mamm:52179
AMCC:101706
USNM:field series 8798
personal:Dan Janzen:99-SRNP-2003
- 備考
- <collection_code> が存在しない場合は記載不要です。
<institution_code> は下記などを参照してください。
institution_code list (NCBI FTP site)
Registry of Biological Repositories
Biodiversity Collections Index
- 定義
- 配列の得られた strain の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可) )
- 例
- BALB/c
- 定義
- 配列の得られた sub-clone の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- lambda-hIL7.20g
- 定義
- 配列の得られた生物の subspecies の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- troglodytes
- 定義
- 配列の得られた遺伝学的あるいは他の方法で改変された sub-strain の名称。
その親に当たる strain は strain qualifier に記載されます。
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- abis
- 備考
- strain が不明な場合は sub_strain は使わず strain に記載します。
- 通常の例: /strain="K-12", /sub_strain="MG1655"
- strain が不明な例: /strain="MG1655"
- 定義
- タンパク質分解の標的となる tmRNA のコードするペプチドタグとその終止コドンの塩基位置
- 書式
- <base_range>
- 例
- 90..122
- 定義
- 配列の得られた組織の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- brain
- 定義
- 成熟 RNA の形成の過程で異なる RNA 分子の exon が結合することを示します。
- 書式
- 値なし
- 備考
- CDS, mRNA などの location で join(complement(69611..69724),139856..140087) などのように trans splicing が起きていることが示されます。
- 定義
- 外来 DNA が組み込まれた形質転換生物由来の配列であることを示します。
- 書式
- 値なし
- 定義
- 塩基配列上の特定の位置において CDS の翻訳が transl_table で指定されたコドン暗号表に従わない場合, 翻訳例外がある場合などに入力します。
- 書式
- (pos:location,aa:<amino_acid>)
<amino_acid>は Amino Acid Codes, Modified and Unusual Amino Acids のリストにある省略形を使用します。
- 例
- 1. 特定の位置で翻訳例外がある場合
/transl_except=(pos:213..215,aa:Sec)
213番目から215番目が例外的に selenocysteine (一文字表記ではU) に翻訳されます。
- 2. polyadenylation により stop codon になる場合
/transl_except=(pos:1017,aa:TERM)
/transl_except=(pos:2000..2001,aa:TERM)
1017番目のt, あるいは2000, 2001番目の ta の3'側に a が付加されることにより taa stop codon となる
- 3. Amino Acid Codes, Modified and Unusual Amino Acids で定義されないアミノ酸に翻訳される場合
/transl_except=(pos:213..215,aa:OTHER)
/note="unusual amino acid"
213番目から215番目が note qualifier に記載されたアミノ酸に例外的に翻訳される
- 定義
- genetic code, コドン暗号表の番号
- 書式
- <整数> (1 - 6, 9 - 16, 21 - 25)
- 例
- 11
- 備考
- CDS の translation は transl_table で指定されたコドン暗号表に従って自動的にアミノ酸翻訳されます
* transl_except, exception が指定されている場合は除きます。
国際塩基配列データベースで使用するコドン暗号表は taxonomy database: The Genetic Codes で規定されています。
transl_table が入力されていない場合には, 自動的に Standard code (/transl_table=1) によって翻訳されます。
- 入力方法
- 塩基配列登録システムの場合
通常は, 自動的にその生物名に対応した transl_table をセットしますので選択する必要はありません。
Taxonomy database に登録されていない生物名の場合は、transl_table がおわかりでしたら genetic code の項目に入力してください。各CDS feature の transl_table に反映されます。
- MSS の場合
コドン暗号表の番号を適切に入力して下さい。
- 定義
- CDS のアミノ酸翻訳配列
Amino Acid Codes のリストにある1文字表記を使用します。
その他のアミノ酸の場合は全て X で表記されます。
exception qualifier が入力された場合を除き, 入力された CDS feature の情報を基に自動翻訳します。
ただし, pseudo または pseudogene qualifier が指定されている場合はアミノ酸翻訳しませんので translation qualifier も出力しません。
- 例
- MERRYCHRISTMASANDHAPPYNEWYEAR
- 定義
- 配列の得られた variety (変種 = varietas; 亜種の下位ランク) の名称
- 書式
- <text> (全角, ダブルクォーテーション ( " ) 不可)
- 例
- insularis