DDBJ Annotated/Assembled Sequences
DDBJ 塩基配列登録システム HELP
1. Contact person
コンタクトパーソン情報を入力します。
コンタクトパーソンメールアドレス宛に登録開始用のリンクを含むメールが自動的に送信されます。
2. Hold date
公開日 (Hold date) をカレンダーから選択するか、即公開を希望する場合は “Release immediately” チェックを加えます。
-
年末・年始はDDBJが公開作業を停止するため選択できません
-
選択できる日付は最大3年後までです
入力の中断・再開方法
-
“Next” をクリックしてからブラウザでブックマークしてください。ブラウザを閉じた後でもブックマークしたURLを用いて再開することが可能です。
-
7.Annotation のページでは “Next” クリック以前であっても入力内容は保存されます。ブックマークから再開できます。
3. Submitter
登録者 (Submitter) 名を入力します。
Submitter には、例のように氏名の略記を記載してください。
format:
Last name[comma]Initial of first name[period]Initial of middle name[period]
例:
Miyashita,Y.
Robertson,G.R.
Mishima-Tokai,H.
Kim,C.S.
Wang,Y.Q.
- 関連するページ
- REFERENCE 1 / DDBJ のデータ公開形式 (flat file) の説明
- 登録者は複数名を指定いただけるよう、お願いしております。
登録者が1名のみの場合、将来、修正が必要になった際に私どもから登録者本人への連絡がとれない場面に遭遇することもございます。1名の登録者のみでの登録も可能ですが、複数の登録者を記載いただけるよう推奨しております。たとえば、実作業者と研究指導者(責任者)、論文著者から登録者に加えるなど、2名以上の登録者記載に関しましてご協力をお願いいたします。
4. Reference
論文 (Reference) 情報 を入力します。
配列に関する主論文 (Primary citation) を第一 reference に入力してください。
Last name[comma\]Initial of first name[period\]Initial of middle name[period\] **例:**
Miyashita,Y.
Robertson,G.R.
Mishima-Tokai,H.
Kim,C.S.
Wang,Y.Q.
- 関連するページ
- REFERENCE 2 / DDBJ のデータ公開形式 (flat file) の説明
Reference の例
Status: Unpublished
Status: In press
Status: Published
Journal name
Journal name を ISO abbreviation で入力してください。Journal の full name を入力していくと候補が現れますので、マウスで選択することで Journal の ISO abbreviation を入力できます。
Journal の ISO abbreviation は NLM Catalog で調べることができます。
5. Sequence
塩基配列を入力します。
TPA の submission を行う場合には、assembly information も同時に入力します。
塩基配列のフォーマットについて
-
Multi-FASTA 形式の塩基配列をペースト(またはアップロード)可能です。
-
Entry name (エントリー名) は、24文字までの半角・英数記号(ただしスペース、”[double-quote]、?[question]、¥[yen sign]、\[back-slash]を含まない)を用いて設定してください。
-
Entry name には、それぞれ異なる名称を付けてください。
同じ Entry name が使用されている場合はエラーとなるため Entry name の修正が必要になります。 -
各エントリーの区切りとして // [double slash] を挿入する必要はありませんが、// をエントリーの区切りとして使用しても構いません(例1、例2)。
-
本システムでは // 無しの塩基配列を入力した場合、各エントリーの区切りとして // が自動的に挿入されます。
-
塩基配列は、a, c, g, t, m, r, w, s, y, k, v, h, d, b, n のいずれかで構成される必要があります。
-
塩基配列中の スペース、数字は自動的に削除されます。
-
塩基配列中の大文字は自動的に小文字に変換されます。
例1
>CLN01
ggacaggctgccgcaggagccaggccgggagcaggtggtggaagacagacctgtaggtgg
aagaggcttcgggggagccggagaactgggccagaccccacaggtgcaggctgccctgtc
tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga
tgaggcaggagaatcgcttgaaccccggaggcggaggttgcagtgagccgagattacgcc
accgcactccagcctgggcgacagagtgagactccatctcaaaaaaaaaaaaaaaaaa
>CLN02
ctcacacagatgctgcgcacaccagtggttgtaacaatgccgtttgcctccttcaggtct
gaagcctgaggtgcgctcgtggtcagtgaagagggcaaaaagagagagaggctcaaagga
tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga
tagtcattcatataaatttgaacacacctgctgtgcctagacaagtgtctttctgtaaga
gctgtaactctgagatgtgctaaataaaccctctttctcaaaaaaaaaaaaaaaa
例2
>CLN01
ggacaggctgccgcaggagccaggccgggagcaggtggtggaagacagacctgtaggtgg
aagaggcttcgggggagccggagaactgggccagaccccacaggtgcaggctgccctgtc
tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga
tgaggcaggagaatcgcttgaaccccggaggcggaggttgcagtgagccgagattacgcc
accgcactccagcctgggcgacagagtgagactccatctcaaaaaaaaaaaaaaaaaa
//
>CLN02
ctcacacagatgctgcgcacaccagtggttgtaacaatgccgtttgcctccttcaggtct
gaagcctgaggtgcgctcgtggtcagtgaagagggcaaaaagagagagaggctcaaagga
tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga
tagtcattcatataaatttgaacacacctgctgtgcctagacaagtgtctttctgtaaga
gctgtaactctgagatgtgctaaataaaccctctttctcaaaaaaaaaaaaaaaa
//
TPA 塩基配列の入力
TPA における Assembly Information の書式
入力例
Assembly information のサンプルはここからダウンロードできます。(タブ区切りテキスト形式)
上記入力例の意味
Entry name FA01
TPA 塩基配列 1-552 の領域は ZZ000001.1 の 54872-55422 に対応
TPA 塩基配列 553-705 の領域は ZZ000002.5 の 1-153 に対応
Entry name BM123
TPA 塩基配列 1-438 の領域は ZZ000010.1 の 1-438 に対応
TPA 塩基配列 377-695 の領域は ZZ000011.1 の complement(1-320) に対応
TPA 塩基配列 411-790 の領域は ZZ000021.12 の 1-398 に対応
TPA 塩基配列 790-1191 の領域は ZZ000022.0 の 1-401 に対応
いずれも TPA とプライマリーエントリの配列アラインメントに関する規則 に従います。
Assembly Information 入力規則
-
第1行目は
- [tab or space]TPA_SPAN[tab or space]PRIMARY_IDENTIFIER[tab or space]PRIMARY_SPAN[tab or space]COMPLEMENT
である必要があります。
- [tab or space]TPA_SPAN[tab or space]PRIMARY_IDENTIFIER[tab or space]PRIMARY_SPAN[tab or space]COMPLEMENT
-
空行を含めないでください。
-
Entry name は第1列に記載します、Entry name のある行でエントリーごとの Assembly 情報が区切られることになります。
-
TPA_SPAN
- X..Y or X-Y
- X と Y は数字です。TPA 配列上の領域を記載します。
- 例: 100..2000 100-2000
-
PRIMARY_IDENTIFIER
- accession number.version
- 引用するプライマリエントリのアクセッション番号をバージョン番号とともに入力します。
未公開のアクセッション番号の場合はバージョン番号を 0 にしてください。 - 例: AB123456.1 AB987654.0
-
PRIMARY_SPAN
- X..Y or X-Y
- X と Y は数字です。プライマリエントリからの引用領域を入力します。抜き出した領域がTPA_SPANの領域と対応している必要があります。TPA とプライマリーエントリの配列アラインメントに関する規則もご覧ください。
-
COMPLEMENT
- 空欄 または c
- プライマリエントリから相補鎖領域を引用する場合にのみ c を指定します。
6. Template
アノテーションに適合する template を選択します。
7. Annotation
アノテーション画面 - Template で “other” 以外を選択したとき
- 関連するページ
- Feature key の定義 / Qualifier key の定義 / Organism qualifier に記載する生物名 / タンパク質コード配列; CDS feature について
アノテーション画面 - Template で “other” を選択したとき
- 関連するページ
- Feature key の定義 / Qualifier key の定義 / Organism qualifier に記載する生物名 / タンパク質コード配列; CDS feature について
アノテーションの入力方法
“Edit” ボタン
“Select Qualifier” ボタン
“Pen & Note” ボタン
“Edit Colum” ボタン
セルのダブルクリック (Template で “other” 選択時の場合は Qualifier のクリック)
生物名 (Organism name)
学名を入力後、”OK” をクリックします。
入力した名称が NCBI Taxonomy database に無い場合、リストから該当するカテゴリーを選択します。
詳細は、生物名入力におけるカテゴリ (Category) について をご覧ください。
- 関連するページ
- Organism qualifier に記載する生物名
アノテーション例
16S rRNA
CDS
Mitochondrial genome
アノテーションファイルのアップロード方法
アップロード可能なアノテーションファイル
-
サンプルファイルをここからダウンロードできます。
-
アノテーションファイル作成方法に関する手引きは、登録ファイル形式、アノテーションファイルをご覧ください。
-
annotation file には、Biological Feature 部分のみを含めてください。
-
WGS, CON, AGP, EST, GSS, STS, HTG, HTC, TSA ファイルの upload には対応していません。これらの登録については、Mass Submission System(MSS)をご利用ください。
-
アップロードされたアノテーションファイルの先頭には、”1. Contact person”、”2. Hold date”、”3. Submitter”、”4. Reference” に入力された内容が COMMON 情報として挿入されます。
-
“COMMON” を含むアノテーションファイルをアップロードした場合、COMMON は “1. Contact person”、”2. Hold date”、”3. Submitter”、”4. Reference” に入力された内容に置換されます。
-
TPA 登録においては、PRIMARY_CONTIG をアノテーションファイルに含めないでください。”5. Sequence” 内 Assembly Information に入力された内容が自動的に変換され、アノテーションファイルの各エントリーに挿入されます。
- 関連するページ
- Feature key の定義 / Qualifier key の定義 / Organism qualifier に記載する生物名 / タンパク質コード配列; CDS feature について
アノテーションファイルのアップロードエラーとなる主な原因
-
エクセルを使用して作成した場合は、テキストエディタにコピーしてからテキストファイルとして保存してください。アノテーションファイルは、タブ区切りテキストファイルである必要があります。
-
“5. Sequence” で入力した配列名 (Entry name) をアノテーションファイルに入力していないか、入力順序が一致していない場合にはアップロードできません。
-
アノテーションファイルのタブ区切りで構成されるカラムが崩れている場合はアップロードできません。
-
余計なスペース、不正文字(全角文字、unicode文字、unprintable character)がファイル中に含まれている場合もアップロードできません。
-
source フィーチャーのみではアップロードできません。適切なフィーチャーを加えてください。
Error/Warning
-
“Confirm” クリック後、エラーが生じなければ、”Next” ボタンがクリック可能になり次のステップ(Final page)に進めます。
-
Error や Warning がある場合、アノテーション入力領域の下にメッセージが表示されます。
-
Error が生じた場合は、画面をスクロールアップしアノテーション入力領域におけるエラー対象エントリーを修正してください。
-
Submitter、Reference、Sequence に Error/Warning が生じた場合、画面上部にあるプログレスバー内の各ページをクリックし、修正してください。修正後は各ページにおいて “Next” ボタンをクリックした後、プログレスバーの “7.Annotation” をクリックすると Annotation 入力画面に戻ることができます。
-
Warning があっても、”Next” がクリック可能になります。Warning が生じた場合は入力内容を見直した上で、問題がある場合のみ修正してください。入力内容に問題がなければ “Next” をクリックしてください。
Error/warning メッセージの詳細については、Validator エラーメッセージをご覧ください。
例のようにコード番号から直接リンクすることも可能です。
例:https://www.ddbj.nig.ac.jp/ddbj/validator.html#JP0015
- 関連するページ
- Feature key の定義 / Qualifier key の定義 / Organism qualifier に記載する生物名 / タンパク質コード配列; CDS feature について
アミノ酸配列を得るには
CDS feature の翻訳アミノ酸配列 (/translation qualifier) を確認する方法を参考にしてください。
または以下の Web サービスを利用することで、塩基配列から翻訳されるアミノ酸配列を知ることができます。
ORFfinder (NCBI)
https://www.ncbi.nlm.nih.gov/orffinder/
EMBOSS Transeq (EBI)
https://www.ebi.ac.uk/Tools/st/emboss_transeq/
Final page
“Confirm” 後 “Next” クリックで最終確認画面が表示されます。
8. Finish
Finish 画面が現れた時点で submission 完了となります。
入力された内容は自動的に DDBJ の登録用サーバーに転送されます。同時にSubmission 完了を知らせる Email が contact person の Email アドレス宛に送信されます。
完了を通知するメール。