よくある質問
-
データファイルの検証処理エラーへの対処方法は?
- シークエンスデータ
- DRA
Make Sra Error
-
サンプルがバーコード配列によって区別されている場合のメタデータは?
- メタデータの登録
- DRA
バーコード配列で由来サンプルが区別されたデータファイルは登録前に分割し、由来サンプルごとに BioSample を作成します。 各 BioSample には1つかそれ以上のユニークなデータファイルがリンクされている状態にします。
バーコード配列とサンプルの対応は、Experiment の Library Construction Protocol にフリーテキストで記載します。 -
多件数のメタデータを作成するよい方法は?
- メタデータの登録
- DRA
Experiment や Run オブジェクトが多件数の場合、メタデータ用エクセルと XML 生成プログラムを使ってエクセルから XML を生成し、Submission/Experiment/Run XML を D-way からアップロードすることで多件数を登録することができます。詳細については メタデータエクセルを使った登録方法をご覧ください。
-
公開されている DRA データにアクセスする方法を教えてください
- データのダウンロード
- DRA
https/ftp/スパコンでアクセスすることができます。 アクセッション番号に対するファイルパスは DDBJ Search で検索します。
-
論文情報を追加するには?
- 更新
- BioProject
- BioSample
- DDBJ
- DRA
- GEA
- MetaboBank
- DDBJ 塩基配列データ
- 登録データの修正・更新の当該項目を参照の上、登録データの修正・更新申し込みの「論文が公開されました」から担当者に連絡します。配列エントリのフラットファイルに論文情報が記載されます。
-
DRA で公開されている fastq のリード数が生データのそれよりも少ないのは何故でしょうか?
- データのダウンロード
- DRA
DRA では NCBI SRA Toolkit に含まれている fastq-dump を使い,以下のオプションで生データである SRA ファイルから fastq ファイルを作成しています。
-
投稿論文に DRA アクセッション番号を記載するときのフォーマットはありますか?
- アクセッション番号
- DRA
投稿を予定している雑誌などの,執筆規定に従ってください。
-
データに誤りを見つけました。登録者ではありませんが訂正できますか
- 更新
- DDBJ
文献情報以外の内容の更新や訂正は、原則として、登録者としてデータに登録されている方の了承、または、依頼を受けて行ないます。
参照: 登録に附随する権利と義務 -
当該データの登録者としてご登録いただいている方からの依頼ならば可能です。
アクセッション番号を明記の上 DDBJ へのお問い合わせ よりご依頼ください。 -
DDBJ 塩基配列登録システムを使って登録済みデータを修正できますか
- 塩基配列登録システム
- DDBJ
DDBJ 塩基配列登録システムはデータ登録専用のツールであり、データの修正には対応していません。
修正・更新は登録データの修正・更新をご参照ください。 -
未公開の配列とアクセッション番号の対応関係を知りたい
- アクセッション番号
- DDBJ
DDBJ へのお問い合わせより、以下の情報をご連絡下さい。
- コンタクトパーソンのメールアドレス
- アクセッション番号または EntryID
-
現在公開されている配列の履歴を参照できますか?
- 検索
- getentry
gethistory で DDBJ 塩基配列の履歴を参照することができます。
-
DDBJ では配列データの更新予約は行っておりません。
そのため、既に公開されている配列データを更新する場合、作業完了後にはデータは、即時更新後の内容で再公開されます。 -
論文が受理されました
- 更新
- DDBJ
登録データの修正・更新申し込みの「論文が受理されました」より お知らせください。</p>
-
コンタクトパーソン情報を変更したい
- 更新
- DDBJ
登録データの修正・更新申し込みの「コンタクトパーソン情報を変更したい」より お知らせください。
変更がない項目は現在の情報のみお知らせください。 -
配列を更新したい
- 更新
- DDBJ
依頼者のお名前、ご所属を明記の上、以下の項目について DDBJにメールでお知らせください。
宛先:- アクセッション番号:
- 変更箇所:
- 更新後の総塩基数:
- 配列の更新に伴う Feature の塩基番号など、変更項目の詳細:
- 更新後の全長配列: 以下のフォーマットでお願いします。
>AB****** <--- 当該データのアクセッション番号 aaaaaaaaaattttttttttggggggggggccccccccccaaaaaaaaaatttttttttt ggggggggggccccccccccaaaaaaaaaattttttttttggggggggggcccccccccc // >AB****** aaaaaaaaaattttttttttggggggggggccccccccccaaaaaaaaaatttttttttt ggggggggggccccccccccaaaaaaaaaattttttttttggggggggggcccccccccc aaaaaaaaaat //
- ヘッダ行; リダイレクション “>” のあとにスペースなしでアクセッション番号。
- 塩基配列; 半角60文字/行の fasta 類似フォーマットです。
- 終了フラグ; “//” を入力してください。
-
公開予定日を延期したい
- 更新
- DDBJ
登録データの修正・更新申し込みの「公開予定日を変更したい」より お知らせください。
-
修正・更新の対象となる件数が多い場合、配列の修正・更新に伴い feature/location/qualifier に多数の変更箇所がある場合などには、以下をご参照ください。
-
論文投稿の過程で査読者に登録した非公開塩基配列を見せたいのですが
- 更新
- DDBJ
DDBJ では パスワード認証等による限定的な公表の方法はご提供しておりません。
特定個人に非公開状態の塩基配列を閲覧させる必要がある場合、登録者自身が配列をテキストファイルとして送付することで特に問題はございません。
登録状態、フラットファイルの記載を確認する意図の場合は、状況によりますが、下記の2つの方法が選択可能です。 -
公開されたデータを非公開に戻したい
- 更新
- DDBJ
- DRA
DDBJ
-
DDBJ に登録したデータを抹消したい
- 更新
- DDBJ
原則として、下記を満たす場合に限り対応可能です。
- 配列データが、かつて一度も公開されたことがない
- そのアクセッション番号が公表されていない
DDBJへのお問い合わせ より、以下の項目についてお知らせください。
-
登録を受け付けているデータの種類を教えてください
- 登録
- DDBJ
登録を受け付けているデータの種類は データベースと登録窓口 および 登録データ種別 にて、ご確認ください。
-
TPA (Third Party Data) の登録基準を満たす場合は登録可能です。
-
以下の登録方法があります。
- DDBJ 塩基配列登録システム (NSSS): web 経由のフォーム入力によるデータ送信
- Mass Submission System (MSS): 登録ファイルを送信
-
アミノ酸配列の登録方法を教えてください
- 登録
- DDBJ
通常、塩基配列データに CDS feature を記載することにより、アミノ酸配列を登録することが可能です。
ただし、塩基配列データに基づかないアミノ酸配列は DDBJ では受け付けておりません。
その場合は、UniProt へご登録ください。
UniProt への登録は,EBI のサイトから提供されている SPIN を利用して行うことができます。
登録に関する問い合わせ先は,datasubs@ebi.ac.uk です。 -
protein_id を取得するには、どうすればよいでしょうか
- 登録
- DDBJ
CDS feature によるアノテーションを記載した塩基配列データを登録することで、protein_id はデータ公開時に、DDBJ 側で自動的に割り当てられます。
-
EST アセンブルによって得られた配列データは登録可能でしょうか
- 登録
- DDBJ
EST アセンブルのみの登録は受け付けておりませんが、アセンブル前後のデータのセットであれば、TSA として登録を受け付けております。Transcriptome Project のデータ登録 をご参照ください。
アセンブル前の配列データ (primary entries) が、いわゆる次世代シークエンサに由来する場合は DDBJ sequence Read Archive (DRA) に、従来のシークエンサに由来する場合は Mass Submission System (MSS) から EST として登録してください。
その上で、de novo でも、map ベースでもアセンブル後の配列データを TSA として、MSS にて登録を受け付けます。 -
Organism qualifier に記載する生物名 の全般的な説明をご確認ください。
-
海水や土壌などから生物個体の単離・培養の過程を経ず,PCR, DGGE, あるいは,その他の方法で直接 分子を単離・決定された塩基配列は、ENVとは? – 環境サンプル をご参照ください。
organism qualifier に記載する生物名に関しましては、環境サンプル (environmental sample) をご参照ください。 -
organism qualifier に記載する生物名に関しましては、人工的に構築した配列 をご参照ください。
-
各 feature に experiment または inference という qualifier を用いて記載することが可能です。
-
学術論文などで DDBJ について引用いただける場合、通常は、Nucleic Acids Res. Database issue における DDBJ に関する最新論文の引用をお願いいたします。
-
公開予定日を設定して登録したデータが公開される際、DDBJ から何か連絡はありますか
- データの公開
- DDBJ
登録の際に公開予定日 (Hold Date)を設定した場合、データ公開原則 に従い公開されます。
公開作業が完了しますと、公開をお知らせするメールがコンタクトパーソンのメールアドレス宛に Subject: [DDBJ] Publicized your data で送信されます。
DDBJ からのメールを迷惑メールとしないように設定をお願いいたします。 -
別刷りを送る必要はありますか
- 更新
- 登録
- DDBJ
通常は別刷りをお送りいただく必要はありません。
ただし、作業上、必要な場合には別刷りの送付をお願いすることがあります。 -
ゲノム配列と mRNA 配列は決定した配列毎に独立に ご登録ください。
実験的に決定した配列を、その決定した連続性の単位で登録していただくことが基本です。
ゲノム配列側に mRNA feature, CDS feature などを記載することは可能ですが、一般的に feature 記載では mRNA 配列を決定したという意味にはなりません。
mRNA 配列を決定されているのでしたら、mRNA 配列のご登録をお願いします。DDBJ に登録可能なデータもご参照ください。 -
可能です、というよりも多くの雑誌の投稿規定において、投稿前に塩基配列登録を求められています。
論文の出版・公開に関する欄は下記のように選択してください。- 論文投稿の予定がない場合、あるいは、論文作成中・投稿中の場合には [Unpublished]
- 論文が受理されて印刷中の場合には [In Press]
-
DDBJ では、学術論文の投稿予定の有無に関わらず、塩基配列データ の登録を受け付けております。
投稿予定がない場合にも、REFERENCE には以下の項目が入力必須です。- status (論文の出版・公開等): [Unpublished]
- year (年): 仮の西暦年号 (入力中の年号)
- title: 仮のタイトルを英語で
- ab_name (authors): 仮の著者 (登録者と同じで可) を略記
-
論文の投稿規程に塩基配列登録の指定がない場合でも、読者の利便性を高めるという視点から、DDBJ を含む国際塩基配列データベースへ登録していただきますよう お願いいたします。
-
登録者は独りでも問題ありませんか?
- 登録
- DDBJ
塩基配列の修正・更新を行う権利を有するのは登録者のみです。
登録者が一人では、連絡が取れなくなる可能性がありますので、複数の方を登録者に指定いただくことを推奨しております。 -
GenBank へ登録しないといけませんか
- 登録
- DDBJ
公開された塩基配列データは DDBJ, EMBL-Bank, GenBank で共有されますので、登録は何れかへ1度のみで 必要十分です。
既に DDBJ に登録した配列を GenBank に登録した場合、重複登録になりますので 登録しないでください。 -
特許出願に関連する塩基配列を DDBJ に登録できますか
- 登録
- DDBJ
JPO への特許出願の際に提出された塩基配列は、出願している特許案件の内容公開、いわゆる出願公開の際に DDBJ へ転送・登録・公開される仕組が確立していますので、通常は、DDBJ へご登録いただく必要はありません。
-
DDBJ に登録すればデータに関する優先権は確保されますか
- 登録
- DDBJ
DDBJ に登録しても優先権は生じません。特許などの権利も生じません。
DDBJ では特許に関する業務を行う資格はありません。
特許申請に関しましては、特許庁 にお問い合わせください。 -
DDBJ には遺伝子命名などに関する権限ありません。また、特定の遺伝子命名管理団体との公式な協調も行っておりません。特に問題がない限り、登録者の意向に基づいて記述しています。
DDBJ への登録データで何らかの名称を記載しても、それぞれの生物または生物群を研究するコミュニティに受け入れられる保証はありません。 -
DNA 多型のデータはどのように記載して登録すれば良いでしょうか
- 登録
- DDBJ
多型関連研究における同一配列の代表データ登録 をご参照ください。
-
アミノ酸置換を伴う1塩基置換を記述する方法を教えてください?
- 登録
- DDBJ
一般的に variation feature を指定し replace と note qualifier を用いて記述します。
DDBJ 塩基配列登録システムの場合、template で other を選択してください。
書式は登録の見本にて F01) polymorphism and variation を参照してください。 -
SNP (Single Nucleotide Polymorphisms) を含む配列を DDBJ に登録することはできますが、dbSNP には反映されません。
dbSNPは 国際塩基配列データベースとは独立しており、NCBI が独自に運用しているデータペースです。
SNP データにつきましては dbSNP に登録されることをお薦めします。 -
例えば、全長が199035 bp で CDS feature の location が199001-100 までの場合、
join(199001..199035,1..100)
と記載してください。
その他、一般的な書式は Location の記述法をご確認ください。 -
全ゲノム配列を登録する際に、アノテーションは必要でしょうか
- 登録
- DDBJ
アノテーションは feature として、CDS (タンパク質コード配列),rRNA,tRNA などを記載していただくようお願いしております。
詳細は Mass Submission System への登録申し込みの際にお問い合わせください。 -
まず、The Genetic Codes にて遺伝暗号表が適切に選択されているか、ご確認ください。
通常は /transl_table qualifier に上記で示される番号が適切に記載されていれば、塩基配列からアミノ酸配列へ問題なく翻訳されます。 -
contact person は誰にすべきでしょうか
- 登録
- DDBJ
コンタクトパーソン (contact person) をご参照ください。
配列を決定した時点の所属と現在の所属が異なる場合、複数の機関に所属している場合などは、適宜、連絡が可能な代表を1つ記載してください。 -
- MSS の場合
- first name のみ記載してください。
登録の際、関連する警告 warning が出力されますが、問題はありませんので無視してください。
-
配列の登録者に連絡を取りたいのですが
- お問い合わせ
- DDBJ
個人情報保護の観点から、登録者が公開を希望しない限り、2007年末より連絡先を秘匿しております。
対象エントリの DDBJ フラットファイル上で REFERENCE 行に記載されている文献が確認可能でしたら、登録者の連絡先、あるいは、疑問点に対する回答が論文内に記載されている可能性がありますので、ご確認ください。
また、お問い合わせページの DDBJへのエントリ登録者へのお問い合わせ に必要な情報を入力していただければ、登録者へご連絡内容を転送いたします。 -
アクセッション番号の連絡がありませんが、データ送付してから番号発行まで何日かかりますか
- アクセッション番号
- DDBJ
登録内容に依存するため、アクセッション番号発行までにかかる日数を事前に明確に答えることはできません。5業務日を過ぎても登録内容に関する問い合わせ、あるいは、アクセッション番号の通知などがない場合は、コンタクトパーソンのメールアドレスを明記の上、DDBJへのお問い合わせ よりご連絡ください。
-
送付した配列データが登録されないということはあるのですか
- 登録
- DDBJ
DDBJ に登録可能なデータ および 登録を受け付けることができない配列 をご参照ください。
不明な点はDDBJへのお問い合わせ よりお願いいたします。 -
アクセッション番号を紛失してしまいました
- アクセッション番号
- DDBJ
EntryID などデータを特定できる ID がわかる場合、コンタクトパーソン (contact person)のメールアドレスと共に DDBJへのお問い合わせ よりご連絡ください。
不明な場合、以下の情報をわかる範囲で お知らせいただければ調査します。- 氏名
- 登録時の所属
- 現在の所属
- 登録時のメールアドレス
- 現在のメールアドレス
- 登録した時期
- 登録にご利用のツール
- 塩基配列、多数の場合、代表数件
- 生物学的特徴を示す情報
-
論文にアクセッション番号を記載するときのフォーマットはありますか
- アクセッション番号
- DDBJ
投稿を予定している雑誌などの規定に従っていただければ、通常は問題はありません。
-
セカンダリアクセッション番号とは何ですか
- アクセッション番号
- DDBJ
DDBJ を含む国際塩基配列データベースが、登録された塩基配列データに対して発行する番号をアクセッション番号 (accession number)と呼んでいます。
DDBJ 公開形式 (flat file)においては ACCESSION行に記載されています。 -
LOCUS 行の日付は何を表していますか
- 書式
- 検索
- DDBJ
そのデータの最終公開日を表します。
DDBJのデータ公開形式 (flat file) の説明の LOCUS をご覧ください。 -
これは、旧運用の journal scan の対義語で、登録者から直接登録を受け付けたデータであることを示しています。
REFERENCE 1 は登録者情報であり、文献情報ではありません。
文献相当の REFERENCE 2 以降では、タイトル欄に 「Direct Submission」 と入力しないようお願いいたします。 -
/translation qualifier で示されるアミノ酸配列の翻訳は間違いではないでしょうか
- 書式
- 検索
- 登録
- DDBJ
アミノ酸翻訳の仕様は国際塩基配列データベースの規約で決まっています。
当該 CDS feature がアミノ酸翻訳される際の遺伝暗号表は /transl_table qualifier に The Genetic Codes の番号で示されます。
よく誤解される点を3つ挙げておきます。 -
論文が公表されるまでデータを非公開にしたいのですが、その場合も公開予定日は必要ですか
- データの公開
- DDBJ
公開予定日が必要な理由をご参照ください。
登録後データを一定期間非公開にする場合は,必ず具体的な公開予定日を設定してください。 -
データが登録された日付を知りたい
- 書式
- 検索
- 登録
- DDBJ
受付日 (Accept Date) としてデータ公開形式 (flat file) の REFERENCE 1 の JOURNAL 行に記載されます。
ただし、この形式が採用される前に登録された古いデータに関しては記載がない場合があります。 -
未公開のデータを公開する条件を教えてください
- データの公開
- DDBJ
データ公開原則、ならびに 登録データの取り扱いについて をご覧ください。
-
公開されているはずのデータが検索できません
- 検索
- DDBJ
以下の可能性があります。
-
公開を取り消したデータが現在も参照できるのはなぜですか
- 検索
- DDBJ
一度公開されたエントリに対して一定の利用制限をかけることは、条件つきで可能です。
その場合は、次回以降に作成する定期リリースに当該データを含めないこととし、DDBJ 配下の通常検索サービスから削除することになります。
しかしながら、getentry を利用してアクセッション番号で検索した場合には、永久に閲覧が可能な状態になります。
※ ただし,国際塩基配列データベース側の作業ミスにより誤って公開された場合は,その限りではありません。
これは国際塩基配列データベースの諮問機関である国際諮問委員会が作成した 登録データの取扱いについて の中で,次のように明文化されています。 -
論文に掲載されているアクセッション番号が検索できません
- アクセッション番号
- DDBJ
-
最新データが最も早く参照できる検索サービスは何ですか
- 検索
- getentry
getentry です。
getentry はアクセッション番号等によりエントリを検索するシステムです。
通常、公開作業を行なった日の翌日にデータベース上に反映されます。 -
DDBJ は EMBL-Bank,GenBank と国際塩基配列データベースを共同構築しています。
DDBJ に登録されたデータは DDBJ から公開されますと、EMBL-Bank と GenBank に送られます。
配列データの遷移をご参照ください。
ただし、送られたデータは各データバンクの書式に変換して公開されます。 -
DDBJ/EMBL/GenBank で最新データが公開される時間的な差はどのくらいですか
- データの公開
- DDBJ
EMBL-Bank と GenBank から DDBJ に送られたデータは、通常、そのデータを受け取った当日に DDBJ で公開されます。
DDBJ から EMBL-Bank と GenBank に送ったデータは、通常、DDBJ で公開された日の、翌日か翌々日には EMBL-Bank と GenBank で公開されます。
ただし、各バンクとも大量件数のデータを受け取った場合やネットワークトラブル、システム保守等により公開が遅れることがあります。 また、公開のタイミングは各バンクで独立に管理しているため、時間差や公開日時を明確に示すことはできません。 -
アミノ酸配列 (/translation qualifier) は どのようにして入力するのでしょうか
- シークエンスデータ
- DDBJ
アミノ酸配列は塩基配列と CDS feature の location などから自動的に生成し、/translation qualifier に反映しています。通常は入力しないでください。
-
塩基配列登録システム (Nucleotide Sequence Submission System) は 画面の指示に従って逐次入力し、登録完了します。
Mass Submission System (MSS)では DDBJ の記述ルールに則った登録ファイルを登録者側で作成していただきます。
塩基配列登録システムは全てのデータに対応している訳ではありませんので、MSS を利用した登録が必須な場合があります。 -
Mass Submission System は何件から利用できるのですか
- Mass Submission System
- Submission
- System
- DDBJ
Mass Submission System (MSS) は件数が多い場合は もちろん、1件でも多数の feature を持つ場合、長大な配列の場合に適しています。
件数に制限はありませんし、件数以外の要素で MSS の利用が必須な場合があります。
登録ナビゲーション でご確認ください。
詳細は塩基配列登録の流れをご参照ください。 -
登録作業を中断したり再開したりするには、どうすれば良いですか
- 塩基配列登録システム
- DDBJ
入力の中断・再開方法 をご参照ください。
-
vector 配列のコンタミを除くには どうすればよいでしょうか
- シークエンスデータ
- DDBJ
塩基配列についてをご参照ください。
-
1つの塩基配列に複数の feature を記載する方法は?
- 塩基配列登録システム
- DDBJ
6. Template において a) other を選択して [Input annotation] をクリックするか、b) [Upload annotation file] をクリックしてください。
-
次の入力画面に進もうとしたところ、しばらく待ってもページが表示されません。
- 塩基配列登録システム
- DDBJ
まず、作業途中のページの URL を保存してください。
-
DEFINITION に相当する入力欄が見つかりません
- 塩基配列登録システム
- DDBJ
DEFINITION は記述ルールに従って DDBJ 側で作成しますので、入力欄はありません。
-
該当する feature がわかりません
- 登録
- DDBJ
念のため、feature の説明 と Feature Table Definition をご参照ください。
feature が不明な場合、misc_feature を選択し、/note qualifier に必要な情報を入力してください。 -
入力画面上に入力したい qualifier の欄がありません
- 塩基配列登録システム
- DDBJ
[Select Qualifier] をクリックし、必要な qualifier にチェックを入れて [Save] することで qualifier 入力欄が 7.Annotation の入力画面に追加されます。
-
"First codon [***] is not a start codon." / "Final codon [***] is not a stop codon." というエラーが表示されました
- 塩基配列登録システム
- DDBJ
これらの error message は CDS (protein coding sequence) feature のアミノ酸翻訳の結果が、5’末端 または 3’末端において適切ではなかったことを示しています。 当該 CDS が全長ではなく部分配列の場合、その feature location には部分配列であることを示すフラグが必要です。
部分配列の場合、location の記述法に示されている記載ルールに従い、5’ end not complete を示す “<”、3’ end not complete を示す “>” のフラグを適切に加えて入力してください。 -
"To use [translation] qualifier, [exception] qualifier is required in the [CDS] feature." というエラーが表示されました
- 塩基配列登録システム
- DDBJ
この error message は CDS feature において [Select Qualifier] で /translation を選択した場合に出力されます。
通常、/translation qualifier は CDS feature の情報を基に自動翻訳した結果を出力しますので、登録者側で記載する必要はありません。
/translation qualfier を削除することで、エラーは解消します。 -
このエラーは genetic code が正しく指定されていない場合に起こります。
7.Annotation – 生物名 (Organism name) をご参照ください。
genetic code には数値を入力して指定してください。
CDS feature を入力する際の /transl_table qualifier に反映されます。 -
"Value of [ codon_start ] is not 1, but [###..###] is 5' complete type." というエラーが表示されました
- 塩基配列登録システム
- DDBJ
Location、または、/codon_start の記述が正しくない可能性があります。
/codon_start の値が「2」 または「3」 の場合、CDS feature location は 5’ 側が部分配列指定になっている必要があります。 -
複数の塩基配列を入力する方法は?
- 塩基配列登録システム
- DDBJ
5.Sequence において、複数の塩基配列を multi-FASTA format で入力してください。連続したアクセッション番号を発行いたします。
7.Annotation に遷移した際に、各塩基配列に対する annotation をまとめて入力できるようになります。 -
画面を戻って入力済の内容を修正可能でしょうか
- 塩基配列登録システム
- DDBJ
登録を完了させる前であれば、可能です。
画面上部のプログレスバー内の 1.Contact person 2.Hold date 3.Submitter 4.Reference 5.Sequence 6.Template 7.Annotation を それぞれ クリックすることで各画面に戻り、修正することができます。 -
アノテーションファイルを upload することができません
- 塩基配列登録システム
- DDBJ
以下の点を確認の上、修正を行ってください
-
CDS feature の翻訳アミノ酸配列 (/translation qualifier) を確認する方法は?
- 塩基配列登録システム
- DDBJ
CDS features のアミノ酸配列を確認するには、以下の操作を行ってください。
-
"Stop codon ‘*’ is found in the range." というエラーが表示されました
- 塩基配列登録システム
- DDBJ
一般的な対応方法については 途中に出現する終止コドンへの対応 をご確認ください。
タンパク質コード配列; CDS feature について も ぜひ ご覧ください。
以下では代表的な事例について説明しています。 -
BioSample、DRA Experiment、Run とデータファイルとの関係は?
- メタデータの登録
- BioSample
- DRA
BioSample はデータベースに登録する実験データを得るために使われた生物学的な試料やサンプルに対して作成します。詳細はサンプルの粒度をご覧ください。
DRA のデータファイルは一つの BioSample にしかリンクできないことに注意してください。 -
MD5 チェックサムとは何でしょうか?
- シークエンスデータ
- DRA
DRA は MD5 チェックサムをアップロードされたファイルが破損されていないかどうかのチェックに使っています。
MD5 チェックサムは 32 桁の英数字 (例 bf4ac50dcd58bd2860dfac48c7fca348) です。こちらのページをご参照ください。 -
論文が公開されました
- 更新
- DDBJ
登録データの修正・更新申し込みの「論文が公開されました」よりお知らせください。
-
DDBJing 講習会について教えて下さい
- 講習会
- DDBJ
DDBJ では、DDBJ が提供するサービスを有効に活用して頂くために「DDBJing 講習会」を開催しています。
DDBJing 講習会の日程,場所などは決まり次第ホームページ等でお知らせします。
-
DDBJ の情報配信サービスにはどのようなものがありますか
- 配信サービス
- DDBJ
DDBJ の情報配信サービスは以下の通りです。
目的にあわせてご活用下さい。 -
DDBJ Mail Magazine(メールマガジン) の配信申込,変更,中止の方法
- 配信サービス
- DDBJ
DDBJ Mail Magazine のページから手続きができます。
-
「DDBJ 定期リリース後」とは具体的にいつですか
- DDBJリリース
- DDBJ
「DDBJ 新着データ(DDBJ 定期リリース後の新着データ)」は DDBJ 最新リリースの締め日の翌日以降に公開されたデータです。 最新リリースの締め日はリリースノートの文中に記述されています。 例えば,最新リリースが Release 67 の場合,以下のように2006年8月25日が締め日ですので,この時点の「DDBJ 新着データ」は8月26日以降公開されたデータになります。
-
期待している検索結果が得られません。検索方法が誤っているのでしょうか
- 検索
- 解析
- ARSA
- BLAST
- getentry
DDBJ/EMBL/GenBank は各データバンクに登録された配列を相互に交換しており, 総合的には基本的に同じデータを持っています。 ただし,各データバンクが公開したデータを互いに交換し合う際の時間差,更に各バンク内でそのデータを 検索サービスへ反映させる際の時間差により,同じ日の近い時間であっても検索サービスのデータには 微妙な差が存在している可能性があります。 期待している検索結果が得られないのは,これら時間差に負うところが大きいと思いますが, さらに詳細な調査が必要な場合はDDBJへのお問い合わせ よりご連絡ください。
-
DDBJ ではデータの検索・解析サービスを行なっていますか
- 検索
- 解析
- DDBJ
データの検索・解析は,下記の2つの方法がありますので,どうぞご利用下さい。
-
記載形式は雑誌により異なりますので,出版者にお問い合わせ下さい。
論文には各ツールの原著論文,DDBJ の遺伝子配列データ検索・解析ソフトを利用した旨を記載して下さい。各ツールの原著論文,関連論文は,DDBJ HP のサービスより、 関連論文をご覧下さい。
-
DDBJ の検索・解析ソフトの原著論文,関連論文を紹介して下さい
- 利用
- DDBJ
DDBJ HP のサービスより、 関連論文をご覧下さい。
-
クローンを配布して欲しい
- 利用
- DDBJ
DDBJ は塩基配列データベースですので,クローンの配布は行なっておりません。
直接,登録者へお問い合わせ下さい。 -
営利目的でなければ情報の引用に制限は設けませんが、引用しているサイト,その表示に関して DDBJ は責任を負いません。
引用の際には、DDBJ のホームページからの引用であることが分かるような形でご利用ください。 -
検索結果を後で見ることは可能ですか?
- 解析
- BLAST
- 検索結果は Request ID を入れた,下記の URL で表示できます。
- http://blast.ddbj.nig.ac.jp/blast/r/Request ID
-
検索結果の見方を教えてください
- 解析
- BLAST
検索結果は下記の順に出力されます。
- 相同性スコアの高い配列の順位表
- 相同な配列とのアラインメント
- パラメータと統計
-
入力した配列の一部が「N」(X) に置き換わってしまいました
- 解析
- BLAST
入力した配列が,BLAST プログラムによりフィルタリングされたためです。
フィルタリングにより,入力した配列のうち構造の複雑度が低い領域は “N”(アミノ酸配列の場合は “X”)に 置き換わります。 フィルタリングの詳細は,BLAST HELP の フィルター をご覧下さい。 フィルタリング機能を OFF にする場合は,設定画面の下の方にある「フィルター」オプションの ラジオボタンで OFF を選択して下さい。
なお,このオプションを OFF にすると検索時間が通常よりかかる場合がありますので,ご注意下さい。 -
検索結果の表示数が少ない(No Hit Found になってしまう)
- 解析
- BLAST
「検索結果一覧の表示数」,「アラインメント表示数」で指定した数より少ない場合,表示数を増やすには,”より詳細な設定” 欄の「期待値」の値を大きくしてお試し下さい。
このような場合は,期待数の値を10000 などと極端に大きくして下さい。
なお,配列が短すぎる場合(配列長が10 前後),BLAST では見つけられないことがよくあります。 -
DDBJ に登録されたデータ(アクセッション番号)へ直接リンクを張る方法はありますか。
- 検索
- getentry
DDBJ エントリへのリンク設定方法をご参照ください。
-
env_broad_scale, env_local_scale, env_medium の違いは?
- サンプル属性
- BioSample
これら三つのサンプル属性では生息している生物に影響する環境について記述します。
-
選択したツールのマニュアルを読んでいただき、該当オプションをセットして下さい(デフォルトでOKの場合は空欄のまま)。
オプション以外の文字を入れると実行時にエラーとなります。 -
必須のサンプル属性に対する値がない場合は?
- サンプル属性
- BioSample
値がない場合の記載方法をご覧ください。
-
BLAST の検索結果の表示順にはどのようなルールがありますか?
- 解析
- BLAST
BLAST の検索結果は相同性のスコアが高い順に表示されます。
スコアが同じ配列には優劣がつけられませんので,表示順に規則性はありません。 -
scp でファイルの転送ができません
- シークエンスデータ
- DRA
以下の基本的な点をご確認ください。
- scp 接続時にパスワードではなく鍵認証になっているかどうか
- D-way アカウントに登録した公開鍵と指定している秘密鍵がペアになっているかどうか
- 秘密鍵ファイルが読み込みを許可する権限設定になっているかどうか
- 秘密鍵ファイルの権限が他人がアクセスできないように設定されているかどうか?(例 rw——-)
- 鍵作成時に指定したパスフレーズを正しく入力しているかどうか
-
BioProject/BioSample/実験データの連動公開の仕組みは?
- データの公開
- BioProject
- BioSample
- DRA
- GEA
- MetaboBank
相互にリンクされている BioProject、BioSample、DDBJ、DRA、GEA と MetaboBank に登録されたデータの連動公開の仕組みは以下のようになっています。
-
DRA データファイルはどのように処理されますか?
- シークエンスデータ
- DRA
アップロードされたデータファイルは Run 単位で処理されます。Run にリンクしている全てのデータファイルから SRA toolkit によりバイナリーの SRA ファイルが作成されます。この過程でリード長やリード名の書式などが全ての配列に渡ってチェックされます。
元々のリード名は Run 単位でユニークである必要があります。 -
クエリ配列の長さを l 、データベースに保存されている配列の本数を n 、核酸あるいはアミノ酸同士の相似度を表すスコアを S としたとき、E value は次の式によって書き表さされます。(ただし、k 、m は正の定数です)
-
Validate data files ボタンをクリックできず検証処理を開始できません
- シークエンスデータ
- DRA
Run メタデータに記入された全てのデータファイルが DRA サーバにアップロードされると、”Validate data files” ボタンが活性化され、検証処理を開始することができるようになります。メタデータを投稿しステータスが “metadata_submitted” になった後でもボタンが不活化されている場合は、以下の点をチェックしてください。
- Run メタデータに記入した全てのデータファイルが DRA サーバにアップロードされているか?
- データファイルのファイル名に空白が含まれていないか?
- アップロードされたファイルがサブディレクトリに含まれていないか?
-
BioProject を更新するには?
- 更新
- BioProject
プロジェクトの更新や削除は BioProject チームに連絡してください。
-
BioSample を更新するには?
- 更新
- BioSample
サンプルの更新や削除は BioSample チームに連絡する必要があります。
BioSample が更新されると、D-way サンプル登録画面 ATTRIBUTES の属性ファイル (例 SSUB000001.txt) に反映されるので、ダウンロードして更新内容を確認することができます。 -
登録する塩基配列の長さに制限はありますか
- 登録
- DDBJ
- 上限
- 実際に観測される連続した配列であるならば、塩基配列長の上限はありません。
ただし、染色体を操作的に連結した配列のような場合は受け付けません。染色体毎に個別の配列として受け付けます。
全ゲノム規模の配列は、塩基配列登録システム (NSSS) ではなく、Mass Submission System (MSS) から登録をお願いします。
詳細は塩基配列登録の流れをご参照ください。
-
DDBJ では、SNV, CGH analysis, microarray, variation といったデータを扱う公的データベースが存在しませんが、NCBI または EBI にて登録が可能です。
適宜、下記へご登録ください。詳細は各データベースにお尋ねください。 -
WGS、TSA、TLSデータのFASTA形式のファイルを取得するにはどうしたらいいですか?
- 検索
- getentry
WGS、TSA、TLSデータのFASTA形式のファイルを取得するには、getentry で以下を指定し、検索を行ってください。
- ID:検索対象の Accession 番号を指定します。
- 出力形式:“全塩基配列 FASTA” を選択します。
- 取得方法:以下から選択します。
- html
- テキスト
- 圧縮ファイル(gz)
- 上限:データの取得上限を設定します。 0を指定すると上限なしの設定となります。 各項目の詳細は、getentry ヘルプ をご覧ください。
-
JGA サンプルで必須属性以外に記載すべき変数や表現型は?
- メタデータの登録
- JGA
JGA では Subject ID,Gender 等を必須フィールドにしています。
データ利用者が論文で報告された結果を再現するためには,解析で使用した主変数 (main variable,例: heart disease) と共変数 (co-variate,例:age,weight) を含めることが重要です。
最終的なゴールは,第三者が論文で出版された結果を再現するために必要なデータを含める,ということになります。 -
DDBJ JGA / NCBI dbGaP / EBI EGA 間ではデータを交換していません。
-
Submission可能な塩基配列の形式 (FASTA、multi-FASTA) について
- シークエンスデータ
- DDBJ
DDBJ塩基配列登録システム (NSSS)では、FASTA 形式(登録数が1配列の場合)または multi-FASTA 形式(登録数が複数配列の場合)の塩基配列を入力してください。
関連ページ: 塩基配列のフォーマットについて -
DDBJ サービス利用に対する謝辞の論文での記載方法は?
- 利用
- DDBJ
利用規約の該当箇所をご覧ください。
-
謝辞についてをご覧ください。
-
登録データの修正・更新申し込みフォームが表示されません
- お問い合わせ
- DDBJ
件名:次の項目から選択してください
-
問い合わせフォームが表示されません
- お問い合わせ
- DDBJ
以下の内容をメールでお送りください。
-
NCBI GEO と ArrayExpress 間での双方向のデータ交換は実現されていないため、結果として GEA のデータは GEO と交換されません。ArrayExpress は GEO の一部データの定期的な取り込みを実施していましたが現在は停止されています。
-
MSS の登録の流れを教えて下さい
- Mass Submission System
- DDBJ
「MSS 登録の流れ」にて、登録の手順の詳細をご確認ください。
-
配列ファイルのみ送付で塩基配列の登録は可能ですか
- Mass Submission System
- DDBJ
いいえ、配列ファイルのみでは登録できません。アノテーションファイルが必要です。
配列ファイル形式、アノテーションファイル形式をご確認ください。
こちらのサイトで、サンプルアノテーションをご覧ください。 -
査読者に非公開データを提供する方法は?
- システム
- データの公開
- DDBJ
- DRA
- GEA
- JGA
GEA では reviewer access で査読者にメタデータとマイクロアレイデータ、NGS の解析済みデータを提供することができます(サイズが大きいため DRA に登録した NGS の生データは含まれていません)。
-
sftp で JGA ファイルの転送ができません
- シークエンスデータ
- JGA
以下の点を確認してください。
-
波形データを登録できますか?
- シークエンスデータ
- DTA
- DRA
キャピラリ式シークエンサからの波形データ(クロマトグラム)を受付けていた DDBJ Trace Archive は SRA に統合される予定であるため、 基本的に波形データは受付けていません。塩基配列と Quality value から構成される生データを fastq ファイルとして DRA Experiment Instrument Model で Genetic Analyzer シリーズの機種を選択して DRA に登録してください。
-
投稿論文ではどのアクセッション番号を引用するべきでしょうか?
- アクセッション番号
- BioProject
- BioSample
- DDBJ
- DRA
- GEA
- MetaboBank
投稿する論文の規定に従ってください。
基本的には登録データに対するアクセッション番号、例えば DDBJ 塩基配列や DRA Run アクセッション番号、の引用を推奨します。
データ全体を言及する場合は BioProject アクセッション番号を引用します。ただし、論文中のデータと登録データが対応付けられるようにメタデータが記載されていることが必要です。 -
データ公開の依頼方法は?
- データの公開
- DDBJ
- BioProject
- BioSample
- DRA
- GEA
- MetaboBank
データ公開を希望する場合、DDBJ/DRA/GEA/MetaboBank データに対するアクセッション番号で公開対象を指定します。BioProject アクセッション番号のみが指定された場合、当該 BioProject のみが公開され、関連データは公開されません。同様に BioSample アクセッション番号のみが指定された場合、当該 BioSample のみが公開され、関連データは公開されません。
DDBJ/DRA/GEA/MetaboBank データが公開されると、参照されている BioProject と BioSample は連動して公開されます。
FAQ: BioProject/BioSample/塩基配列データの連動公開の仕組みは? -
Barcode of Life project に関連する塩基配列データは DDBJ に登録してください。
-
BioSample のサンプル属性ファイルをアップロードできません
- サンプル属性
- BioSample
Header must be enter with sample name
-
ホスト鍵不一致の警告が表示され ftp-private にアクセスできません
- データの転送
- BioProject
- BioSample
- DDBJ
- DRA
- GEA
2021年9月28日に BioProject/BioSample/DRA/GEA システムは新しいスパコンへ移行しました。
これに伴い ftp-private.ddbj.nig.ac.jp サーバのホスト鍵が変更になったため、ssh でデータをアップロードしようとすると、ホスト鍵不一致の警告が表示され、アクセスすることができない場合があります。 -
標準化合物やバッファー等の非生物にはどの taxonomy ID を使えばよいでしょうか?
- サンプル属性
- BioSample
メタボロミクス実験における標準化合物やバッファー等の非生物には以下の taxonomy ID を記載してください。
-
NCBI/ENA SRA データの fastq ファイルが見当たりません
- データのダウンロード
- DRA
ストレージ容量節約のため、2019年12月11日以降、DRA では NCBI/ENA SRA データの fastq ファイル生成を停止しております。DRA データの fastq 生成は継続しており、今後も継続します。
-
JGA データを復号できません
- 復号
- JGA
JGA データの復号で PuTTY 形式の秘密鍵を使用した場合、”Unable to load Private Key” というエラーになります。
秘密鍵を PuTTY 形式から OpenSSH 形式に変換し、OpenSSH 形式の秘密鍵を使用してください。利用申請に登録する公開鍵は OpenSSH/PuTTY どちらの形式にも対応しているため、公開鍵の形式変換は必要ありません。 -
非生物サンプルの生物名には何を選べばよいでしょうか?
- メタデータの登録
- BioSample
- MetaboBank
メタボロミクス実験などで非生物サンプルを解析することがあります。その場合、NCBI Taxonomy の metagenomes で該当する名前(metagenome を除いて考えてください)を選択します。以下にいくつかの例を示します。
-
ファイルのサイズが大きすぎたり、ファイル数が多すぎるため、MSS フォームからファイルを送ることができない場合はどのようにしたらよいでしょうか?
- Mass Submission System
- DDBJ
MSS form から登録ファイルを送信できない場合は、SFTP によるファイル転送を利用してください。
-
サンプルを安定同位体で標識した場合の記載方法は?
- メタデータの登録
- MetaboBank
同位体を代謝によってサンプルに取り込ませた場合
-
SRA のセカンダリアクセッション番号とは?
- アクセッション番号
- DRA
SRA では公開されている Run を別の Run に差し替えた場合、対応関係を記録するため、旧 Run 番号を新 Run 番号のセカンダリ番号にします。
例えば DRR046787 が DRR049544 に置き換わった場合、DRR049544 が primary、DRR046787 が secondary accession として XML では以下のように記載されます。 -
BioSample で適切な属性を探す方法は?
- サンプル属性
- BioSample
「移植先の組織」を記載するために適切な属性を探す場合を例に説明します。
-
古代 DNA サンプルの採取地と日付の記載方法は?
- 採取場所・日時
- BioSample
- DDBJ
古代 DNA サンプルの場所・日付として何が適切かは、どのような情報がサンプルから得た配列データの解釈において重要か、に依存します。 サンプルが採取された元々の場所と日付が分かっており、それらがデータの解釈上重要であれば、それらの情報を記載します。サンプルが博物館由来であり、元々の場所と日付が分かっていない場合、博物館の場所およびサンプル取得日が有益であれば、それらを記載します。該当する情報が存在しない場合、適切な missing value、例えば “not collected” を記入します。
-
場所と日付を提供できないケースで、適切な適用除外理由 (exemption term) が見当たらない場合は?
- 採取場所・日時
- BioSample
- DDBJ
-
配列データは INSDC に登録するが、全てのメタデータは2年後まで提供しない、と INSDC の新しいガイドライン策定前にコンソーシアムで合意しています。どうすればよいでしょうか?
- 採取場所・日時
- BioSample
- DDBJ
INSDC ではガイドライン策定以前の合意に基づいてメタデータを提供できない場合のための exemption term を用意しています。このケースでは、初回のサンプル登録において、以下のように記載してください。
- geo_loc_name (or /country) = missing: data agreement-established pre-2023
- collection date = missing: data agreement-established pre-2023
-
採取場所と日時のうち、片方しか記載できない場合は?
- 採取場所・日時
- BioSample
- DDBJ
このようなケースのための exemption term が missing value reporting standards で用意されています。例えば、ネガティブコントロールの塩基配列を決定するために、コントロールサンプルを得る場合があると思います。この場合、コントロールサンプルはラボ内で調製されているため、採取場所の報告義務は適用されません。しかし、コントロールサンプルを調整した日付は報告可能ですので、以下のようになります。
-
日本の静岡県で2023年5月5日 14:12:55 にサンプルを採取した場合の記載方法は?
- 採取場所・日時
- BioSample
- DDBJ
ISO8601 に従って採取日時を「年-月-日」形式で記載します。時間は協定世界時 (Coordinated Universal Time, UTC) で記述します。場所としては、国名と地域を関連属性に記載します。
-
系統保存機関から分譲された菌株を研究室で培養して得たサンプルの記載方法は?
- 採取場所・日時
- BioSample
- DDBJ
culture_collection に菌株 ID を所定書式で記載し、保存機関で記録されている元々の採取場所と日付を記載します。元々の採取場所や日付が分からない場合は、missing value の “not collected” を使用します。 研究室で長期間に渡って菌株を継代培養しており、その性質が変化している場合、シークエンス目的でサンプルを調整した日付を記載します。また、このケースにおいて、研究室の場所を記載することが適切ではない場合、exemption term の “missing: lab stock” を使用します。このようなケースでは description で「長期間に渡って分譲された菌株を継代培養しており、その性質が変化していること」を記載します。
-
自然環境ではない場所 (例 動物園や植物園) で生物種を採集した場合の記載方法は?
- 採取場所・日時
- BioSample
- DDBJ
自然環境ではない場所、例えば、博物館、動物園、水族館、植物園や農場、に生息している生き物からサンプルを採取した場合、場所と日付はサンプルから得られた配列データを解釈するうえで意味のあるものを記載します。これらのサンプルにおいて、博物館、動物園、水族館、植物園や農場といった場所がデータの解釈において重要であれば、これらの場所を記載します。そうではない場合は原産地を記載します。採取日についても同様です。
-
サンプルを太平洋で2010年に採取した場合の記載方法は?
- 採取場所・日時
- BioSample
- DDBJ
最低限必要な情報は、海洋や国の名前、および、最も近い年、です。 このケースでは最低限必要な情報は分かっているので、属性は以下のようになります。
- geo_loc_name (or /country) = Pacific Ocean
- collection_date = 2010