よくある質問
-
データファイルの検証処理エラーへの対処方法は?
- シークエンスデータ
- DRA
data excessive while validating formatter within short read archive module - cumulative length of reads data in file(s): 152 is greater than spot length declared in experiment: 76 in spot ‘xxxx’
-
アクセッション番号が届きません
- アクセッション番号
- DRA
D-way アカウントにログインし,Submission のステータスを確認してください。
-
BioProject アクセッション番号の記入箇所は?
- メタデータの登録
- DRA
2014年5月14日から Study の代わりに BioProject を登録するようになりました。DRA の登録システムで使用する BioProject アクセッション番号を選択します。
-
サンプルがバーコード配列によって区別されている場合のメタデータは?
- メタデータの登録
- DRA
シークエンスデータをサンプルごとに分割し,サンプルごとに BioSample-Experiment-Run として登録します。バーコード配列とサンプルの対応を記載したい場合は,Experiment の Library Construction Protocol にフリーテキストで記載します。
-
多件数のメタデータを作成するよい方法は?
- メタデータの登録
- DRA
Experiment や Run オブジェクトが多件数の場合、メタデータ用エクセルと XML 生成プログラムを使ってエクセルから XML を生成し、Submission/Experiment/Run XML を D-way からアップロードすることで多件数を登録することができます。詳細については GitHub ページをご覧ください。
-
公開されているデータをダウンロードする方法を教えてください
- データのダウンロード
- DRA
DDBJ ftp サーバ ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq からダウンロードしてください。
-
どのように公開予定日を変更したらいいのでしょうか?
- 更新
- DRA
登録ポータル “D-way” に登録アカウントでログインし,予定日を変更してください。
公開予定日は最長4年後まで指定でき,何度でも変更することが可能です。 -
論文情報を追加するには?
- 更新
- BioProject
- BioSample
- DRA
- DDBJ 塩基配列データ
- 登録データの修正・更新の当該項目を参照の上,登録データの修正・更新申し込みの「論文が公開されました」から担当者に連絡します。配列エントリのフラットファイルに論文情報が記載されます。
-
DRA で公開されている fastq のリード数が生データのそれよりも少ないのは何故でしょうか?
- データのダウンロード
- DRA
DRA では NCBI SRA Toolkit に含まれている fastq-dump を使い,以下のオプションで生データである SRA ファイルから fastq ファイルを作成しています。
fastq-dump -M 25 -E --skip-technical --split-3 -W <SRA file>
- -M 25: 25 塩基以上の配列のみを含める。デフォルトは 25。
- -E: リードの開始,もしくは終わりに 10 以上の N が存在しない
- --skip-technical: technical read を除き biological read のみを出力
- --split-3: ペアリードで最初と二番目の biological read をそれぞれ *_1.fastq と *_2.fastq として出力する。一つしか biological read が存在しない場合,*.fastq として出力する。
- -W: 指定されていた場合,left と right を clip する
上記の出力条件でリードがフィルタリング,トリミングされるため,一般的に fastq のリード数は SRA ファイルのそれよりも少なくなっています。フィルタリング,トリミングされていない fastq ファイルを得るには以下のコマンドで fastq を生成します。
fastq-dump -M 1 --split-3 <SRA file>
-
投稿論文にアクセッション番号を記載するときのフォーマットはありますか?
- アクセッション番号
- DRA
投稿を予定している雑誌などの,執筆規定に従ってください。
-
投稿論文では,どのアクセッション番号を引用するべきですか?
- アクセッション番号
- DRA
DRA 登録は以下のプレフィックスのオブジェクトから構成されます。 Prefix Letter List
-
文献情報以外の内容の更新や訂正は、原則として、登録者としてデータに登録されている方の了承、または依頼を受けて行ないます。
DDBJ からそのデータの登録者に,ご指摘の内容を転送することは可能です。
DDBJ へのエントリ登録者へのお問い合わせ より必要な情報をお知らせください。 -
登録したデータの内容を公開予定日より前に確認できますか
- 更新
- DDBJ
当該データの 登録者 としてご登録いただいている方からの依頼ならば可能です。
アクセッション番号を明記の上 DDBJへのお問い合わせ よりご依頼ください。 -
DDBJ 塩基配列登録システムを使って登録済みデータを修正できますか
- 塩基配列登録システム
- DDBJ
DDBJ 塩基配列登録システム はデータ登録専用のツールですので、登録済みデータの修正には対応していません。
修正・更新に関しましては 登録データの修正・更新 をご参照ください。 -
登録済で未公開の配列とアクセッション番号との対応がわからなくなりました
- アクセッション番号
- DDBJ
DDBJ へのお問い合わせ より,以下の情報をご連絡下さい。
- コンタクトパーソンのメールアドレス
- アクセッション番号またはEntryID
既にご登録をいただきました塩基配列に関する情報を返信でお知らせします。
-
現在公開されている配列の更新前の内容を参照できますか
- 検索
- getentry
getentry webAPI を使用して検索することが可能です。
-
DDBJ では配列データの更新予約は行っておりません。
そのため、既に公開されている配列データを更新する場合、作業完了後にはデータは、即時更新後の内容で再公開されます。 -
論文が受理されました
- 更新
- DDBJ
登録データの修正・更新申し込み の「論文が受理されました」より お知らせください。
-
コンタクトパーソン情報を変更したい
- 更新
- DDBJ
登録データの修正・更新申し込みの「コンタクトパーソン情報を変更したい」より お知らせください。
変更がない項目は現在の情報のみお知らせください。 -
配列を更新したい
- 更新
- DDBJ
依頼者のお名前、ご所属を明記の上、以下の項目について DDBJへのお問い合わせ よりお知らせください。nn
宛先:- アクセッション番号:
- 変更箇所:
- 更新後の総塩基数:
- 配列の更新に伴う Feature の塩基番号など、変更項目の詳細:
- 更新後の全長配列: 以下のフォーマットでお願いします。
>AB****** <--- 当該データのアクセッション番号
aaaaaaaaaattttttttttggggggggggccccccccccaaaaaaaaaatttttttttt
ggggggggggccccccccccaaaaaaaaaattttttttttggggggggggcccccccccc
//
>AB******
aaaaaaaaaattttttttttggggggggggccccccccccaaaaaaaaaatttttttttt
ggggggggggccccccccccaaaaaaaaaattttttttttggggggggggcccccccccc
aaaaaaaaaat
//- ヘッダ行; リダイレクション ">" のあとにスペースなしでアクセッション番号。
- 塩基配列; 半角60文字/行の fasta 類似フォーマットです。
- 終了フラグ; "//" を入力してください。
-
公開予定日を延期したい
- 更新
- DDBJ
登録データの修正・更新申し込み の「公開予定日を変更したい」より お知らせください。
-
修正・更新の対象となる件数が多い場合、配列の修正・更新に伴い feature/location/qualifier に多数の変更箇所がある場合などには、以下をご参照ください。
- (1) 対象データに共通する情報を同一の内容に変更する場合
- 例: 文献情報、登録者情報を変更したい、公開予定日を延期したい、など
原則として 登録データの修正・更新申し込み からご依頼ください。
- (2) 大量データのある一部の登録情報を全て異なる内容に変更する場合
- 例: クローン名、遺伝子名を全て変更したい、など
- (3) 登録内容を大幅に変更する場合
- 例: 配列の更新に伴って 30 以上ある Feature の全てを変更したい、など
(2) (3) の場合は、件数、訂正項目等について事前に、DDBJへのお問い合わせ よりお知らせください。
DDBJ で検討の上、お送りいただくファイル形式等について調整いたします。
なお、通常は数日以内に作業は完了いたしますが、対象データが非常に多数である場合には、通常よりもお時間をいただくことがあります。
修正・更新を伴う公開をご希望の場合は、特に余裕をもってお知らせください。 -
論文投稿の過程で査読者に登録した非公開塩基配列を見せたいのですが
- 更新
- DDBJ
DDBJ では パスワード認証等による限定的な公表の方法はご提供しておりません。
特定個人に非公開状態の塩基配列を閲覧させる必要がある場合、登録者自身が配列をテキストファイルとして送付することで特に問題はございません。
登録状態、フラットファイルの記載を確認する意図の場合は、状況によりますが、下記の2つの方法が選択可能です。- a) 公開
- この機会に公開して差し支えない場合、公開いたします。
公開すべきデータの全アクセッション番号をお知らせください。 - b) 査読者にフラットファイルを送付
- ご依頼いただければ、DDBJ から登録者に対して、フラットファイルを送付いたしますので、査読者などに参考資料としてご転送ください。
フラットファイルの確認が必要なデータの全アクセッション番号をお知らせください。
依頼者 (登録者) のお名前、ご所属を明記の上、DDBJへのお問い合わせ よりご連絡ください。
-
公開されたデータを非公開に戻したい
- 更新
- DDBJ
原則として、公開されたデータを非公開に戻すことはできません。
INSDC において一度公開されたエントリを DDBJ retrieval system: getentry を利用してアクセッション番号で検索した場合、永久に閲覧が可能な状態になります(INSDC 側の作業ミスにより誤って公開された場合は、その限りではありません)。ただし、配列データに大きな誤りがあるなど、問題が生じた場合には、配列データの利用に一定の制限 (対象配列データの相同性検索サービスからの削除など) をかけることができます。
依頼者のお名前、ご所属を明記の上、以下の項目について DDBJへのお問い合わせ よりお知らせください。
- アクセッション番号:
- 依頼理由:
- 新公開予定日: 半年後、4月頃といった曖昧な指定ではなく具体的な日付。
例: 2018/06/25
なお、公開を取消したデータの取り扱いにつきましては、以下をご参照ください。
-
DDBJ に登録したデータを抹消したい
- 更新
- DDBJ
原則として、下記を満たす場合に限り対応可能です。
- 配列データが、かつて一度も公開されたことがない
- そのアクセッション番号が公表されていない
DDBJへのお問い合わせ より、以下の項目についてお知らせください。
-
登録を受け付けているデータの種類を教えてください
- 登録
- DDBJ
登録を受け付けているデータの種類は 登録データ種別 にて、ご確認ください。
-
TPA (Third Party Data)の登録基準を満たす場合は登録可能です。
-
以下の登録方法があります。
- DDBJ 塩基配列登録システム (Nucleotide Sequence Submission System): web 経由のフォーム入力によるデータ送信
- Mass Submission System (MSS): 登録ファイルを送信
通常は DDBJ 塩基配列登録システムによる登録を推奨しています。
登録件数が非常に多い場合、多数の Feature を持つ場合、長大な配列の場合には MSS での登録が適しています。 -
アミノ酸配列の登録方法を教えてください
- 登録
- DDBJ
通常、塩基配列データに CDS feature を記載することにより、アミノ酸配列を登録することが可能です。
ただし、塩基配列データに基づかないアミノ酸配列は DDBJ では受け付けておりません。
その場合は、UniProt へご登録ください。
UniProt への登録は,EBI のサイトから提供されている SPIN を利用して行うことができます。
登録に関する問い合わせ先は,datasubs@ebi.ac.uk です。 -
protein_id を取得するには、どうすればよいでしょうか
- 登録
- DDBJ
CDS feature によるアノテーションを記載した塩基配列データを登録することで、protein_id はデータ公開時に、DDBJ 側で自動的に割り当てられます。
-
EST アセンブルによって得られた配列データは登録可能でしょうか
- 登録
- DDBJ
EST アセンブルのみの登録は受け付けておりませんが、アセンブル前後のデータのセットであれば、TSA として登録を受け付けております。Transcriptome Project のデータ登録 をご参照ください。
アセンブル前の配列データ (primary entries) が、いわゆる次世代シークエンサに由来する場合は DDBJ sequence Read Archive (DRA) に、従来のシークエンサに由来する場合はMass Submission System (MSS) から EST として登録してください。
その上で、de novo でも、map ベースでもアセンブル後の配列データを TSA として、MSS にて登録を受け付けます。 -
Organism qualifier に記載する生物名 の全般的な説明をご確認ください。
2. 種が同定されていない場合 (新種提唱も含む)
3. 環境サンプル (environmental sample)
の何れかであろうと思われます。適宜、ご参照ください。 -
海水や土壌などから生物個体の単離・培養の過程を経ず,PCR, DGGE, あるいは,その他の方法で直接 分子を単離・決定された塩基配列は、ENVとは? – 環境サンプル をご参照ください。
organism qualifier に記載する生物名に関しましては、環境サンプル (environmental sample) をご参照ください。なお、よく混同されますが、環境サンプルとは「野生型」という意味ではありません。配列の由来が単離・培養されている個体であれば、環境サンプルとは扱いません。
-
organism qualifier に記載する生物名に関しましては、人工的に構築した配列 をご参照ください。
-
各 feature に experiment または inference という qualifier を用いて記載することが可能です。
-
次世代シークエンサによって決定された配列は、どのように登録すればよいでしょうか
- 登録
- DDBJ
- DRA
登録データ種別 をご参照ください。
次世代シークエンサによって決定された配列 (raw reads) については DDBJ sequence Read Archive への登録をお願いします。
また、適宜、Genome Project のデータ登録、Transcriptome Project のデータ登録 もご参照ください。
必要に応じて、アセンブル後の配列データを Mass Submission System にて、ご登録ください。 -
配列による発現定量のデータにつきましては、raw reads を DDBJ Sequence Read Archive に ご登録ください。
-
Barcode of Life project に関連する塩基配列データは DDBJ 塩基配列登録システム または Mass Submission System でご登録をお願いいたします。
波形データにつきましては、DDBJ Trace Archive へのご登録をお願いいたします。 -
学術論文などで DDBJ について引用いただける場合、通常は、Nucleic Acids Res. Database issue における DDBJ に関する最新論文の引用をお願いいたします。
-
公開予定日を設定して登録したデータが公開される際、DDBJ から何か連絡はありますか
- データの公開
- DDBJ
登録の際に公開予定日 (Hold Date)を設定した場合、データ公開原則 に従い公開されます。
公開作業が完了しますと、公開をお知らせするメールがコンタクトパーソンのメールアドレス宛に Subject: [DDBJ] Publicized your data で送信されます。
DDBJ からのメールを迷惑メールとしないように設定をお願いいたします。 -
別刷りを送る必要はありますか
- 更新
- 登録
- DDBJ
通常は別刷りをお送りいただく必要はありません。
ただし、作業上、必要な場合には別刷りの送付をお願いすることがあります。 -
ゲノム配列と mRNA 配列は決定した配列毎に独立に ご登録ください。
実験的に決定した配列を、その決定した連続性の単位で登録していただくことが基本です。
ゲノム配列側に mRNA feature, CDS feature などを記載することは可能ですが、一般的に feature 記載では mRNA 配列を決定したという意味にはなりません。
mRNA 配列を決定されているのでしたら、mRNA 配列のご登録をお願いします。DDBJ に登録可能なデータもご参照ください。 -
可能です、というよりも多くの雑誌の投稿規定において、投稿前に塩基配列登録を求められています。
論文の出版・公開に関する欄は下記のように選択してください。- 論文投稿の予定がない場合、あるいは、論文作成中・投稿中の場合には [Unpublished]
- 論文が受理されて印刷中の場合には [In Press]
文献情報は DDBJ のデータ公開形式 (flat file) の REFERENCE 2 以降に表示されます。
-
DDBJ では、学術論文の投稿予定の有無に関わらず、塩基配列データ の登録を受け付けております。
投稿予定がない場合にも、REFERENCE には以下の項目が入力必須です。- status (論文の出版・公開等): [Unpublished]
- year (年): 仮の西暦年号 (入力中の年号)
- title: 仮のタイトルを英語で
- ab_name (authors): 仮の著者 (登録者と同じで可) を略記
また、データ登録後に論文が公表された際は、論文情報を 登録データの修正・更新申し込みの「論文が公開されました」よりご連絡ください。
-
登録者は独りでも問題ありませんか?
- 登録
- DDBJ
塩基配列の修正・更新を行う権利を有するのは登録者のみです。
登録者が一人では、連絡が取れなくなる可能性がありますので、複数の方を登録者に指定いただくことを推奨しております。参考: 塩基配列データの登録に必要な情報
-
GenBank へ登録しないといけませんか
- 登録
- DDBJ
公開された塩基配列データは DDBJ, EMBL-Bank, GenBank で共有されますので、登録は何れかへ1度のみで 必要十分です。
既に DDBJ に登録した配列を GenBank に登録した場合、重複登録になりますので 登録しないでください。雑誌によっては「GenBank へ塩基配列を登録するように」と案内されている場合もありますが、DDBJ が発行したアクセッション番号は GenBank を含む 国際塩基配列データベースに共通です。
-
特許出願に関連する塩基配列を DDBJ に登録できますか
- 登録
- DDBJ
JPO への特許出願の際に提出された塩基配列は、出願している特許案件の内容公開、いわゆる出願公開の際に DDBJ へ転送・登録・公開される仕組が確立していますので、通常は、DDBJ へご登録いただく必要はありません。
もし、論文投稿の関係などで、特許出願と並行してアクセッション番号の取得が必要な場合は、特許取得に支障がないか、まずは特許庁へ直接ご確認をお願いいたします。その後でDDBJ へその旨を添えてご登録ください。
塩基配列データがDDBJ から公開された場合、「公知」の扱いになりますので注意が必要です。
-
DDBJ に登録すればデータに関する優先権は確保されますか
- 登録
- DDBJ
DDBJ に登録しても優先権は生じません。特許などの権利も生じません。
DDBJ では特許に関する業務を行う資格はありません。特許申請に関しましては、特許庁 にお問い合わせください。- 参考
-
DDBJ には遺伝子命名などに関する権限ありません。また、特定の遺伝子命名管理団体との公式な協調も行っておりません。特に問題がない限り、登録者の意向に基づいて記述しています。
DDBJ への登録データで何らかの名称を記載しても、それぞれの生物または生物群を研究するコミュニティに受け入れられる保証はありません。 -
DNA 多型のデータはどのように記載して登録すれば良いでしょうか
- 登録
- DDBJ
-
アミノ酸置換を伴う1塩基置換を記述する方法を教えてください?
- 登録
- DDBJ
一般的に variation feature を指定し replace と note qualifier を用いて記述します。
DDBJ 塩基配列登録システムの場合、template で other を選択してください。
書式は登録の見本にて F01) polymorphism and variation を参照してください。 -
SNP (Single Nucleotide Polymorphisms) を含む配列を DDBJ に登録することはできますが、dbSNP には反映されません。
dbSNPは 国際塩基配列データベースとは独立しており、NCBI が独自に運用しているデータペースです。
SNP データにつきましては dbSNP に登録されることをお薦めします。DDBJ に登録する場合の書式に関しましては、登録の見本 の B13) polymorphism and variation をご参照ください。
-
例えば、全長が199035 bp で CDS feature の location が199001-100 までの場合、
join(199001..199035,1..100)
と記載してください。
その他、一般的な書式は Location の記述法をご確認ください。 -
全ゲノム配列を登録する際に、アノテーションは必要でしょうか
- 登録
- DDBJ
アノテーションは feature として、CDS (タンパク質コード配列),rRNA,tRNA などを記載していただくようお願いしております。
詳細は Mass Submission System への登録申し込みの際にお問い合わせください。 -
まず、The Genetic Codes にて遺伝暗号表が適切に選択されているか、ご確認ください。
通常は /transl_table qualifier に上記で示される番号が適切に記載されていれば、塩基配列からアミノ酸配列へ問題なく翻訳されます。 -
contact person は誰にすべきでしょうか
- 登録
- DDBJ
コンタクトパーソン (contact person) をご参照ください。
配列を決定した時点の所属と現在の所属が異なる場合、複数の機関に所属している場合などは、適宜、連絡が可能な代表を1つ記載してください。 -
- MSS の場合
- first name のみ記載してください。
登録の際、関連する警告 warning が出力されますが、問題はありませんので無視してください。 - 塩基配列登録システムの場合
- first name に加えてダミーの頭文字を記載してください。
最終確認画面の通信欄 (Submission Information) において、その旨、お知らせください。
-
配列の登録者に連絡を取りたいのですが
- お問い合わせ
- DDBJ
個人情報保護の観点から、登録者が公開を希望しない限り、2007年末より連絡先を秘匿しております。
対象エントリの DDBJ フラットファイル上で REFERENCE 行に記載されている文献が確認可能でしたら、登録者の連絡先、あるいは、疑問点に対する回答が論文内に記載されている可能性がありますので、ご確認ください。
また、お問い合わせページの DDBJへのエントリ登録者へのお問い合わせ に必要な情報を入力していただければ、登録者へご連絡内容を転送いたします。 -
アクセッション番号の連絡がありませんが、データ送付後 番号発行まで何日かかりますか
- アクセッション番号
- DDBJ
登録いただく内容に依存しますので、アクセッション番号発行までにかかる日数を明確に答えることはできません。5業務日を過ぎても登録内容に関する問い合わせ、あるいは、アクセッション番号の通知などがない場合は、コンタクトパーソンのメールアドレスを明記の上、DDBJへのお問い合わせ よりご連絡ください。
-
送付した配列データが登録されないということはあるのですか
- 登録
- DDBJ
DDBJ に登録可能なデータ をご参照ください。
不明な点はDDBJへのお問い合わせ よりお願いいたします。 -
アクセッション番号を紛失してしまいました
- アクセッション番号
- DDBJ
EntryID などデータを特定できる ID がわかる場合、コンタクトパーソン (contact person)のメールアドレスと共に DDBJへのお問い合わせ よりご連絡ください。
不明な場合、以下の情報をわかる範囲で お知らせいただければ調査します。- 氏名
- 登録時の所属
- 現在の所属
- 登録時のメールアドレス
- 現在のメールアドレス
- 登録した時期
- 登録にご利用のツール
- 塩基配列、多数の場合、代表数件
- 生物学的特徴を示す情報
該当するデータが不明の場合、新規に登録いただくこともあります。
-
論文にアクセッション番号を記載するときのフォーマットはありますか
- アクセッション番号
- DDBJ
投稿を予定している雑誌などの規定に従っていただければ、通常は問題はありません。
-
セカンダリアクセッション番号とは何ですか
- アクセッション番号
- DDBJ
DDBJ を含む国際塩基配列データベース が、登録された塩基配列データに対して発行する番号をアクセッション番号 (accession number) と呼んでいます。
DDBJ 公開形式 (flat file) においては ACCESSION 行に記載されています。複数エントリの統合、大幅な内容変更など、既に登録された塩基配列の更新に相当する場合でも、新規に登録し直して アクセッション番号を発行することがあります。 この際に、新規のアクセッション番号 (プライマリアクセッション番号) に対して、既存のアクセッション番号をセカンダリアクセッション番号とすることがあります。
flat file には、先頭にプライマリアクセッション番号、2つ目以降にセカンダリアクセッション番号を記載します。
例ACCESSION AB999999 AB888888 AB777777
- AB999999 -- primary accession number
- AB888888 AB777777 -- secondary accession number
通常は、プライマリアクセッション番号とセカンダリアクセッション番号のどちらで検索しても、変更後のデータが返ります。
ただし、セカンダリアクセッション番号のエントリが既に公開済みの場合、データベース上から抹消される訳ではありませんので、getentry では、直接番号を指定することで検索と閲覧が可能です。
-
LOCUS 行の日付は何を表していますか
- 書式
- 検索
- DDBJ
そのデータの最終公開日を表します。 DDBJのデータ公開形式 (flat file) の説明の LOCUS をご覧ください。
-
これは、旧運用の journal scan の対義語で、登録者から直接登録を受け付けたデータであることを示しています。
REFERENCE 1 は登録者情報であり、文献情報ではありません。
文献相当の REFERENCE 2 以降では、タイトル欄に「Direct Submission」と入力しないようお願いいたします。 -
/translation qualifier で示されるアミノ酸配列の翻訳は間違いではないでしょうか
- 書式
- 検索
- 登録
- DDBJ
アミノ酸翻訳の仕様は国際塩基配列データベースの規約で決まっています。
当該 CDS feature がアミノ酸翻訳される際の遺伝暗号表は /transl_table qualifier に The Genetic Codes の番号で示されます。
よく誤解される点を3つ挙げておきます。- オルガネラ; /organelle qualifier を指定しなければ、ミトコンドリアなどの genetic code が正しく反映されません。
- 開始コドンと扱う場合は M Met メチオニンと扱います。G あるいは V にはなりません。
参照; Start codon, N-Formylmethionine - コドン縮重により、2塩基でも翻訳アミノ酸が一意に決定可能な場合は出力します。
また、RNA editing に代表される特殊な例外の記載もあります。
-
論文が公表されるまでデータを非公開にしたいのですが、その場合も公開予定日は必要ですか
- データの公開
- DDBJ
公開予定日が必要な理由をご参照ください。登録後データを一定期間非公開にする場合は,必ず具体的な公開予定日を設定してください。
公開予定日に特に制限は設けておりませんが、1年から2年程度までを目安に余裕をもった日付をご指定ください。 指定しない場合は即時公開となりますのでご注意ください。
なお、一度指定した公開予定日を変更する、または公開予定日前に公開することも可能です。
登録データの修正・更新申し込み の「公開予定日を変更したい」より お知らせください。 -
データが登録された日付を知りたい
- 書式
- 検索
- 登録
- DDBJ
受付日 (Accept Date) としてデータ公開形式 (flat file) の REFERENCE 1 の JOURNAL 行に記載されます。
ただし、この形式が採用される前に登録された古いデータに関しては記載がない場合があります。 -
未公開のデータを公開する条件を教えてください
- データの公開
- DDBJ
データ公開原則、ならびに 登録データの取り扱いについて をご覧ください。
-
公開されているはずのデータが検索できません
- 検索
- DDBJ
以下の可能性があります。
-
公開を取り消したデータが現在も参照できるのはなぜですか
- 検索
- DDBJ
一度公開されたエントリに対して一定の利用制限をかけることは、条件つきで可能です。
その場合は、次回以降に作成する定期リリースに当該データを含めないこととし、DDBJ 配下の通常検索サービスから削除することになります。
しかしながら、getentry を利用してアクセッション番号で検索した場合には、永久に閲覧が可能な状態になります。
# ただし,国際塩基配列データベース側の作業ミスにより誤って公開された場合は,その限りではありません。
これは国際塩基配列データベースの諮問機関である国際諮問委員会が作成した 登録データの取扱いについて の中で,次のように明文化されています。
INSD に登録されたデータは,科学資料として永久に保存され公開される。登録者によるデータの訂正や更新は歓迎するし, 誤った部分は次のデータリリースで訂正されるべきであるが,全てのデータは永久に保存され,アクセッション番号で検索できるものとする。
また、不特定多数の機関が国際塩基配列データベースを随時コピーして独自のデータベースを構築しております。
これらのデータベースからの削除は DDBJ ではサポートできかねます。それぞれの管理者へ直接、ご依頼いただくことになります。 -
論文に掲載されているアクセッション番号が検索できません
- アクセッション番号
- DDBJ
-
最新データが最も早く参照できる検索サービスは何ですか
- 検索
- getentry
getentry です。
getentry はアクセッション番号等によりエントリを検索するシステムです。
通常、公開作業を行なった日の翌日にデータベース上に反映されます。 -
DDBJ は EMBL-Bank,GenBank と国際塩基配列データベースを共同構築しています。
DDBJ に登録されたデータは DDBJ から公開されますと、EMBL-Bank と GenBank に送られます。
配列データの遷移をご参照ください。
ただし、送られたデータは各データバンクの書式に変換して公開されます。 -
DDBJ/EMBL/GenBank で最新データが公開される時間的な差はどのくらいですか
- データの公開
- DDBJ
EMBL-Bank と GenBank から DDBJ に送られたデータは、通常、そのデータを受け取った当日に DDBJ で公開されます。
DDBJ から EMBL-Bank と GenBank に送ったデータは、通常、DDBJ で公開された日の、翌日か翌々日には EMBL-Bank と GenBank で公開されます。
ただし、各バンクとも大量件数のデータを受け取った場合やネットワークトラブル、システム保守等により公開が遅れることがあります。 また、公開のタイミングは各バンクで独立に管理しているため、時間差や公開日時を明確に示すことはできません。 -
塩基配列登録にはいくつのサンプルが必要ですか?
- メタデータの登録
- BioSample
- DRA
BioSample はデータベースに登録する実験データを得るために使われた生物学的な試料やサンプルに対するレコードです。Biological/Technical replicate は BioSample で "replicate" というユーザ定義の属性を使い "replicate = biological replicate 1" のようにしてサンプルを区別します。
それぞれに採取された,物理的に異なる環境サンプルはユニークな BioSampleになりますが,サンプルに含まれる配列によって由来が区別されたリードは BioSample に該当しません。 DRA のデータファイルは一つのBioSample にしかリンクできないことに注意してください。
基本的な考え方:
- それぞれのユニークな source に対して別々の BioSample を登録します。例えば,羽から調整した RNA と肢から調整した RNA は,両者が別々にシークエンスされている場合,別個の BioSample になります。
- ゲノムアセンブリは一つの BioSample のみ持つことができます。複数の BioSample に由来するリードをアセンブルして得られたゲノム配列の場合,アセンブルのために他の BioSample が使われたことを示す1つの BioSample を新しく登録します。
例えば,オスとメスに由来するリードをそれぞれ DRA に登録したが,両者のリードを用いてゲノムをアセンブルした場合,オスとメスに対する一つの BioSample を新しく登録し,オスとメスそれぞれに対する BioSample アクセッション番号を引用して,両 BioSample の混合サンプルであることを明示します。そのようなゲノム登録の例。 - 内部共生体 (endosymbiont) の場合: ゲノム単位で BioSample を登録する必要があるため,例えば昆虫と内部共生体の両方のゲノムを登録する場合,それぞれの BioSample が必要になります。
サンプルの登録例:
- 海水中のある採取地点から得られた 23,000 本のユニークな 16S 増幅配列 - 1 BioSample(1サンプルが採取され,16S の多様性が解析された)
- 同じ薬物で処理された三匹の「同一」なトランスジェニックマウス - 3 BioSamples(Biological/Technical replicate は BioSample で区別)
- 遺伝子発現レベルの経時的な変化を解析するために,ウイルスに感染させた CHO 細胞を 0,2,4,8 時間後にサンプリング - 4 BioSamples (4 timepoints)
- 発現している遺伝子の差異を組織毎に調べるため,オスのアリクイ一個体から採取した脳,心臓,肺,精巣,肝臓 - 5 BioSamples (5つの異なる組織)
-
アミノ酸配列 (/translation qualifier) は どのようにして入力するのでしょうか
- シークエンスデータ
- DDBJ
アミノ酸配列は塩基配列と CDS feature の location などから自動的に生成し、/translation qualifier に反映しています。通常は入力しないでください。
-
塩基配列登録システム (Nucleotide Sequence Submission System) は 画面の指示に従って逐次入力し、登録完了します。
Mass Submission System (MSS)では 登録者に全件の登録ファイルを作成していただきます。 また、塩基配列登録システムと異なりファイル作成の段階で DDBJ の記述ルールに照らして査定しますので、DDBJ の担当者と直接やり取りをしていただくことになります。 多件数でも 塩基配列登録システムの template を使用した登録の方が容易という方も、数件でも MSS をご利用される方もおられます。
双方の特徴をご理解いただき、登録システムをご選択ください。 -
Mass Submission System は何件から利用できるのですか
- Mass Submission System
- Submission
- System
- DDBJ
件数に制限はありません。
件数が多い場合は もちろん、1件でも多数の feature を持つ場合、長大な配列の場合に適しています。
登録をご希望の場合は,Mass Submission System をご参照ください。 -
BioProject/BioSample 番号の DRA 登録での指定方法は?
- メタデータの登録
- BioProject
- BioSample
- DRA
BioProject と BioSample の投稿を始めると,それぞれに対して一時的なトラッキング用 ID である PSUB/SSUB 番号が割り振られますが,これらは正式なアクセッション番号ではありません。
BioProject の登録が完了すると PRJDB で始まるアクセッション番号が,BioSample の登録が完了すると,それぞれのサンプルに対して SAMD で始まるアクセッション番号が発行されます。
DRA 登録の過程では,PSUB もしくは PRJDB 番号で BioProject を,そして SSUB + sample name もしくは SAMD 番号で BioSample を指定します。DRA のデータファイルは一つの BioSample にしかリンクされないことに注意してください。
共同研究でサンプル調整とシークエンシングが別の組織で行われた場合など,他の登録アカウントで取得された BioProject と BioSample ID を DRA から参照することができます。アカウントをまたがった参照を希望する場合は DRA チームまでご連絡ください。アカウントをまたがる場合は BioProject,BioSample と DRA 間での連動公開にご注意ください。
-
登録作業を中断したり再開したりするには、どうすれば良いですか
- 塩基配列登録システム
- DDBJ
入力の中断・再開方法 をご参照ください。
-
vector 配列のコンタミを除くには どうすればよいでしょうか
- シークエンスデータ
- DDBJ
塩基配列登録の前にをご参照ください。
-
1つの塩基配列に複数の feature を記載する方法は?
- 塩基配列登録システム
- DDBJ
6. Template において a) other を選択して [Input annotation] をクリックするか、b) [Upload annotation file] をクリックしてください。
-
次の入力画面に進もうとしたところ、しばらく待ってもページが表示されません。
- 塩基配列登録システム
- DDBJ
まず、作業途中のページの URL を保存してください。
-
DEFINITION に相当する入力欄が見つかりません
- 塩基配列登録システム
- DDBJ
DEFINITION は記述ルールに従って DDBJ 側で作成しますので、入力欄はありません。
-
該当する feature がわかりません
- 登録
- DDBJ
念のため、feature の説明 と Feature Table Definition をご参照ください。
feature が不明な場合、misc_feature を選択し、/note qualifier に必要な情報を入力してください。 -
入力画面上に入力したい qualifier の欄がありません
- 塩基配列登録システム
- DDBJ
[Select Qualifier] をクリックし、必要な qualifier にチェックを入れて [Save] することで qualifier 入力欄が 7.Annotation の入力画面に追加されます。
-
"First codon [***] is not a start codon." / "Final codon [***] is not a stop codon." というエラーが表示されました
- 塩基配列登録システム
- DDBJ
これらの error message は CDS (protein coding sequence) feature のアミノ酸翻訳の結果が、5’末端 または 3’末端において適切ではなかったことを示しています。 当該 CDS が全長ではなく部分配列の場合、その feature location には部分配列であることを示すフラグが必要です。
部分配列の場合、location の記述法に示されている記載ルールに従い、5’ end not complete を示す “<”、3’ end not complete を示す “>” のフラグを適切に加えて入力してください。 -
"To use [translation] qualifier, [exception] qualifier is required in the [CDS] feature." というエラーが表示されました
- 塩基配列登録システム
- DDBJ
この error message は CDS feature において [Select Qualifier] で /translation を選択した場合に出力されます。
通常、/translation qualifier は CDS feature の情報を基に自動翻訳した結果を出力しますので、登録者側で記載する必要はありません。
/translation qualfier を削除することで、エラーは解消します。 -
このエラーは genetic code が正しく指定されていない場合に起こります。
7.Annotation – 生物名 (Organism name) をご参照ください。
genetic code には数値を入力して指定してください。
CDS feature を入力する際の /transl_table qualifier に反映されます。 -
"Value of [ codon_start ] is not 1, but [###..###] is 5' complete type." というエラーが表示されました
- 塩基配列登録システム
- DDBJ
Location、または、/codon_start の記述が正しくない可能性があります。
/codon_start の値が「2」 または「3」 の場合、CDS feature location は 5’ 側が部分配列指定になっている必要があります。 -
複数の塩基配列を入力する方法は?
- 塩基配列登録システム
- DDBJ
5.Sequence において、複数の塩基配列を multi-FASTA format で入力してください。連続したアクセッション番号を発行いたします。
7.Annotation に遷移した際に、各塩基配列に対する annotation をまとめて入力できるようになります。- 注意
- ※ 次の各情報については塩基配列ごとに異なる内容を記載することができなくなります。すべて同一であることが必要です。
- コンタクトパーソン情報
- 公開予定日
- 登録者
- 論文情報
- ※ 6.Template において各塩基配列に異なるアノテーション入力用テンプレートを指定することはできません。選択できるテンプレートは1つのみです。
-
画面を戻って入力済の内容を修正可能でしょうか
- 塩基配列登録システム
- DDBJ
登録を完了させる前であれば、可能です。
画面上部のプログレスバー内の 1.Contact person 2.Hold date 3.Submitter 4.Reference 5.Sequence 6.Template 7.Annotation を それぞれ クリックすることで各画面に戻り、修正することができます。
- 注意
- 7.Annotation の画面でアノテーションを入力後、以下の操作を行うと入力したアノテーションが消去される仕様になっております。
- 5.Sequence 画面に戻って配列を変更する
- 6.Template 画面に戻ってテンプレートを変更する
-
アノテーションファイルを upload することができません
- 塩基配列登録システム
- DDBJ
以下の点を確認の上、修正を行ってください
-
CDS feature の翻訳アミノ酸配列 (/translation qualifier) を確認する方法は?
- 塩基配列登録システム
- DDBJ
CDS features のアミノ酸配列を確認するには、以下の操作を行ってください。
-
"Stop codon ‘*’ is found in the range." というエラーが表示されました
- 塩基配列登録システム
- DDBJ
一般的な対応方法については 途中に出現する終止コドンへの対応 をご確認ください。
タンパク質コード配列; CDS feature について も ぜひ ご覧ください。
以下では代表的な事例について説明しています。 -
BioSample,DRA Experiment,DRA Run とデータファイルとの間の関係は?
- メタデータの登録
- BioSample
- DRA
BioSample はデータベースに登録する実験データを得るために使われた生物学的な試料やサンプルに対して作成します。Biological/Technical replicate は異なる BioSample として登録し,サンプル属性 replicate に “biological replicate 1”,”biological replicate 2” のように記載して replicate であることを表現します。
-
MD5 チェックサムとは何でしょうか?
- シークエンスデータ
- DRA
DRA は MD5 チェックサムをアップロードされたファイルが破損されていないかどうかのチェックに使っています。MD5 チェックサムは 32 桁の英数字です。こちらのマニュアルをご参照ください。
例)bf4ac50dcd58bd2860dfac48c7fca348
-
論文が公開されました
- 更新
- DDBJ
登録データの修正・更新申し込み の「論文が公開されました」よりお知らせください。
-
DDBJing 講習会について教えて下さい
- 講習会
- DDBJ
DDBJ では、DDBJ が提供するサービスを有効に活用して頂くために「DDBJing 講習会」を開催しています。
DDBJing 講習会の日程,場所などは決まり次第ホームページ等でお知らせします。
-
DDBJ の情報配信サービスにはどのようなものがありますか
- 配信サービス
- DDBJ
DDBJ の情報配信サービスは以下の通りです。目的にあわせてご活用下さい。
-
DDBJ Mail Magazine(メールマガジン) の配信申込,変更,中止の方法
- 配信サービス
- DDBJ
DDBJ Mail Magazine のページから手続きができます。
-
「DDBJ 定期リリース後」とは具体的にいつですか
- DDBJリリース
- DDBJ
「DDBJ 新着データ(DDBJ 定期リリース後の新着データ)」は DDBJ 最新リリースの締め日の翌日以降に公開されたデータです。 最新リリースの締め日はリリースノートの文中に記述されています。 例えば,最新リリースが Release 67 の場合,以下のように2006年8月25日が締め日ですので,この時点の「DDBJ 新着データ」は8月26日以降公開されたデータになります。
-
期待している検索結果が得られません。検索方法が誤っているのでしょうか
- 検索
- 解析
- ARSA
- BLAST
- getentry
DDBJ/EMBL/GenBank は各データバンクに登録された配列を相互に交換しており, 総合的には基本的に同じデータを持っています。 ただし,各データバンクが公開したデータを互いに交換し合う際の時間差,更に各バンク内でそのデータを 検索サービスへ反映させる際の時間差により,同じ日の近い時間であっても検索サービスのデータには 微妙な差が存在している可能性があります。 期待している検索結果が得られないのは,これら時間差に負うところが大きいと思いますが, さらに詳細な調査が必要な場合はDDBJへのお問い合わせ よりご連絡ください。
-
DDBJ ではデータの検索・解析サービスを行なっていますか
- 検索
- 解析
- DDBJ
データの検索・解析は,下記の2つの方法がありますので,どうぞご利用下さい。
-
記載形式は雑誌により異なりますので,出版者にお問い合わせ下さい。
論文には各ツールの原著論文,DDBJ の遺伝子配列データ検索・解析ソフトを利用した旨を記載して下さい。各ツールの原著論文,関連論文は,DDBJ HP のサービスより、 関連論文をご覧下さい。
-
DDBJ の検索・解析ソフトの原著論文,関連論文を紹介して下さい
- 利用
- DDBJ
DDBJ HP のサービスより、 関連論文をご覧下さい。
-
クローンを配布して欲しい
- 利用
- DDBJ
DDBJ は塩基配列データベースですので,クローンの配布は行なっておりません。
直接,登録者へお問い合わせ下さい。 -
営利目的でなければ情報の引用に制限は設けませんが、引用しているサイト,その表示に関して DDBJ は責任を負いません。
引用の際には、DDBJ のホームページからの引用であることが分かるような形でご利用ください。また,DDBJへのお問い合わせ より下記の事項をご連絡下さい。
- 掲載予定先(画面掲載予定先)
- 使用したいサイトの URL,使用したい画面
-
検索結果を後で見ることは可能ですか?
- 解析
- BLAST
- 検索結果は Request ID を入れた,下記の URL で表示できます。
- http://blast.ddbj.nig.ac.jp/blast/r/Request ID
- Request ID
- 入力内容送信後の画面に表示されますので,必ず控えて下さい。
- 入力内容送信後画面
- 索結果画面
- 検索結果閲覧期間
- 実行後,7日間です。
-
検索結果の見方を教えてください
- 解析
- BLAST
検索結果は下記の順に出力されます。
- 相同性スコアの高い配列の順位表
- 相同な配列とのアラインメント
- パラメータと統計
BLAST の検索結果では,塩基配列の場合は,”|” は塩基配列が一致していることを意味します。 アミノ酸配列の場合は,一致しているアミノ酸が表示されます。 また,類似しているアミノ酸は “+” で表示されます。
詳細は BLAST の原著論文をご参照下さい。
BLAST 原著論文,関連論文および参考文献 -
入力した配列の一部が「N」(X) に置き換わってしまいました
- 解析
- BLAST
入力した配列が,BLAST プログラムによりフィルタリングされたためです。
フィルタリングにより,入力した配列のうち構造の複雑度が低い領域は “N”(アミノ酸配列の場合は “X”)に 置き換わります。 フィルタリングの詳細は,BLAST HELP の フィルター をご覧下さい。 フィルタリング機能を OFF にする場合は,設定画面の下の方にある「フィルター」オプションの ラジオボタンで OFF を選択して下さい。
なお,このオプションを OFF にすると検索時間が通常よりかかる場合がありますので,ご注意下さい。 -
検索結果の表示数が少ない(No Hit Found になってしまう)
- 解析
- BLAST
「検索結果一覧の表示数」,「アラインメント表示数」で指定した数より少ない場合,表示数を増やすには,”より詳細な設定” 欄の「期待値」の値を大きくしてお試し下さい。 このような場合は,期待数の値を10000 などと極端に大きくして下さい。 なお,配列が短すぎる場合(配列長が10 前後),BLAST では見つけられないことがよくあります。
-
ClustalW での解析時に BOOTSTRAP を指定することはできますか
- 解析
- ClustalW
ClustalW では,全ての解析時に BOOTSTRAP の計算を実行致します。
出力ファイルの最後にある [Download Tree File] を選択して頂くと, .phb ファイルをダウンロードすることができます。
ただし,入力フォームで [FORMAT] と [CLUSTERING] の選択が以下の様な組み合わせのときには .phb ファイルは作成されません。[FORMAT] [CLUSTERING] PHYLIP NJ NEXUS NJ PHYLIP UPGMA NEXUS UPGMA -
ClustalW で3種類の記号 "*", ".", ":" の意味は何ですか
- 解析
- ClustalW
そのマークのついているサイトにアラインメントされているアミノ酸が,
“*“では,完全に一致している
“:”では,強い類似性のあるグループに属している
“.”では,弱い類似性のあるグループに属している
ということを示しています。
強い弱いの基準は,PAM250 MATRIX において,アミノ酸間のスコアが0.5より大きいか,0.5以下かで分けています。 README 抜粋中の
STA
NEQK
:
は,横一行がその印がつくときのアミノ酸のグループを現しています(アミノ酸の一文字記号で書かれています)。 -
DDBJ に登録されたデータ(アクセッション番号)へ直接リンクを張る方法はありますか。
- 検索
- getentry
DDBJ エントリへのリンク設定方法 をご参照ください。
-
env_biome,env_feature,env_material の違いは?
- サンプル属性
- BioSample
これら三つのサンプル属性では生息している生物に影響する環境について記述します。
-
選択したツールのマニュアルを読んでいただき、該当オプションをセットして下さい(デフォルトでOKの場合は空欄のまま)。
オプション以外の文字を入れると実行時にエラーとなります。 -
必須のサンプル属性に対する値がない場合は?
- サンプル属性
- BioSample
値がない場合の記載方法をご覧ください。
-
BLAST の検索結果の表示順にはどのようなルールがありますか?
- 解析
- BLAST
BLAST の検索結果は相同性のスコアが高い順に表示されます。スコアが同じ配列には優劣がつけられませんので,表示順に規則性はありません。
-
scp でファイルの転送ができません
- シークエンスデータ
- DRA
以下の基本的な点をご確認ください。
- scp 接続時にパスワードではなく鍵認証になっているかどうか
- D-way アカウントに登録した公開鍵と指定している秘密鍵がペアになっているかどうか
- 秘密鍵ファイルが読み込みを許可する権限設定になっているかどうか
- 秘密鍵ファイルの権限が他人がアクセスできないように設定されているかどうか?(例 rw-------)
- 鍵作成時に指定したパスフレーズを正しく入力しているかどうか
鍵を生成した時のコンピュータの OS と異なる環境でデータを転送しようとしている場合,秘密鍵の形式が合っているかどうかご確認ください。秘密鍵ファイルの変換
転送環境 Unix/Mac OS X: Windows で作成した PuTTY 形式の秘密鍵は OpenSSH 形式に変換します。
転送環境 Windows WinSCP: Unix/Mac OS X で作成した OpenSSH 形式の秘密鍵は PuTTY 形式に変換します。
上記でも問題が解決しない場合、DDBJ センターではサードパーティ製ソフトウェアの細かい使い方に関するサポートは提供しておりませんので、ソフトウェアのウェブサイト等をご参照頂くか、所属組織のシステム管理者に scp (ポート 22) の通信を許可しているかどうか、ご確認ください。
-
データの種類ごとに別々のプロジェクトが必要ですか?
- メタデータの登録
- BioProject
必ず必要というわけではありません。研究を表すのに最も適切な方法で BioProject を作成してください。
2014年11月12日から BioProject の Project data type を複数選択できるようになりました。
ゲノム配列と転写産物を解析したプロジェクトを一つにまとめる場合は,Project data type に Genome Sequencing と Transcriptome or Gene Expression の両方を選択してください。Material は1つしか選択できませんので Other を選択してください。
他の方法としては Genome Sequencing と Transcriptome or Gene Expression で別々のプロジェクトを取得し,両者を Umbrella BioProject でまとめてください。
-
NIG スパコン上にあるデータを DRA サーバに直接転送する方法は?
- データの転送
- DRA
Unix/Mac OS X 上で秘密鍵を作成した場合
秘密鍵を遺伝研スパコン (Linux) に転送します。次に データファイルを scp 転送します。
scp <Your Files> <D-way Login ID>@dradata.ddbj.nig.ac.jp:~/<Submission ID>
- <Your Files> 転送するファイル。
例: file1 file2 (file1とfile2),file* (fileではじまる全てのファイル) - <D-way Login ID> D-way の Login ID (例: drauser)
- <Submission ID> 登録の Submission ID (例: drauser-0003)
Windows 上で秘密鍵を作成した場合
Linux で使用されている OpenSSH 形式へ変換した後,遺伝研スパコンに秘密鍵を転送します。また,scp 転送時には -i オプションで秘密鍵を指定して下さい。
scp -i <Private Key> <Your Files> <D-way Login ID>@dradata.ddbj.nig.ac.jp:~/<Submission ID>
- <Private Key> 秘密鍵を PATH で指定。例: /home/mishima/id.rsa
-
BioProject/BioSample/塩基配列データの連動公開の仕組みは?
- データの公開
- BioProject
- BioSample
- DRA
相互にリンクされている BioProject,BioSample,DDBJ と DRA に登録された塩基配列データの連動公開の仕組みは以下のようになっています。
-
データファイルはどのように処理されますか?
- シークエンスデータ
- DRA
アップロードされたデータファイルは Run 単位で処理されます。Run にリンクしている全てのデータファイルから SRA toolkit によりバイナリーの SRA ファイルが作成されます。この過程でリード長やリード名の書式などが全ての配列に渡ってチェックされます。元々のリード名は Run 単位でユニークである必要があります。
-
クエリ配列の長さを l 、データベースに保存されている配列の本数を n 、核酸あるいはアミノ酸同士の相似度を表すスコアを S としたとき、E value は次の式によって書き表さされます。(ただし、k 、m は正の定数です)
E=k*l*n*exp^(-mS)
この式から、BLASTの出力結果は、1E-Xと表示されている場合は、10-X という意味になります。 -
シークエンスしたゲノム配列それぞれに BioProject/BioSample が必要ですか?
- メタデータの登録
- BioProject
- BioSample
- DRA
一つの研究計画で複数のゲノム配列を決定した場合,これらのゲノム配列は一つの BioProject に紐づけることができますが,配列が取得されたサンプルは別々の BioSample として登録します。
-
DDBJ のサービスが推奨するOSとブラウザについて
- ARSA
- BLAST
- DDBJ
- DRA
-
Validate data files ボタンをクリックできず検証処理を開始できません
- シークエンスデータ
- DRA
Run メタデータに記入された全てのデータファイルが DRA サーバにアップロードされると,”Validate data files” ボタンが活性化され,検証処理を開始することができるようになります。メタデータを投稿しステータスが “metadata_submitted” になった後でもボタンが不活化されている場合は,以下の点をチェックしてください。
- Run メタデータに記入した全てのデータファイルが DRA サーバにアップロードされていない。
- データファイルのファイル名に空白が含まれており,アップロードされたファイルが認識されていない。
- アップロードされたファイルがディレクトリに含まれており,認識されていない。
-
BioProject を更新するには?
- 更新
- BioProject
現在のところ,プロジェクトの更新や削除は BioProject チームに連絡する必要があります。BioProject が更新されても,D-way の Overview 画面は更新されないことにご注意ください。Overview 画面は初回投稿時の内容を表示しており,BioProject データベースになされた変更を反映しません。
-
論文中で BioProject アクセッション番号を引用すべきですか?
- アクセッション番号
- BioProject
通常は引用すべきではありません。通常は「データ登録」に対するアクセッション番号,例えば DDBJ,WGS,DRA アクセッション番号,を引用してください。もし,個別の BioProject を参照する必要がある場合は,次のように記載してください。\"The data have been deposited with links to BioProject accession number PRJDBxxxxxx in the DDBJ BioProject database.\"
-
BioSample を更新するには?
- 更新
- BioSample
現在のところ,プロジェクトの更新や削除は BioSample チームに連絡する必要があります。BioSample が更新されても,D-way の Overview 画面は更新されないことにご注意ください。Overview 画面は初回投稿時の内容を表示しており,BioSample データベースになされた変更を反映しません。
-
論文中で BioSample アクセッション番号を引用すべきですか?
- アクセッション番号
- BioSample
通常は「データ登録」に対するアクセッション番号,例えば DDBJ,WGS,DRA アクセッション番号,を引用するのが適切です。もし,個別の BioSample を参照する必要がある場合は,次のように記載してください。"BioSample metadata are available in the DDBJ BioSample database under accession number SAMDxxxxxxxx"
-
登録する塩基配列の長さに制限はありますか
- 登録
- DDBJ
- 上限
- 実際に観測される連続した配列であるならば、塩基配列長の上限はありません。
ただし、染色体を操作的に連結した配列のような場合は受け付けません。染色体毎に個別の配列として受け付けます。
500 kbases より長い配列の場合は、塩基配列登録システム (NSSS) ではなく、Mass Submission System (MSS) から登録をお願いします。 - 下限
- 塩基配列長の下限に関してはシステム的な制限は設けていませんが、20 塩基より短い場合は警告しています。
生物学的に意味のある配列ならば、短くても受け付けますが、small RNA 転写産物の全長、特異的なタグ配列などの場合でも 15 塩基程度の長さは必要と考えます。
-
DDBJ では、SNV, CGH analysis, microarray, variation といったデータを扱う公的データベースが存在しませんが、NCBI または EBI にて登録が可能です。
適宜、下記へご登録ください。詳細は各データベースにお尋ねください。NCBI: Gene Expression Omnibus (GEO), dbSNP, dbVar, ClinVar
EBI: ArrayExpress, European Variation Archive (EVA), Database of Genomic Variants archive (DGVa)なお、ヒトに由来するデータの場合、下記の何れかのアクセス制限データベースへの登録が必要になることがあります。
The database of Genotypes and Phenotypes (dbGaP)
European Genome-phenome Archive (EGA)
Japanese Genotype-phenotype Archive (JGA) -
WGS、TSA、TLSデータのFASTA形式のファイルを取得するにはどうしたらいいですか?
- 検索
- getentry
WGS、TSA、TLSデータのFASTA形式のファイルを取得するには、getentry で以下を指定し、検索を行ってください。
ID:検索対象の Accession 番号を指定します。
出力形式:"全塩基配列 FASTA" を選択します。
取得方法:以下から選択します。- html
- テキスト
- 圧縮ファイル(gz)
上限:データの取得上限を設定します。
0を指定すると上限なしの設定となります。各項目の詳細は、getentry ヘルプ をご覧ください。
-
必須属性以外に記載すべき変数や表現型は?
- メタデータの登録
- JGA
JGA では Subject ID,Gender 等を必須フィールドにしています。データ利用者が論文で報告された結果を再現するためには,解析で使用した主変数 (main variable,例: heart disease) と共変数 (co-variate,例:age,weight) を含めることが重要です。最終的なゴールは,第三者が論文で出版された結果を再現するために必要なデータを含める,ということになります。
-
DDBJ JGA/NCBI dbGaP/EBI EGA 間ではデータを交換していません。オミックスデータの横断検索サービスである EBI Omics DI では dbGaP と EGA のメタデータ概要がインデックスされており、JGA も収載される予定です。
-
Submission可能な塩基配列の形式 (FASTA、multi-FASTA) について
- シークエンスデータ
- DDBJ
DDBJ塩基配列登録システム (NSSS)では、FASTA 形式(登録数が1配列の場合)または multi-FASTA 形式(登録数が複数配列の場合)の塩基配列を入力してください。
関連ページ: 塩基配列のフォーマットについて -
DDBJ のデータベースや検索・解析ツールを利用して得られた成果を発表される際、よろしければ、論文の引用をお願いいたします。
論文の引用には相当しないとお考えの場合、以下の例文の内容を謝辞などにてご記載いただければ幸いです。
文章のつながりから改変することはかまいません。 -
遺伝研スーパーコンピュータシステムの活動は皆様の謝辞で評価されています。
遺伝研スーパーコンピュータシステムの資源を利用して得られた成果を発表される際には、以下の例文の内容を謝辞などにてご記載ください。
文章のつながりから改変することはかまいません。 -
MSS 利用申し込みフォームが表示されません
- お問い合わせ
- DDBJ
国・地域によっては、MSS 利用申し込みフォームが表示されない場合があります。
その際は、以下の内容をメールでお送りください。
件名 : MSS 利用申し込み
宛先 : Mass Submission System (MSS) (クリックしてください)
本文 :(*必須)- MSS の利用について
- ・以前に MSS を利用されたことがありますか? *
はい / いいえ - コンタクトパーソン情報
- ・Contact person Name *
- ・Contact person Email address *
- ・Contact person Affiliation *
- 登録者情報(コンタクトパーソン以外の方が登録手続きを行う場合に記入してください。)
- ・Name
- ・Email address
- ・Affiliation
- 登録データの概略
- ・公開予定日*(下記から選択してください)
登録完了後 即日公開する / 公開予定日を指定する( 年 月 日) - ・件数*
- ・Sequencing Technology *下記から選択してください、複数選択可)
Sanger (gel/capillary) / Roche 454 / Illumina Solexa
AB SOLiD / その他 - ・データ種別*(下記から選択してください、複数選択可)
EST / full length cDNA (HTC) / TSA*1 / GSS
complete genome*2 / draft genome*2 (WGS or HTG) / その他 - ・生物学的概要*(日本語可) (例: Bacillus 属 16S rRNA gene の配列, 1000 bp~1500 bp)
- ・補足情報(日本語可)
- データ種別とは?
- *1, *2 を登録する場合は、MSS での登録に先立ち、以下の順序で手続きを行ってください。
- BioProject Database で、 BioProject ID を取得してください。
- 配列の由来(リソース)情報を BioSample Database に登録し、BioSample ID を取得して下さい。
- *2 に該当する場合は、以下の手続きも併せて行ってください。
- feature annotation を伴うゲノム配列の場合は、locus tag prefix を取得しておく必要があります。
locus_tag prefix は BioProject Database に登録する際に取得します。 - ただし、ゲノム全長相当であっても、virus、phage、organelle、あるいは、plasmid のみのような比較的小規模な配列の場合、BioProject ID および locus_tag prefix を取得する必要はありません。
-
登録データの修正・更新申し込みフォームが表示されません
- お問い合わせ
- DDBJ
件名:次の項目から選択してください
-
問い合わせフォームが表示されません
- お問い合わせ
- DDBJ
*必須
-
NCBI GEO と ArrayExpress 間での双方向のデータ交換は実現されていないため、結果として GEA のデータは GEO と交換されません。ArrayExpress は GEO の一部データの定期的な取り込みを実施していましたが現在は停止されています。
-
機関外サーバでのデータ利用
- 利用
- JGA
国立遺伝学研究所 DDBJ センターの個人ゲノム解析環境は所属機関外利用可能サーバ(機関外サーバ)として JGA データを利用することができます。機関外サーバで JGA データを利用するためには NBDC への事前申請と承認が必要になります。
NBDC での承認及び DDBJ センターによるスパコンアカウント発行後、ユーザは scp で利用承認された JGA データを個人ゲノム解析環境にダウンロードし、解析します。
-
新 JGA システムにおける変更点をご覧ください。
-
JGA サーバに scp/ssh アクセスできません
- システム
- JGA
以下の基本的な点をご確認ください。
-
新規公開データを DDBJ Search に定期反映する機能は未実装であるため、新規公開データは反映されません。反映機能は2020年11月中に実装予定です。それまではNBDC ヒトデータベースの「利用可能な研究データ一覧」をご利用ください。
-
MSS の登録の流れを教えて下さい
- Mass Submission System
- DDBJ
「MSS 登録の流れ」にて、登録の手順の詳細をご確認ください。
-
配列ファイルのみ送付で塩基配列の登録は可能ですか
- Mass Submission System
- DDBJ
いいえ、配列ファイルのみでは登録できません。アノテーションファイルが必要です。配列ファイル形式、アノテーションファイル形式をご確認ください。こちらのサイトで、サンプルアノテーションをご覧ください。
-
登録ファイルのサイズが大きすぎて、メール添付で送ることができません。その他の転送方法がありますか?
- Mass Submission System
- DDBJ
SCP によるファイル転送用ディレクトリを作成しますので、D-way アカウントをご提示下さい。D-way アカウントをお持ちでない場合には、こちらのサイトをご一読いただき、取得を行って下さい。
-
査読者に非公開データを提供する方法は?
- システム
- データの公開
- DDBJ
- DRA
- GEA
- JGA
GEA では reviewer access で査読者にメタデータとマイクロアレイデータ、NGS の解析済みデータを提供することができます(サイズが大きいため DRA に登録した NGS の生データは含まれていません)。
GEA 以外の DRA、DDBJ と JGA では reviewer access は提供していません。
DDBJ については「論文投稿の過程で査読者に登録した非公開塩基配列を見せたいのですが」を参照してください。
DRA ではアクセッション番号発行通知メールに添付されているアクセッション番号リストをメタデータの概要として提供する方法があります。シークエンスデータについては、登録者が アーカイブ済み fastq ファイルをダウンロードし、アクセス制限が利用できる何らかのサービスやサーバを利用して査読者と共有してください。
JGA はポリシーにより reviewer access を提供することはできません。
GEA/DRA/DDBJ ではデータを公開すれば、査読者を含む全てのユーザがアクセスできるようになります。