DDBJ Annotated/Assembled Sequences
塩基配列の登録
塩基配列登録の前に
塩基配列登録の目的と意義
多くの雑誌では学術論文の投稿に先立って、塩基配列を国際塩基配列データベース (International Nucleotide Sequence Database; INSD)に登録し、アクセッション番号を取得した上で、その番号を当該論文に記載することを義務付けています。DDBJは、この国際塩基配列データベースを構成するデータバンクの1つです。
受け入れ基準を満たしている塩基配列であるならば、研究者はこれを広く一般に公開することを目的として、学術論文の投稿予定の有無に関わらず、必要に応じて DDBJ に登録することができます。
DDBJ を含む国際塩基配列データベースに登録された塩基配列は公開された後には、誰でも全てを制限なしに利用可能となります。
なお、DDBJ に塩基配列データを登録しても、データに関する優先権、特許権などは生じませんので、ご注意ください。
参照: [FAQ] DDBJ に登録すればデータの優先権は確保されますか。特許申請するべきですか
新規登録か、更新か?
もし、新規登録とすべきか、既に登録した配列の更新とすべきか、迷う状況が発生しましたら、お問い合わせフォームの「塩基配列登録データの修正・更新」にご連絡ください。
塩基配列登録システム は、新規登録専用となっております。塩基配列登録システムから更新内容を送付しないでください。 更新の場合は、更新に関する説明をご参照の上、登録データの修正・更新申し込み から ご連絡をお願いいたします。
登録に附随する権利と義務
DDBJ に塩基配列を登録する際には、配列以外に、登録者とコンタクトパーソン、 関連文献 (primary citation)、由来生物名、遺伝子の機能、特性等に関する情報(以下、登録情報と総称します)が必要となります。
DDBJ から塩基配列を公開する際には、登録情報を DDBJ の定めるフラットファイルという形式に整形して公開しています。登録者とコンタクトパーソンは、原則として、フラットファイルの REFERENCE1 に記載されています。
登録者は自身の研究の進展・異動、または、誤りを正すなどの理由により、自身が登録した塩基配列と登録情報を修正・更新することができます。
データフロー説明、あるいは、このページの最初の段落にもありますように、国際塩基配列データベースを介して塩基配列が公開されたならば、誰でもその登録情報を参照、閲覧可能になります。登録者以外の利用者から配列自体を含む登録情報に誤りがあるなどの指摘を受けた場合、国際塩基配列データベースは、その旨をコンタクトパーソン宛に連絡します。ただし、配列自体を含む登録情報を更新することが可能なのは、当該塩基配列の登録者のみです。指摘を受けて登録情報を修正するか否かの判断は、登録者に委ねられます。
登録者には、配列利用者からの登録内容に関する問い合わせの際には、これに応じる義務があります。利用者からの登録者への連絡が必要な際は、DDBJから問い合わせフォームを 介してコンタクトパーソンへ転送いたします。そのため、DDBJ からのメールを迷惑メールとしないように設定をお願いいたします。
国際塩基配列データベースは登録情報に関する研究上の主張などに関して、登録者を含めた利用者間に意見の相違がある場合、双方の主張に関して中立の立場を取ります。
論文と塩基配列の公開
Primary citation が投稿中であるなどの場合、当該論文が公表されるまでの間、DDBJ は登録情報を非公開の状態で保持することが可能です。その場合、登録者は塩基配列登録に際し、登録情報に公開予定日 (Hold date)を含めなければなりません。公開予定日を設定した場合、登録情報は非公開の状態で維持されます。非公開の登録情報に関しては、DDBJ は登録者以外に対して守秘義務があります。
非公開の登録情報はデータ公開原則に従い、公開予定日到来などの理由により公開されます。
一度公開された登録情報は、DDBJ 側に重大な過失があった場合を除き、原則として、非公開の状態に戻すことができません。
ただし、DDBJ は、登録者からの要請に応じて、登録情報の利用に一定の制限をかけることができます。
参照:
塩基配列データの登録に必要な情報
登録者の情報
コンタクトパーソンの所属、住所、電話番号、全ての登録者の氏名が必要です。公開段階での表示はREFERENCE 1 のようになります。2007 年以前は、E-mail address、電話番号、FAX 番号をフラットファイルに表示していましたが、2008年以降は特に登録者が希望しない限り表示していません。
- 注意事項: 登録者は、可能な限り複数に
- 塩基配列の修正・更新を行う権利を有するのは登録者のみです。
基本的には将来的に連絡が取れなくなることなどを避けるために、実作業者と研究指導者、最低でも2人以上の連名記載を強く推奨します。
特に学生などが 研究指導者の連名なしに 独りで登録することは、原則、認められません。
公開予定日
登録者は登録時に即日公開、一定期間の非公開を選択することが可能です。
公開予定日とは DDBJ で公開作業を開始する日付けです。
即日公開ではない登録の場合は、公開予定日の設定が必要になります。
参照: データ公開原則
登録件数
特に 連続したアクセッション番号の発行を希望される場合は、登録件数を確定させた後に、ご登録ください。
配列が同一であっても、独立に配列が決定された結果であれば、個別に登録を受け付けます。原則的には、決定した配列を すべて ご登録いただくことが DDBJ、INSDC の方針です。しかし、場合によっては、出現頻度とサンプル総数を記載の上、代表データのみに集約して登録することも可能です。その場合、配列多型と 観測した集団 の各記載の単一性を維持可能な単位を考慮して、各々のサンプル単位に集約することが推奨されます。詳細は 多型関連研究における同一配列の代表データ登録 をご覧下さい。
論文、REFERENCE
登録する塩基配列に直接関係する論文情報、主論文 (primary citation)について著者とタイトルの記載が必須となっております。もし、特に論文投稿の予定がない場合でも、形式的にご記載をお願いいたします。
また、特に必須ではありませんが、参考文献としての論文情報を記載しておくことも可能です。
配列に関する生物学的情報
生物学的由来 (生物名など) の記載は、種同定の可否に関わらず、必須です。
いわゆるアノテーション情報として、featureを、可能な限り、記載いただいています。タンパク質コード配列、rRNA、tRNA、ncRNAなどの位置 (location) をご用意ください。また、その下位に記載するproduct、geneといった情報も、適宜、記載をお願いいたします。
- 注意事項: タンパク質コード配列; CDS feature には、gene と product を記載
- DDBJ の遺伝子命名に関する考え方の記載指針を ご参照の上、ご登録ください。
塩基配列
一般的に、塩基配列の登録は自然界にあるがままの姿であると信ずるに足る状態を共有する目的で行います。
シークエンサー出力を精査せず、そのまま登録することは、科学的に正しい行為ではありません。
詳細は塩基配列についてをご参照ください。
塩基配列登録の流れ
1.塩基配列登録受付
(A) 塩基配列登録システム (NSSS) を利用
Web経由の塩基配列登録システムによる登録をお勧めしております。
(B) Mass Submission System (MSS) を利用
NSSS は、下記の配列データに対応できません。
以下の何れかに該当する場合、MSS 経由で登録をお願いします。
件数の多寡、長さ以外の点もご確認ください。
a) 種別、または、量が以下に該当する配列データ
- EST、TSA、
HTC、GSS、
HTG、WGS、
TLS、TPA
- データ種別の詳細は、登録データ種別をご確認ください。
- 配列が長い場合、目安は 500 kb 以上
- 1配列あたりに多数の Feature がある場合、目安は 30 以上
- 登録する配列の数が多い場合、総計 100 を超えるとき
b) finished/draft の別を問わずレプリコン全長規模相当の配列データ
- (核) ゲノム
- 染色体
- オルガネラゲノム
- ウイルス・ファージのゲノム/segment
- プラスミド
c) DBLINK に BioProject, BioSample の記載が必要な配列データ
BioProject/BioSample との連携のために DBLINK への記載を必要とする場合、 以下を含みますが、下記で全てを網羅している訳ではありません。
- メタゲノム的解析、環境プロファイル解析全般
- 標的遺伝子を限定した配列データを相互に関連付ける場合
- 登録予定、または、登録済みの全長規模ゲノム配列と同一菌株 (strain) に由来する配列データ
- 原核生物 16S rRNA 配列の報告義務がある場合
- 他の標的遺伝子・クラスター領域を先行発表する場合
2.データの査定
DDBJ のキュレータが、公開に必要な事項を、国際塩基配列データベース(DDBJ/ENA/GenBank)が定める基準と、DDBJの注釈規範に従って入力し、査定した上で公開を行なっています。この作業の過程で、データの正確性を確保するため、登録者に問い合わせ等をさせていただく場合があります。
3.アクセッション番号の発行と通知
データ受け取り後、キュレーションを行い7業務日までには登録者に問題点を知らせます。アクセッション番号は、問題点を修正したのち、コンタクトパーソン宛てにEmailにて通知いたします。
4.データ公開
データ公開のご連絡を、コンタクトパーソンへ E-mail で送ります。公開データの内容はgetentryなどで検索して確認して下さるようお願いいたします。
登録したデータに関して訂正等がある場合は、アクセッション番号、訂正希望箇所を明記して以下のアドレス宛にお知らせ下さい。詳細は登録データの修正・更新をご参照ください。
5.登録、公開について連絡先一覧
問い合わせ一般 | お問い合わせフォーム |
---|---|
登録全般に関する問い合わせ | お問い合わせフォーム |
登録済みデータ更新・公開依頼 | 登録データの修正・更新申し込み |
配列データの遷移
下図にDDBJにおける塩基配列の新規登録から公開と更新までのデータフローを示します。
-
論文投稿
多く科学雑誌は論文投稿に際し、DDBJ/ENA/GenBank の何れかへ塩基配列を登録することを義務付けています。 ※ 論文を投稿しない場合も塩基配列の登録は可能です。 -
配列登録
基本的には、DDBJ への登録は 塩基配列登録システム、または、Mass Submission System を経由します。登録作業が完了しましたら、登録者にアクセッション番号をお知らせします。 -
非公開
登録後に即時公開か、一定期間非公開か、は登録時に登録者が指定します。非公開を希望する場合は、公開予定日 の指定が必要です。 -
配列データ公開
登録時に即時公開を指定された場合は、作業完了後、すぐに公開いたします。公開予定日 が指定された場合は、公開原則に基づき公開されます。論文出版などによるアクセッション番号の公表が確認された場合は例外なく公開します。また「アクセッション番号の公表」に基づく公開請求は、誰にでも可能です。 -
公開データの利用
DDBJ から公開されたデータは、最初にgetentryで検索可能になり、anonymous FTPから取得可能になります。GenBankとENAにも転送され、そちらからも閲覧・取得が可能になります。DDBJのサービス、相同性検索,ARSA などにも展開されます。公開されたデータは、基本的には、どなたでも閲覧・利用が可能です。 -
公開データの被引用性
DDBJ/ENA/GenBank から公開されたデータは多くのデータベースで2次的に引用されています。 -
公開データへのフィードバック
公開されたデータに対する質問・確認などは登録者へお願いいたします。連絡先が不明な場合は転送いたしますので、お問い合わせフォームからご連絡ください。 -
データ更新の権限
登録データを更新する権利を持っているのは登録者のみです。更新後に即時公開か、一定期間非公開か、は登録者が指定します。ただし、既に公開されているデータの場合は、非公開にすることはできません。
用語
- 登録者 (Submitter)
- 登録者は、原則として、そのエントリの登録情報に責任を持つことが可能な人物であり、その登録情報に変更を加える(updateする)権利を有します。基本的に、登録者には、DDBJ、または、DDBJ 利用者からの登録内容に関する問い合わせには応じる義務があります。
- 原則として、登録者は、フラットファイルの REFERENCE 1 に記載されます。
- コンタクトパーソン (Contact person)
- コンタクトパーソンとは、そのエントリの登録情報について把握し、国際塩基配列データベースから塩基配列が公開された後、その利用者からの問い合わせに対応する代表者としての義務を負います。
-
- コンタクトパーソンは、原則として、登録者の中の一人でなければなりません。
- そのエントリに関する DDBJ からの連絡も、原則として、このコンタクトパーソン宛に行われます。そのため、DDBJ からのメールを迷惑メールとしないように設定をお願いいたします。
- コンタクトパーソンは、原則として、フラットファイルの REFERENCE 1 に記載されます。 利用者から登録者へ連絡が必要な場合、DDBJから問い合わせフォームを介してコンタクトパーソンへ転送いたします。
- 受付日 (Accept Date)
- 受付日 (Accept Date) とは、原則として、アクセッション番号を発行可能な元データが DDBJ に到着した日付けです。
- 公開予定日 (Hold Date)
- 公開予定日とは DDBJ で公開作業を開始する日付けです。登録者が必要に応じて設定します。
参照: データ公開原則 - 業務日
- DDBJ センターは土曜日と日曜日に加えて、国民の祝日、年末年始(12月29日から翌年の1月3日)、情報・システム研究機構の定める夏季休業日(8月中の2日間) には業務を休止します。DDBJ Calendar もご参照ください。
- フラットファイル (flat file)
- フラットファイルとは、DDBJ のデータ公開形式です。
参照: DDBJ のデータ公開形式 (flat file) の説明 - エントリ (Entry)
- エントリとは、塩基配列データベースのデータの単位です。
参照: DDBJ のデータ公開形式 (flat file) の説明 - プライマリーエントリ (Primary entry)
- プライマリーエントリとは、DDBJ/ENA/GenBank 国際塩基配列データベースから、取得可能なデータであると同時に、登録者が実験的に配列決定し、アノテーション付加を行ったデータです。
参照: TPA (Third Party Data) - Primary citation
- Primary citation とは、当該配列に関する主論文を指します。
原則として、フラットファイルの REFERENCE 2 に記載されます。
REFERENCE 2 には、その配列の公表状況を提示する意味合いがあります。 Primary citation が複数ある場合、または、これに相当しない関連文献がある場合は REFERENCE 3 以降に、必要に応じて記載することができます。