データベースと登録窓口

生命情報・DDBJ センターがデータ登録を受け付けているデータベースと窓口の一覧。

データベース 説明 窓口
Annotated/Assembled Sequences (DDBJ) フラットファイル GenBank 相当 (INSDC) NSSS: ウェブフォームの塩基配列登録システム
MSS: NSSS が対応していない多件数、長大な配列データの登録システム
DFAST: 原核生物ゲノムの高速自動アノテーションパイプライン
DDBJ Sequence Read Archive (DRA) 主として NGS 由来 raw sequence data and/or alignment information (INSDC) Submission portal D-way
BioProject 研究プロジェクト (INSDC) Submission portal D-way
BioSample 生物学的な試料、サンプル (INSDC) Submission portal D-way
Genomic Expression Archive (GEA) 遺伝子発現、エピジェネティクスやジェノタイピング SNP アレイ等の機能ゲノミクスデータ Submission portal D-way
Japanese Genotype-phenotype Archive (JGA) アクセス制限が必要な個人レベルの遺伝学的なデータと匿名化された表現型情報 JGA Submission

研究目的、データ種別により、上記の何れか、必要に応じて複数に渡ってデータを登録する必要があります。

比較的小規模な塩基配列データの登録

通常はウェブフォーム入力による NSSS 登録を推奨します。
下記に該当する場合、MSS 登録をお願いします。

  • 配列数が 500 を超える
  • 配列が長い (目安は 500 kb 以上)
  • エントリ (1つの配列) あたりに多数 (概ね30以上) の Feature がある
  • WGS, CON, TSA, TLS, HTC, HTG, EST, GSS, STS の登録

大規模な塩基配列データの登録

以下に該当する場合、BioProject, BioSample へ登録後、DRA、MSS の何れか、または両方への登録が必要です。

Transcriptome で Transcriptom Shotgun Assembly (TSA) に該当する場合、BioProject, BioSample へ登録後、DRA と MSS への登録が必須です。
転写産物配列の比較計測による遺伝子発現解析の場合、BioProject, BioSample へ登録後、DRA 登録が必要です。 解析済みデータの GEA 登録も強く推奨します。主要な科学雑誌は解析済みデータの GEO/ArrayExpress/GEA への登録を義務付けています。

塩基配列以外のデータの登録先

  • マイクロアレイデータは GEA で受け付けています。
  • 塩基配列を伴わないアミノ酸配列データは DDBJ では受け付けておりません。UniProt への登録をご検討ください。
    FAQ: アミノ酸配列の登録方法を教えてください
  • ヒトに関する研究データの場合、アクセス制限データベースである JGA で受け付けることが可能な場合があります。JGA に登録するためには NBDC へ提供を申請し、承認される必要があります。

受け付けることができない塩基配列データ

  • ゲノム DNA と RNA 転写産物を混合した塩基配列
  • 特定の実体を伴わない塩基配列 (いわゆる consensus sequences)
  • 長さが 100 塩基未満の塩基配列 (2021年6月以降)
  • primer のみで構成される塩基配列 (2021年6月以降)