データベースと登録窓口
生命情報・DDBJ センターがデータ登録を受け付けているデータベースと窓口の一覧。
データベース | 説明 | 窓口 |
---|---|---|
Annotated/Assembled Sequences (DDBJ) | フラットファイル GenBank 相当 (INSDC) |
• NSSS: ウェブフォームの塩基配列登録システム • MSS: NSSS が対応していない多件数、長大な配列データの登録システム • DFAST: 原核生物ゲノムの高速自動アノテーションパイプライン |
DDBJ Sequence Read Archive (DRA) | 主として NGS 由来 raw sequence data and/or alignment information (INSDC) | Submission portal D-way |
BioProject | 研究プロジェクト (INSDC) | Submission portal D-way |
BioSample | 生物学的な試料、サンプル (INSDC) | Submission portal D-way |
Genomic Expression Archive (GEA) | 遺伝子発現、エピジェネティクスやジェノタイピング SNP アレイ等の機能ゲノミクスデータ | Submission portal D-way |
Japanese Genotype-phenotype Archive (JGA) | アクセス制限が必要な個人レベルの遺伝学的なデータと匿名化された表現型情報 | JGA Submission |
研究目的、データ種別により、上記の何れか、必要に応じて複数に渡ってデータを登録する必要があります。
比較的小規模な塩基配列データの登録
通常はウェブフォーム入力による NSSS 登録を推奨します。
下記に該当する場合、MSS 登録をお願いします。
- 配列数が 500 を超える
- 配列が長い (目安は 500 kb 以上)
- エントリ (1つの配列) あたりに多数 (概ね30以上) の Feature がある
- WGS, CON, TSA, TLS, HTC, HTG, EST, GSS, STS の登録
大規模な塩基配列データの登録
以下に該当する場合、BioProject, BioSample へ登録後、DRA、MSS の何れか、または両方への登録が必要です。
- Genome Project のデータ登録
- 細菌、または、古細菌のゲノム、DFAST
- メタゲノムアセンブリ
- Single amplified genome
- Transcriptome Project のデータ登録
- 遺伝子発現解析
- Targeted Locus Study (TLS)、主として大規模な OTU profile 解析
Transcriptome で Transcriptom Shotgun Assembly (TSA) に該当する場合、BioProject, BioSample へ登録後、DRA と MSS への登録が必須です。
転写産物配列の比較計測による遺伝子発現解析の場合、BioProject, BioSample へ登録後、DRA 登録が必要です。
解析済みデータの GEA 登録も強く推奨します。主要な科学雑誌は解析済みデータの GEO/ArrayExpress/GEA への登録を義務付けています。
塩基配列以外のデータの登録先
- マイクロアレイデータは GEA で受け付けています。
- 塩基配列を伴わないアミノ酸配列データは DDBJ では受け付けておりません。UniProt への登録をご検討ください。
FAQ: アミノ酸配列の登録方法を教えてください - ヒトに関する研究データの場合、アクセス制限データベースである JGA で受け付けることが可能な場合があります。JGA に登録するためには NBDC へ提供を申請し、承認される必要があります。
受け付けることができない塩基配列データ
- ゲノム DNA と RNA 転写産物を混合した塩基配列
- 特定の実体を伴わない塩基配列 (いわゆる consensus sequences)
- 長さが 100 塩基未満の塩基配列 (2021年6月以降)
- primer のみで構成される塩基配列 (2021年6月以降)