INSDC Minimal Specifications
INSDCは、加盟するすべてのデータベース間で共有される塩基配列データの一貫性、相互運用性、および信頼性を確保するため、一連の Minimal specifications を策定しました。
2025年に INSDC Implementation Committee によって正式に定められたこれらの仕様は、既存の標準を現代のデータワークフローに適合するよう再構成したものです。統一されたデータモデルと明確な受理基準を定義することにより、データの検証および交換の方法を整理・統合しました。これらの文書は「living documents(継続的に更新される文書)」であり、技術進歩や、拡大し続ける世界の科学コミュニティの多様性に合わせて、柔軟に進化させていくことを目的としています。
Minimal specifications
- Analysis Secondary data files that are derived from computational workflows or provide supplemental biological context to INSDC nucleotide data.
- Annotation Description and location of the biological features in the cited sequence.
- Assembly Description of the set of assembled sequences and related metadata that identifies the chromosomes, unlocalized sequences, and unplaced sequences that represent a genome.
- Compressed reads Sequence read files without base level qualities provided in INSDC specified formats.
- Experiment Collected sequencing experimental information (methods, platform, library, and machine configuration).
- Package-checklist A predetermined set of metadata requirements for sample registration.
- Project A collection of biological data and description of research effort related to a single initiative.
- Raw reads Sequence read files containing base level information provided in INSDC specified formats.
- Sample The description of the biological source materials used in experimental assays.
- Sequence Assembled nucleotide sequences.