2023年5月17日から DDBJ BioSample で以下の二点が変更になりました。
いずれも配列データの品質とサンプルのトレーサビリティを向上させるための International Nucleotide Sequence Database Collaboration (INSDC) の取り組みの一環になります。
関連ページ
- BioSample でサンプルの採取場所と日付の記載が必須になります
- INSDC Missing Value Reporting Standards
- INSDC spatiotemporal metadata – missing values update (03-04-2023)
- Coming Soon! Including Sample Location and Collection Date and Time for Sequences Submitted to GenBank and SRA
- ENA to introduce mandatory spatiotemporal annotations
null value の記載方法
DDBJ BioSample において “null value” の記載方法が変更になりました。
必須属性の値がない場合は missing に続けて、「値がない理由」を8つの “reporting level terms” から選択して記載することを推奨します。
適切な reporting level terms がない場合は従来通り “missing” や “not collected” 等の “null value” を記載します。
reporting level terms
- missing: control sample
- missing: sample group
- missing: synthetic construct
- missing: lab stock
- missing: third party data
- missing: data agreement established pre-2023
- missing: endangered species
- missing: human-identifiable
詳しくは値がない場合の記載方法を参照してください。
サンプル採取場所と採取日時の必須化
全てのパッケージでサンプルの「採取場所」と「採取日時」の記載が必須になりました。
- 採取場所: 生物学的なサンプルが採取された場所。少なくとも国や海洋を記載します。BioSample の geo_loc_name が対応する属性になります。
- 採取日時: サンプルが採取された日時。少なくとも最も近い「年」を所定の書式で記載します。BioSample の collection_date が対応する属性になります。
詳しくはサンプル属性を参照してください。