第27回 INSDC meeting report 2014年5月20-22日 静岡県三島市
2014
第27回 INSDC meeting report 2014年5月20-22日 静岡県三島市
DDBJ, EBI,
NCBI で構成される
International Nucleotide Sequence Database Collaboration (INSDC)
は、その共同事業の運営・推進を図るために、年1回、会議を開催しています。
2014年は 5月20日-22日に DDBJ で開催され、DDBJ、ENA、
GenBank、
Sequence Read Archive (SRA)、Trace Archive
を運営する上での実務的な問題を討論しました。
会議の報告を以下に まとめました。
検討事項と今後の課題
- BioSample database
- BioSample database では実験的解析に用いられた生物学的な試料に関する記述を収集します。
DDBJ でも 2014年から BioSample 登録受付を開始しています。
2012 年、 2013 年に引き続き、INSDC として BioSample data を収集し共有するための運用上の課題を検討しました。 - WGS など多量のゲノム配列に関する諸問題の検討
- データ交換
- 各拠点間のデータ交換の効率化、書式などを検討しました。
- Assembly (Genome Collection)
- 2012 年に引き続き、ゲノム配列情報の収集に協力していきます。
- /protein_id の運用
- 同種別 strain のゲノム配列に代表される多数の ortholog を伴う登録で CDS を記載した場合、/protein_id が一見、冗長に多量に消費されるため、新しい /protein_id の発行の仕組などの可能性を検討しました。
SRA XML schema の改訂
SRA XML schema version 2.0 について、SRA metadata を BioProject と BioSample のデータと連携していくために継続検討しています。
Feature と Qualifier の記載則改訂
以下に挙げる項目は、特に断り書きがない限り、2014年10月以降 Feature Table Definition の改訂後に適用されます。
- 新規に regulatory feature と
/regulatory_class
qualifier が2014年12月から使用可能になります。
これに伴い、-35_signal, -10_signal, CAAT_signal, GC_signal, TATA_signal, polyA_signal, attenuator, terminator, promoter, enhancer, RBS, misc_signal はこの新 feature に移行し、廃止されます。 - Modified Base Abbreviations と /mod_base qualifier の dihydrouridine を示す規定値 d を dhu に修正します。
- prim_transcript と precursor_RNA の feature を mRNA 以外にも使用して良いことを明確にするため、定義を修正します。
- 2013年から引き続き、type
strain, type specimen などを指定するために、新規に /type_material
qualifier を使用することを検討しています。
仕様の詳細と DDBJ における適用時期は未定です。