第29回 INSDC meeting report 2016年5月16-18日 英国ヒンクストン
2016
第29回 INSDC meeting report 2016年5月16-18日 英国ヒンクストン
DDBJ, EBI,
NCBI で構成される
International Nucleotide Sequence Database Collaboration (INSDC)
は、その共同事業の運営・推進を図るために、年1回、会議を開催しています。
2016年は 5月16日-18日に EBI で開催され、DDBJ、
ENA、
GenBank、
Sequence Read Archive (SRA)、Trace Archive
を運営する上での実務的な問題を討論しました。
会議の報告を以下に まとめました。
検討事項と今後の課題
- NGS Quality Scores
- 現在、SRA storage の 70-80% が quality score で占められていますが、 多くの解析ツールでは このデータを使用していません。 INSDC としては、長期的な視点で SRA データ増大を抑えるためには quality score を2値化・8値化などの不可逆圧縮、あるいは、除去する方が好ましいと感じています。 しかし、研究分野が異なれば、この状況は異なるかもしれません。 今後の NGS データの受付について、広く研究コミュニティとともに検討したく思います。
- SRA Objects VS BioProject/BioSample
- SRA study object と BioProject、SRA sample object と BioSample の関係について検討しました。
- Targeted Locus Study (TLS) data の紹介
- GenBank は 16S rRNA または、他の特定 locus を標的とした配列で構成される operational taxonomic unit クラスター化に用いる大規模データを TLS として受け付けを開始し、WGS のような four-letter prefix のアクセッション番号を割り当てています。
- INSDC Data Status
- 各拠点間のデータ交換について、特に WGS と TSA のような大規模データと SRA, BioProject, BioSample における公開状態を示す status の扱いについて検討しました。
- Assembly (Genome Collection)
- 2012年から続く連携について実務上の課題を話し合いました。
Feature と Qualifier の記載則改訂
以下に挙げる項目が、次回以降の Feature Table Definition の改訂で適用すべく提案されました。
rep_origin feature で /function qualifier を記載可能に変更。
複製調節を記載するために regulatory feature の定義を拡張。
/regulatory_class qualifier の規定値を追加。
その他を示す feature (misc_***) で記載されてきた対象を明確にするため feature を1つ、qualifier を1つ追加。
- ペプチド成熟過程の中間産物記載用に propeptide feature
- misc_recomb feature 用に /recombination_class qualifier