• getentryでENAとGenBankから特定期間に公開されたエントリーを反映できていない

第29回 INSDC meeting report 2016年5月16-18日 英国ヒンクストン

  • ホーム
  • 第29回 INSDC meeting report 2016年5月16-18日 英国ヒンクストン

2016

第29回 INSDC meeting report 2016年5月16-18日 英国ヒンクストン

DDBJ, EBI, NCBI で構成される International Nucleotide Sequence Database Collaboration (INSDC) は、その共同事業の運営・推進を図るために、年1回、会議を開催しています。
2016年は 5月16日-18日に EBI で開催され、DDBJ、 ENA、 GenBank、 Sequence Read Archive (SRA)、Trace Archive を運営する上での実務的な問題を討論しました。
会議の報告を以下に まとめました。

検討事項と今後の課題

NGS Quality Scores
現在、SRA storage の 70-80% が quality score で占められていますが、 多くの解析ツールでは このデータを使用していません。 INSDC としては、長期的な視点で SRA データ増大を抑えるためには quality score を2値化・8値化などの不可逆圧縮、あるいは、除去する方が好ましいと感じています。 しかし、研究分野が異なれば、この状況は異なるかもしれません。 今後の NGS データの受付について、広く研究コミュニティとともに検討したく思います。
SRA Objects VS BioProject/BioSample
SRA study object と BioProject、SRA sample object と BioSample の関係について検討しました。
Targeted Locus Study (TLS) data の紹介
GenBank は 16S rRNA または、他の特定 locus を標的とした配列で構成される operational taxonomic unit クラスター化に用いる大規模データを TLS として受け付けを開始し、WGS のような four-letter prefix のアクセッション番号を割り当てています。
INSDC Data Status
各拠点間のデータ交換について、特に WGS と TSA のような大規模データと SRA, BioProject, BioSample における公開状態を示す status の扱いについて検討しました。
Assembly (Genome Collection)
2012年から続く連携について実務上の課題を話し合いました。

Feature と Qualifier の記載則改訂

以下に挙げる項目が、次回以降の Feature Table Definition の改訂で適用すべく提案されました。

rep_origin feature で /function qualifier を記載可能に変更。

複製調節を記載するために regulatory feature の定義を拡張。

/regulatory_class qualifier の規定値を追加。

その他を示す feature (misc_***) で記載されてきた対象を明確にするため feature を1つ、qualifier を1つ追加。

  • ペプチド成熟過程の中間産物記載用に propeptide feature
  • misc_recomb feature 用に /recombination_class qualifier