第35回 INSDC meeting report 2022年5月23~27日 teleconference
第35回 INSDC meeting report 2022年5月23~27日 teleconference
DDBJ センター, EBI,
NCBI で構成される
International Nucleotide Sequence Database Collaboration (INSDC)
は、その共同事業の運営・推進を図るために、年1回、会議を開催しています。
2022年は EBI で開催する予定でしたが、新型コロナウイルスの影響により、5月10日~14日にリモート開催され、DDBJ、
ENA、
GenBank、
Sequence Read Archive (SRA)、BioProject、BioSample を運営する上での実務的な問題を討論しました。
会議の報告を以下にまとめました。
検討事項と今後の課題
INSDC 運営関連
- status document を改訂しました。
- データを cloud 移行する場合に生じる将来的な課題について議論しました。
特定ベンダーに依存しない、データを2拠点以上に保持すべき、などの戦略が求められます。 - INSDC サイト のデザインを改善しました。
新型コロナウイルスの影響とそのデータ共有
新型コロナウイルスのデータ共有は INSDC の重要な課題と考えています。
SARS-CoV-2 配列の登録受付に関する技術的な問題について議論しました。
2020 年 と 2021 年 に引き続き、SARS-CoV-2 配列データを INSDC データベースに登録することを奨励しています。
ウイルスデータの登録に際し、以下の項目の提供を強く推奨します。
- /isolate qualifier に the International Committee on Taxonomy of Viruses が推奨する書式 の ID を記載
参照: The species Severe acute respiratory syndrome-related coronavirus: classifying 2019-nCoV and naming it SARS-CoV-2 - /host qualifier
- /collection_date qualifier
- /country qualifier
大規模データの検証
NCBI から以下のツールが紹介されました。
Feature と Qualifier の記載則改訂
- /type_material qualifier の規定値に、一般的に使用しない値ですが、 “not verified as type” と “not considered type” を追加します。
- 2022 年末以降、新規登録では /country, /collection_date qualifier の記載を必須化することを目指して、その運用上の課題を検討しています。
参照: Spatio-temporal annotation policy (18-11-2021)