第28回 INSDC meeting report 2015年5月19-21日 米国ベセスダ
2015
第28回 INSDC meeting report 2015年5月19-21日 米国ベセスダ
DDBJ, EBI,
NCBI で構成される
International Nucleotide Sequence Database Collaboration (INSDC)
は、その共同事業の運営・推進を図るために、年1回、会議を開催しています。
2015年は 5月19日-21日に NCBI
で開催され、DDBJ、ENA、
GenBank、
Sequence Read Archive (SRA)、Trace Archive
を運営する上での実務的な問題を討論しました。
会議の報告を以下に まとめました。
検討事項と今後の課題
- ヒトに由来するデータの扱い
- HeLa 細胞に由来するデータ、 Genomic Data Sharing (GDS) ポリシー、 クラウドにおけるデータ解析の扱いなど NIH における取り組みについて紹介を受け、ヒトに由来するデータの登録について話し合いました。
- INSDC Data Status
- 各拠点間のデータ交換について、特に公開状態を示す status の情報交換、 拠点間の replaced と SRA における suppressed の扱いについて検討しました。
- Assembly (Genome Collection)
- 2012年から続く連携について実務上の課題を話し合いました。
- SRA データ増大への対応
- データ増加に対応するためのデータ圧縮手法として
cSRA (compressed SRA) と
CRAM の取り組みが それぞれ、NCBI と EBI から紹介されました。
これを受けて lossy/lossless な手法によるデータ圧縮の適正な適用などについて話し合いました。 - 微生物ゲノムの種同定の間違い
- Federhen S (2015) の論文と GenBank microbial genomic taxonomy workshop (12-13 May 2015) を受けて、種同定に問題がある登録への対応について話し合いました。
Feature と Qualifier の記載則改訂
以下に挙げる項目は、特に断り書きがない限り、2015年10月以降 Feature Table Definition の改訂後に適用されます。
- unsure feature の定義を sequencing gap と混同しないように改訂します。
- /rpt_type qualifier
の規定値を増やす方向で修正を検討しています。
これに伴い、LTR feature は repeat_region feature に統合予定です。 - 2013年から引き続き、type
strain, type specimen などを指定するために、新規に /type_material
qualifier を使用することを検討しています。
仕様の詳細と DDBJ における正式な適用時期は未定です。