• getentryでENAとGenBankから特定期間に公開されたエントリーを反映できていない

第21回 INSDC meeting report 2008年5月20-22日 静岡県三島市

  • ホーム
  • 第21回 INSDC meeting report 2008年5月20-22日 静岡県三島市

2008

第21回 INSDC meeting report 2008年5月20-22日 静岡県三島市

DDBJ, EMBL-Bank/EBI, GenBank/NCBI で構成される International Nucleotide Sequence Database Collaboration (INSDC) は, 国際塩基配列データベース共同構築事業の運営・推進を図るために、 年1回、会議を開催しています。
2008年は 5月20日-22日に DDBJ で開催されました。

DDBJ, EMBL-Bank, GenBank が それぞれの活動について 年次報告を行った後, INSDC 運営上の実務的な問題を討論しました。

検討事項と今後の課題

新 division, TSA (Transcriptome Shotgun Assembly)
2008年6月から INSDC では, 再構成された(assembled) mRNA 配列を格納するための新 division, TSA にデータを受け付け, 公開しています。TSA を登録するためには, その登録に先立って再構成の元となる1次転写産物 (primary transcripts) の配列データをINSDC の EST division, Trace Archive, Short Read Archive の何れかに登録しておく必要があります。TSA への登録方法などの情報は, 今後, DDBJ website で紹介していく予定です。
次世代型配列決定によるデータの潮流と対応
原則として, 次世代型配列決定による未処理の配列データ (raw reads) はShort Read Archiveへ登録されるべき対象です。MINSEQE (Minimal Information about a High Throughput Sequencing Experiment) ワークショップの結果を受けて, INSD 登録を当初意図していない次世代型配列決定の結果から, 多型の発見, 再アノテーションなどにより, TPA, あるいは, TSA として INSD への登録となることが可能かもしれません。しかし, INSD への登録が有意に増大することは, 当面, ないという見通しです。
多型関連研究における同一配列の代表登録
基本的には, INSDC は同一であっても独立に得られた配列であれば受け付けており, その点において特に変更はありませんが, 近年, 増加傾向にある多型関連研究において使用したサンプルの全てを登録するとすれば, 冗長となる場合もあります。多型関連研究においては /frequency qualifier で出現頻度とサンプル総数を記載し代表配列のみに集約して登録する方法も受け付けることをあらためて確認しました。
REFERENCE/JOURNAL 行から電子出版のフラグ「(er)」を削除
REFERENCE/JOURNAL 行において電子出版を示す符号「(er)」を廃止します。古い仕様のもとの既登録データは, 適宜, 修正予定です。

Feature と Qualifier の改訂

以下に挙げる項目は, 特に断り書きがない限り, 2008年10月の Feature Table Definition の改訂後に適用されます。

  • /mol_type qualifier の規定値変更

    source feature で由来分子種を示す /mol_type qualifier の規定値を変更します。

    • 追加: “transcribed RNA”
    • 廃止: “snoRNA”, “snRNA”, “scRNA”, “pre-RNA” and “tmRNA”
  • /organelle qualifier で新規定値 “chromatophore” を使用可能にします。

  • /ncRNA_class の規定値変更

    ncRNA feature において種類を示すために用いる /ncRNA_class qualifier の規定値リストを変更します。

    • 追加: “6S/SsrS”, “SraD RNA”, “DsrA RNA”, “SroC”, “ribozyme”

    Controlled vocabulary for ncRNA classes もご参照ください

  • 新規に /satellite qualifier を repeat_region feature で使用可能にします。

    書式:”<satellite_type>[:<class>][ <identifier>]”
    satellite_type のみ必須で下記の3つの何れか
    “satellite”, “microsatellite”, “minisatellite”

    Example
     /satellite="satellite: S1a"
     /satellite="satellite: gamma III"
     /satellite="minisatellite"
     /satellite="microsatellite: DC130"
    
  • /frequency qualifier 書式の拡張変更

    従来は存在比率の小数記載のみでしたが, 「 [n] samples 中の [m] samples 観測した」などを示す目的で, 以下の書式も可能とします;
    "[m] in [n]", "[m] / [n]"

    Example
            /frequency="23/108"
            /frequency="1 in 12"
  • 宿主を示す qualifeir, /specific_host を /host と変更します。

    /host と /lab_host とも, 可能な限り, 二名法の生物学名を記載します。

    Example
     /lab_host="Gallus gallus"
     /lab_host="Gallus gallus embryo"
     /lab_host="Escherichia coli strain DH5 alpha"
     /lab_host="Homo sapiens HeLa cells"
    
  • /virion qualifier を廃止します

    注) /proviral qualifier は維持します

  • /cons_splice qualifier を廃止します

  • /rearranged と /germline qualifier の検証強化

    本来は, /rearranged と /germline は ともに適応的免疫反応による体細胞のゲノム再編成の有無を示します。
    しかし, 誤用が多いため, チェックを強化します。

  • 新規に /gene_synonym qualifier を /gene qualifier を記載可能な全ての feature で使用可能とします

    また, 関連して/gene qualifier 用法の軽微な修正を検討中です。

  • /inference 書式仕様の拡張

    推論根拠をより効率よく記載するために, /inference 書式仕様を検討中です。

  • 新規に /mating_type qualifier を source feature で使用可能にします。

    従来の /sex qualifier も維持します。/mating_type と /sex 用法のガイドラインを検討中です。