第17回 INSDC meeting report 2004年5月17-19日 英国ヒンクストン
2004
第17回 INSDC meeting report 2004年5月17-19日 英国ヒンクストン
CIB/DDBJ, EBI/EMBL, NCBI/GenBank は,
国際塩基配列データベース共同構築の運営・推進をはかるために、年1回、会議を開催しています。
2004年は EBI のあるヒンクストンで第17回国際実務者会議 (5月17日-19日) と、
第15回国際諮問委員会 (5月20日から21日) が開催されました。
DDBJ からは国際実務者会議に5名、国際諮問委員会に4名のスタッフが出席しました。
国際実務者会議では, DDBJ, EMBL, GenBank の活動の年次報告が行なわれた後、 国際塩基配列データベース運用上の実務的な問題を検討しました。会議で決定した主な事項は次の通りです。
動向
一昨年の会議を受けて,1エントリを350kb
以下にするという,
塩基配列長の制限を撤廃することを検討して来ましたが,特に大きな問題は予想されないと結論し,これを進めることで合意しました。
この制限の廃止に伴い, 過去に長さを理由に分割したエントリは, 適宜,
結合する方針です。
環境サンプル由来の塩基配列の登録が, 近年, 急増しています。これに対応すべく, ENV (環境サンプル) division を新設し, これまで主として BCT (バクテリア) division に含まれていた環境サンプル由来エントリを明示的に区別します。
一昨年より TPA の登録を受け付けていますが,
引用配列とTPA
登録配列の違いをどの程度許容するかという点を明確に出来ていませんでした。
この違いが整列される範囲の 10%
未満に収まることを目安とする方向で合意しました。
昨年の決定を受けて, DDBJ, EMBL-Bank, GenBank において共通の XML フォーマットを提供する準備を進めておりましたが, 共通化した DTD と XML フォーマットのテスト運用を内部的に進める予定です。
gap を含む配列に関して, これまで恣意的な個数の連続した ‘n’
を挿入した上で, 配列を受け付けていました。
今後は gap の長さが不明の場合は 100個の連続した ‘n’
を,長さの推定が為されている場合はその数分の連続した n を,対応する
location に挿入することを規則とします。
Feature/Qualifier に関する決定
source feature の qualifier の一部, /variety, /cultivar などには value が不適切なエントリが多数存在していますので, 修正していく予定です。
環境サンプル由来登録の増加に関連し, 採集地情報を記載する /country qualifier の記載の在り方について再検討しています。
/bound_moiety を使用可能な feature は, これまで protein_bind のみでしたが, 今後は, promoter, enhancer, oriT, misc_bind にも使用可能とする予定です。
一昨年, 特定ゲノムプロジェクト用に feature 継承用の ID 情報を記述するための /locus_tag qualifier を追加しましたが, 履歴管理のために /old_locus_tag qualifier を更に追加する予定です。
配列比較に基づいて記載される一群の feature (variation, misc_difference, conflict, unsure, old_sequence) について比較対象の配列を記載するための /compare qualifier (/compare=[accession].[version] )を追加する予定です。
その他
Feature,特に CDS の根拠が実験的であるか, 相同性に基づく推定か, 単なる読み枠の予測によるか, などを示すことが利用者から求められております。これに関連して, /evidence qualifier の規定値の追加, 再分類と再定義の検討を進めています。