


台風接近の為,交通機関等を懸念される中,無事に,今年の国際実務者会議が 5月20日から22日まで国立遺伝学研究所(静岡県三島市)で開催することができました。3バンク(DDBJ/NIG, EMBL-Bank/EBI, GenBank/NCBI)の実務担当者が国際塩基配列データベース共同構築を円滑に進めるための年1回の熱い討議が終了し,実務的な問題解決への糸口となったことと思います。来年は USA での開催予定,また,熱い 3日間になることでしょう。
隔月公開の DDBJ メールマガジン第38号 web 版です。メールマガジンに関するご質問やご意見がありましたら
までどうぞ。
隔月公開の DDBJ メールマガジン第38号 web 版です。メールマガジンに関するご質問やご意見がありましたら
までどうぞ。
DDBJ/NIG(国立遺伝学研究所), EMBL-Bank/EBI(欧州バイオインフォマティクス研究所), GenBank/NCBI(米国立バイオテクノロジー情報センター) の3大国際 DNA データバンクは,INSDC; International Nucleotide Sequence Database Collaboration として国際塩基配列データベースの共同構築と運営を行なっています。3バンクは,生物学の発展に伴って発生するデータ項目や内容の追加・削除・更新など,バンク活動の実務について協議するため,DNAデータバンク国際実務者会議を毎年1回開催しています。1987年7月にドイツのハイデルベルグで第1回が開催されて以来今回で21回目となります。 開催地は,日(NIG),欧(EBI),米(NCBI)の持ち回りとなっています。
2008年の第21回国際実務者会議は,5月20日-22日に国立遺伝学研究所(静岡県三島市)で開催されました。通信技術が発達した昨今では,国際会議といえども,参加者は自国に居るままインターネットなどを介して議論を行なうものも少なくありませんが,国際実務者会議では,毎度,必ず3バンクの実務担当者が多忙なスケジュールを調整して一堂に会し,通常3日間にわたり集中討議を行ないます。この形式により,出席者全員が互いに知り合いになり,時には厳しい議論も友好意識のもとで繰り広げられます。20年以上も続いている根拠の一つは,この友好関係にあります。
会議では,常に生物学の発展ならびに登録者や利用者のニーズに留意し,これに応えるような対応をとっています。その結果,これまでに,遺伝子中心から遺伝子とゲノム両方を考慮した登録対応に移行し,配列長制限の撤廃,第三者によるアノテーションの許可,大量登録に対応する新しい配列分類の設定といった事項などが議論され決定されてきました。また近頃の非タンパク遺伝子研究の隆盛を反映して,ここ数年来は,RNA に関する新規事項の追加が必ず検討議題にあがっています。さらに,研究動向を少し先取りした議論も行われます。例えば,新世代のシークエンサーが研究のあり方やデータの形に与える影響についても議論してきています。そして,この会議での決定に基づいて,3バンク共通のアノテーション規範である Feature Table Definition の改訂も毎年行なわれており,通常,1年以内に公開データベースに改訂が反映されることになります。
今年三島で開催された 21回実務者会議,今回も多くの議題が提案され,より良いデータバンク活動へ向けて白熱した議論が展開されました。
今回の21回実務者会議の実務者会議での決定事項は,DDBJ のホームページ(DDBJ メールマガジン,ドキュメントのページ)や DDBJ/CIB Report にて報告予定です。塩基配列の登録だけでなく,各種データベースの利用に際しても有用ですので,是非ご参照ください。
(参考)
・ INSDC ホームページ:http://www.insdc.org/
・ The DDBJ/EMBL/GenBank Feature Table: Definition :http://www.ddbj.nig.ac.jp/FT/full_index.html
・ RNA ワールドへの対応--時代の要請にあわせた Feature Table Definition 改訂--
(今月の DDBJ トピック 12月):http://www.ddbj.nig.ac.jp/whatsnew/2007/071207-j.html
・ 国際実務者会議報告:http://www.ddbj.nig.ac.jp/insdc/icm2007-j.html 他
DDBJ が登録を受付け,2008年4月から5月にかけて DDBJ/EMBL/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。
ミヤコグサ (Lotus japonicus) ゲノムデータの公開
かずさDNA研究所から登録されたミヤコグサ (Lotus japonicus) のゲノムデータが公開されました。アクセッション番号は以下の通りです。
・HTG: リスト参照 (1,076 entries)
・PLN: リスト参照 (1,049 entries)
・WGS: BABK01000001-BABK01109991 (109,991 entries)
・CON: DF093176-DF093536 (361 entries)
これらは 5/28, 5/29 分の新着データとして DDBJ より公開されております。
また, anonymousFTP サイトから一括取得が可能です。
・HTG ファイル:Lotus_japonicus_HTG_080529_1.seq.gz
・PLN ファイル:Lotus_japonicus_PLN_080529_1.seq.gz
・WGS ファイル:Lotus_japonicus_WGS_080528_1.seq.gz
・Contig ファイル:Lotus_japonicus_CON_080529_1.seq.gz
カイコ ( Bombyx mori ) のゲノム配列データ新規公開
農業生物資源研究所から登録されたカイコ ( Bombyx mori ) のゲノム配列データが公開されました。
アクセッション番号と件数は, それぞれ以下の通りです。( )内はFTPファイル名です。
-BABH01000001-BABH01088672(88,672 entries)
-DF090316-DF092116(1,801 entries)
-DE143284-DE189151 (45,868 entries)
-DE246947-DE248527 (1,581 entries)
-DE420876-DE647768 (226,893 entries)
-DE378561-DE420875 (42,315 entries)
-AP008992-AP009041 (50 entries)
これらは4/23, 4/24分の新着データとして DDBJ より公開されております。また, anonymousFTP から一括取得が可能です。
メダカ ( Oryzias latipes ) EST 265,853 エントリの新規公開
基礎生物学研究所から登録されたメダカ ( Oryzias latipes ) の EST データ 265,853 エントリが公開されました。
アクセッション番号は以下の通りです。
-DK000001-DK265853(265,853 entries)
これらは5/2分の新着データとしてDDBJより公開されております。また, anonymousFTP サイトから一括取得が可能です。
-FTPファイル:Oryzias_latipes_EST_080502_1.seq.gz
Genomic Standards Consortium (GSC) が ゲノム・メタゲノムの記述に関する新規のガイドライン "Minimum Information about a Genome Sequence (MIGS)" を創設し,論文にまとめ,Nature Biotechnology (5月発行)に掲載されました。 また,論文発表に合わせて,GSC が Press release を行ないました
Genomic Standards Consortium(GSC) が Genomic Standards Consortium(GSC) は,主要なゲノムセンターならびに生命情報機関の代表者が名を連ねる国際的な組織であり,DDBJ バンク長の舘野義男もそのメンバーで,論文の著者の1人にもなっています。 以下は,Press release の日本語要約です。
Genomic Standards Consortium(GSC) が Genomic Standards Consortium(GSC) は,主要なゲノムセンターならびに生命情報機関の代表者が名を連ねる国際的な組織であり,DDBJ バンク長の舘野義男もそのメンバーで,論文の著者の1人にもなっています。 以下は,Press release の日本語要約です。
2008年5月9日付プレスリリース
世界の主要なゲノムならびに生命情報機関の代表者をメンバーとする Genomic Standards Consortium (GSC) が ゲノム・メタゲノムの記述に関する新規のガイドライン" Minimum Information about a Genome Sequence (MIGS)"を創設し,Nature Biotechnology に発表しました。
発表された新規ガイドラインは,最小限の情報 (MI) の表示規範です。 ゲノム配列決定技術の進歩に伴ってゲノムならびにメタゲノム配列決定プロジェクトの数は加速度的に増加し,ゲノムデータの量も右肩上がりで増加しています。大量データのデータベースへの蓄積と有効利用のためにはデータの電子化は必須であり,それゆえ MIGS のような共通の規範の設定がますます必要不可欠なものとなっています。
公共データベース中といえども,ゲノム・メタゲノムの情報の記載が不十分なものも多く,特に,近年,驚異的なスピードで増加中の環境サンプルにおいてその傾向が顕著です。GSC はこれに対応するためも,このプロジェクトを立ち上げました。
最近では様々な MI standard が発表されていますが,それらに比べて,MIGS は容易に使用可能で,実際,最近 MIGS を使用したケースが多数確認されています。 この論文の主たる著者でありGSCの創設メンバーである 英国 Ecology & Hydrology Center の Dr. Dawn Field は,「いつでも誰でも GSC への参加を歓迎する」と述べています。
-GSC とは?
GSC (Genomic Standards Consortium) は,2005年9月に設立され,ゲノムデータの記述を標準化することにより,データの相互利用と統合化を促進することをめざしています。 メンバーには, DDBJ,EMBL,GenBank の国際塩基配列データベースを構築する3つのデータバンクをはじめとして, JCBI,JGI,EBI,Sanger といった世界をリードするゲノム研究機関の研究者達が含まれており,彼らは, ゲノムデータベースの構築や大規模比較ゲノム研究に携わる生物学,コンピューターサイエンスの両分野から,これまでの経験を生かして,標準化のためのルール作りとその啓蒙に貢献しています。 -MIGS について
MIGS (Minimum Information about a Genome Sequence) は,真核生物,バクテリア,古細菌,細胞小器官,プラスミド,ウイルス等のゲノム情報を記述するものです。MIGS を用いることによって,核酸の由来,生物が置かれている環境,試料を採取した日付や時間,試料の採取や配列決定の手順,といったゲノム情報を特定するにあたっての決め手となる部分を可能な限り記述することができます。将来,シークエンサー等のテクノロジーの進歩によって変化する可能性はあるものの,大規模ゲノム時代の到来によって,今後ますますその重要性が高まると考えられます。
GSC (Genomic Standards Consortium) は,2005年9月に設立され,ゲノムデータの記述を標準化することにより,データの相互利用と統合化を促進することをめざしています。 メンバーには, DDBJ,EMBL,GenBank の国際塩基配列データベースを構築する3つのデータバンクをはじめとして, JCBI,JGI,EBI,Sanger といった世界をリードするゲノム研究機関の研究者達が含まれており,彼らは, ゲノムデータベースの構築や大規模比較ゲノム研究に携わる生物学,コンピューターサイエンスの両分野から,これまでの経験を生かして,標準化のためのルール作りとその啓蒙に貢献しています。 -MIGS について
MIGS (Minimum Information about a Genome Sequence) は,真核生物,バクテリア,古細菌,細胞小器官,プラスミド,ウイルス等のゲノム情報を記述するものです。MIGS を用いることによって,核酸の由来,生物が置かれている環境,試料を採取した日付や時間,試料の採取や配列決定の手順,といったゲノム情報を特定するにあたっての決め手となる部分を可能な限り記述することができます。将来,シークエンサー等のテクノロジーの進歩によって変化する可能性はあるものの,大規模ゲノム時代の到来によって,今後ますますその重要性が高まると考えられます。
Reference
Nature Biotechnology 26, 541 - 547 (2008),
PMID;18464787
"The minimum information about a genome sequence (MIGS) specification"
getentry は DDBJ が WWW および
E-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
このたび, getentry にて Protein ID をキーとして DAD ( DDBJ amino acid database ) 検索を行った場合,
一部のエントリで誤った結果が表示される状態が発生していたことが判明いたしました。詳細については下記の通りです。
・不具合内容: 検索対象データベースとして DAD を, ID として Protein ID を選択して検索を行った場合に 得られる検索結果のうち, 一部のエントリにおいて以下の状態が発生する。 複数の CDS Feature を有し, /pseudo qualifier を含む CDS Feature 以降に, /translation qualifier を含む CDS Feature があるエントリ において, /translation qualifier を含む CDS Feature に記された /protein_id からのハイパーリンクが 正しく機能していない。また, その Protein ID を指定した DAD 検索ができない。
・期間:2007年2月27日 から 2008年5月22日 まで
・問題があった Protein ID を含む DDBJ フラットファイルのアクセッション番号:(->番号リストはこちら)
・対応:問題の不具合を修正し, データの是正を行いました。現在は対応作業が完了し, 正常に検索結果を得ることができます。
・再検索のお願い
getentry にて, 該当する期間に, 該当する内容にて検索を行ったと思われる方は, お手数おかけ致しますが, 再度検索を実行して下さいますようお願い申し上げます。
ご迷惑をおかけしましたことを心よりお詫び申し上げます。
・不具合内容: 検索対象データベースとして DAD を, ID として Protein ID を選択して検索を行った場合に 得られる検索結果のうち, 一部のエントリにおいて以下の状態が発生する。 複数の CDS Feature を有し, /pseudo qualifier を含む CDS Feature 以降に, /translation qualifier を含む CDS Feature があるエントリ において, /translation qualifier を含む CDS Feature に記された /protein_id からのハイパーリンクが 正しく機能していない。また, その Protein ID を指定した DAD 検索ができない。
・期間:2007年2月27日 から 2008年5月22日 まで
・問題があった Protein ID を含む DDBJ フラットファイルのアクセッション番号:(->番号リストはこちら)
・対応:問題の不具合を修正し, データの是正を行いました。現在は対応作業が完了し, 正常に検索結果を得ることができます。
・再検索のお願い
getentry にて, 該当する期間に, 該当する内容にて検索を行ったと思われる方は, お手数おかけ致しますが, 再度検索を実行して下さいますようお願い申し上げます。
ご迷惑をおかけしましたことを心よりお詫び申し上げます。
ARSA は DDBJ が WWW で提供している高速なキーワード検索サービスです。
ARSA では, 現在 DDBJ, DAD をはじめとする24種のデータベース( DB )を検索対象としています。このうち PFAM 関連の DB として下記の6種の DB を提供しておりました。
・PFAMA
・PFAMB
・PFAMHMMLS
・PFAMHMMFS
・SWISSPFAM
・PFAMSEED 上記のうち, PFAMHMMLS, PFAMHMMFS, SWISSPFAM, PFAMSEED の 4DB につきましては, PFAMA のサブセットとなりキーワード検索対象としては冗長であるため, 2008年5月28日をもちまして検索対象から削除致しました。 今後は, PFAM 関連のキーワード検索として, PFAMA, PFAMB をご利用下さい。
ARSA では, 今後も機能改善・サービス改善に努めてまいります。
皆様のご理解とご協力をどうぞよろしくお願いいたします。
ARSA では, 現在 DDBJ, DAD をはじめとする24種のデータベース( DB )を検索対象としています。このうち PFAM 関連の DB として下記の6種の DB を提供しておりました。
・PFAMA
・PFAMB
・PFAMHMMLS
・PFAMHMMFS
・SWISSPFAM
・PFAMSEED 上記のうち, PFAMHMMLS, PFAMHMMFS, SWISSPFAM, PFAMSEED の 4DB につきましては, PFAMA のサブセットとなりキーワード検索対象としては冗長であるため, 2008年5月28日をもちまして検索対象から削除致しました。 今後は, PFAM 関連のキーワード検索として, PFAMA, PFAMB をご利用下さい。
ARSA では, 今後も機能改善・サービス改善に努めてまいります。
皆様のご理解とご協力をどうぞよろしくお願いいたします。
2008年3月18日から21日まで,韓国・済州島にて第7回日韓中バイオインフォマティクス・トレーニングコースが開催され,日本からも 10名の受講生が参加しました。参加者の一人である森 明弘さんに参加報告レポートをご寄稿いただきましたので紹介します。
尚、日韓中バイオインフォマティクス・トレーニングコースの詳細はこちらをご覧下さい。
(* 来年度(2009年)は日本で開催予定です。詳細は決まり次第 HP にてご連絡いたします)
「[第7回日韓中トレーニングコースを経て得られたもの」
尚、日韓中バイオインフォマティクス・トレーニングコースの詳細はこちらをご覧下さい。
(* 来年度(2009年)は日本で開催予定です。詳細は決まり次第 HP にてご連絡いたします)
「[第7回日韓中トレーニングコースを経て得られたもの」
森 明弘
国立遺伝学研究所 生物遺伝資源情報研究室
今回の日韓中トレーニングコース(以下、講習会と呼ぶ)の会場は、韓国・済州島(Jeju island)にある済州大学の国際センターであった。済州島は韓国のリゾート地と聞いていたので、かなり期待をして現地へ乗り込んでいったが、繁華街がある島の反対側に国際センターが位置し、車などの移動手段がない参加者にとって、「勉強するには最適な場所」であった。ちなみに、会場付近では動物園以外ではじめて「野キジ」を目撃した。参加者は日中韓から10名ずつ選ばれた人と、韓国の有志の学生の合計40名弱の人たちが集まって、とても「熱い」講師による「熱い」2日半の集中講義が行われた。
国立遺伝学研究所 生物遺伝資源情報研究室
| 会場の済州大学の国際センター。外観だけでなく、 |
この講習会については、前回韓国で行われた第4回目から知ってはいたし興味は持っていたが、なかなか参加するにはいたっていなかった。しかし現在行なっているプロジェクト以外のことでバイオインフォマティクスの基礎知識を学び、自分が関わっているプロジェクトを将来的に幅を持たせるために応募した。
バイオインフォマティクスと一口に言っても、進化を始め、タンパクの立体構造の予測、プロテオソームなどのオーミックス研究も含まれる大変幅広い分野である。また、分野の幅が広いだけでなく、各論一つ一つがとても興味深く、また奥の深い分野でもある。その各論を網羅的に勉強することは、研究しながらでは、時間的制約からどうしても自分の知っている分野もしくは、やりたい分野だけに偏ってしまう場合が多くなってしまう。結果として、現在行なっている仕事での問題が、他分野でのアプローチで解決する可能性はあるかもしれないが、分野の幅が広いため、結局わからずじまいになってしまっているのが現状としてある。
この講習会では、幅広いバイオインフォマティクスの各分野を専門講師によって学ぶことができる。具体的には、バイオインフォマティクスの基礎(Dr.館野@遺伝研)から始まり、蛋白質の構造解析(Dr. Standley@PDBj)、Mass Spectrometryの基本的解析(Dr. Xie@Shanghai Center for Bioinfomation Technology)、マイクロアレイの解析(Dr. Liu@ Shanghai Center for Bioinfomation Technology)、分子進化(Dr. Zhong@Fudan Univ)、
Interactomics(Bhak@Korean BioInformation Center)、ゲノムアノテーション(Dr. Kim@ Korean BioInformation Center)、オーミックス・データマイニング(Dr. Kim@Soongsil Univ)、ゲノムの進化(Dr. 五条堀@遺伝研)、ゲノムの進化の実例(Dr.斎藤@遺伝研)の以上10講座である。現在行なっている仕事(ゲノムの配列解析)の延長線上では、蛋白質構造やゲノムアノテーション、Interactomics、マイクロアレイの解析、オーミックス・データマイニングなどが必要な分野であると考えているが、個人一人で行う勉強量としては、まだまだ専門知識の不足は否めない。しかし、今回の講習会では、それらの専門分野の講師から一同に学べたことには、たいへん有意義な集中講義であった。また、分子進化を含む進化についての講義も、配列解析をしたあとで、特徴ある配列を分類するときに使えそうなアイデアがあることに気がつき、大変役に立った。
![]() |
![]() |
|
授業風景。
PCは一人一台ずつ貸していただけるので、 講義で紹介されているプログラムを実際に 動かして講義を受けながら進める。 |
昼食時間の様子 |
また、短い休み時間にできないような仕事の話でも、同年代や関連した仕事を行っているの人達が集まっているので、夕食後に会場のロビーで、ざっくばらんに他の参加者との話しをすることができた。たまたま、自分の仕事に関連した仕事を、植物を使って実験を行っている参加者と話すことができたし、さらにそこに同じような問題を理論的にアプローチをしている人もいた。同じような問題に対しても、異なった研究バックグランドを持つ人達の三者三様の考え方・アプローチの仕方があったし、改善すべき点もそれぞれに存在していたので、かなり熱い議論を夜中まですることができた。彼らの仕事も他の参加者が行っている仕事も、とても興味深いものがあり、自分の仕事を進める上でも、参考になる手法(情報)も得ることができたし、何よりも非常にいい刺激になった。自分が行ないたい(知りたい)分野の研究を行っている人達が参加している可能性が多いため、他の参加者達と積極的に会話をし、必要な情報をこの講習会で吸収するにはまたとない機会となった。
![]() |
|
講習会開始前の参加者による集合写真。
あれ?ビンを頭にのせている人もいるゾ。 |
![]() |
|
城山日出峰の頂上から見た日の出。世界遺産からの日の出
には感動したが、約1時間極寒の中で待ったので、3人 の表情に疲労感がただよう。 |
![]() |
![]() |
|
漢拏山(済州島で一番高く、世界遺産登録された山)を背景に
写る4人。バイオインフォマティクス学生会は、このメンバー を中心に、計画・進行中である。 |
「お茶博物館」入り口でガイドさんに説明を聞く3人。3本の棒は、
済州島では玄関門の意味である。済州島が火山島なので、 いたるところに石があるので、それを積み上げただけのものが、 木の下に積みあがっている石である。ガイドさん曰く、特に 意味がないようだ。 |
ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。
配信希望・変更・不要の方は,画面右上の「申込み・変更」ページをご利用になるか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
発行:日本 DNA データバンク (DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540 静岡県三島市谷田1111
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540 静岡県三島市谷田1111







