HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 58   2011年3月1日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
2011年度 国立遺伝学研究所 一般公開
sakura1

国立遺伝学研究所は,桜の名所として多くの皆様に親しまれています。 研究所では,年に一度桜の季節にあわせ構内の一般公開を行っております。 研究所で行われている研究について知っていただきたく,日頃の研究成果を展示や講演会で公開いたします。 同時に,お花見も楽しんでいただいております。
構内には,約260種類の桜が植えられ,1本1本の木肌,花弁の色や形や香りの違いを楽しめます。 研究所は小高い丘の上にあり,そこまでの並木には道の左右に約125本の桜が植えられ,桜のトンネルを通り抜けお越しいただけます。
今年の一般公開は,4月2日(土)です。三島駅から無料シャトルバスも運行されます。皆様のお越しをお待ちしております。 詳細は,こちら をご覧下さい。

DDBJ メールマガジン第58号 web 版です。

DDBJ リリース84.1,DAD リリース 54.1 公開

DDBJ リリース84(2010年12月公開),DAD リリース 54(2011年1月公開)に一部不具合が発生していたことが判明したため, 訂正版 DDBJ リリース 84.1DAD リリース 54.1 を公開しました。

  参照: DDBJ リリース84 における不具合のお詫びDAD リリース 54 における不具合のお詫び

DDBJ/EMBL/GenBank Feature Table Definition 改訂

Feature Table Definition (FT-Doc) は, DDBJ/EMBL-Bank/GenBank 国際塩基配列データベース構築のために,DDBJ, EMBL-Bank, GenBank が三者間で定めた共通のアノテーション規範です。 毎年5月に開催される国際実務者会議 での決定を受けて改訂が行われ,公開データベースにもその改訂が反映されています。 第23会国際実務者会議 (2010年5月に英国 EBI で開催)での決定事項を基に,2011年1月にFeature Table Definition が改訂されました。

DDBJ will continue Sequence Raw Data Archiving


DDBJ has been archiving raw data from Sanger sequencers and so called next-generation sequencers as a part of EBI/NCBI/DDBJ International Nucleotide Sequence Database Collaboration (INSDC), by receiving data submissions from sequence centers mainly in Japan and also from several other countries.

The data submitted to DDBJ are processed into INSDC approved format and exchanged among NCBI and EBI frequently to make a same data set in either bank at the timing of data publication to minimize the difference in convenience of data access from all over the world.

In light of the recent announcement that NCBI, who has been playing a hub in raw data archiving, will discontinue its Sequence Read Archive and Trace Archive repositories, DDBJ's archiving will be affected somehow in the near future.

However, at this moment, DDBJ does not plan to discontinue either of the service to meet the demand of the domestic community as well as of the global one.

DDBJ has just started to formulate the plan to minimize the effect to the present activity of INSDC as well as the entire community in collaboration with other INSDC members.

  参照: DDBJ will continue Sequence Raw Data Archiving

大量データの公開

農業生物資源研究所 から登録されたイネ (Oryza sativa Japonica Group) 由来の GSS データ 59,716 エントリが公開されました。

アクセッション番号は以下の通りです。

  • FT872362-FT932077 (59,716 entries)

これらは2月25日分の新着データとして DDBJ より公開されております。


理研バイオリソースセンター から登録されたマウス (Mus musculus domesticus) 由来の GSS データ 131,507 エントリが公開されました。

アクセッション番号 (Anonymous FTP 一括取得ファイル名) は以下の通りです。

  関連ページ理研バイオリソースセンター DNA BANK

これらは2月5日分の新着データとして DDBJ より公開されております。

国立遺伝学研究所 大型計算機(supernig)利用申請継続手続きのご案内

国立遺伝学研究所の大型計算機(supernig)は,利用期間が一事業年度となっており, 継続して利用を希望される方には,年度毎に継続の手続きをお願いしております。

 2011年4月以降もご利用を希望される方は,2011年3月31日までに「国立遺伝学研究所大型計算機(supernig)利用申請(継続)」 より継続の手続きを行なって下さい。 2011年1月以降に新規の利用申請をされた方も利用期間は2011年3月31日までです。

 利用を終了・中止される方は「中止申請」より,所属,E-mailなど変更がある方は「変更申請」より,必ず手続きして下さいますようお願いいたします。 各手続きは,「計算機利用に関する申請」 より行えます。



* 上記は該当者へメールにてご案内済みです。継続手続きがお済でない方は,必ずお忘れにならないように期限内にお済ませ下さい。 ご不明な点などがございましたら,お問い合わせ(大型計算機(supernig)) よりご連絡下さい。

"SAKURA de Q" 第9回 (ユーザから寄せられる Q and A です)

Q.テンプレートについて教えて下さい。

A.テンプレートとは,複数エントリ間で共通している情報をまとめて保存するものです。 共通した情報を持つ複数のエントリを登録する際に,テンプレートを基に各エントリ固有の情報を入力することで, 共通した情報をエントリ毎に入力する手間を省くことができ,入力作業の負担を軽減します。

テンプレートを作成するには,複数エントリ間で共通している情報(コンタクトパーソン情報,公開予定日,登録者情報,REFERENCE(論文)情報など)を入力し, 「情報入力メインページ」の左下にある[Save as Template]をクリックして下さい。次のページで「TemplateID」が表示されますので, 記録をとってから[OK]ボタンをクリックして下さい。

58SAKURAdeQ

テンプレートを使用して登録作業を開始する際は,SAKURA トップページの「テンプレート使用」→ [Start from Template] をクリックして, コンタクトパーソン電子メールアドレスとTemplateID を入力して下さい。 保存したテンプレートの情報が反映された状態で登録を開始することが出来ますので, 各エントリ固有の情報(塩基配列やfeature 情報など)を登録するだけで登録作業を完了させることが出来ます。

2010年10月よりこのテンプレートの保存期間は,作成日より6カ月となりました。 また,2010年10月26日(火)にそれまで保存されていたテンプレートの削除を行いました。

  参照: テンプレートの削除について

DDBJ アノテータの業務紹介 〜 2.SAKURAでの登録(前編)

ユーザーの皆様に DDBJ の業務内容を知って頂き,より身近に感じて頂くために DDBJ アノテータの仕事をリレー連載コラムで紹介します。


  SAKURA での登録(前編)
DDBJ アノテータ 筒井 波留

ご存じの方も多いと思いますが,DDBJ への塩基配列の新規登録は,SAKURA大量登録システム(MSS) により行うことができます。いずれの方法によるデータについても,DDBJ 到着後に公開可能な状態に整え,国際塩基配列データベース(DDBJ/ EMBL-Bank /GenBank) (INSD) で共通のアクセション番号を発行し,即時あるいは将来公開するという流れは同じですが,今回はこのうち,SAKURA による登録についてお話いたします。


1)SAKURA history
SAKURAは,DDBJ が運用している WWW 経由の塩基配列データ登録システムで,運用を開始した1995年は,大きな話題となったあのWindows 95/インターネット・エクスプローラーが世に出た年です。ご記憶にあるかと思いますが,あの時代,まだまだインターネットが今日のように普及してはいませんでしたが,DDBJ ではいちはやくネット社会の到来を見据え,WWW 経由の塩基配列データ登録システムの運用を開始しました。ちなみに,命名は,DDBJ のある遺伝学研究所が桜の名所であることに由来します。

  参照: 2011年度 国立遺伝学研究所 一般公開

その後,様々な改良を重ね,今日の形で皆さまに利用していただいております。SAKURA では,配列長が20bp 以上500,000bp 以下の,WGS, MGA 以外の塩基配列の登録が可能で,1エントリ(Entry) 毎に塩基配列,その生物学的な機能と特徴(Feature/Qualifier),登録者情報文献情報等 を対話形式で入力し登録します。このため多数エントリ,あるいは生物学的な機能と特徴が多数な,ゲノムデータ等の登録には,あまり向いておりません。そのような登録のために大量登録システム(MSS)を用意しており,これにつきましては,次回以降にご紹介する予定です。

登録をSAKURA とMSS のどちらで行うかは,最終的には登録者のご判断によりますが,データがDDBJ に到着後は,同じ流れ,すなわち,「1.データの査定 → 2.アクセッション番号の発行と通知 → 3.公開または,一定期間非公開」 というもので,私たちアノテータの作業も同じです。

  参照: 塩基配列登録の流れ(データ受付からデータベース公開まで)

一度の登録件数が多い場合や多数のFeature を持つ場合(概ね30以上)には,MSS をお勧めしていますが,実際には,SAKURA に慣れた方がテンプレート 機能を使い数百件を,また多数のFeature を持つゲノムデータをSAKURA から登録されることもありますので,私たちSAKURA 担当の扱うデータの数,内容も様々です。


2)SAKURA による一次チェック
SAKURA では必要な情報が出来るだけ適切に入力されるように各画面が構成されており,必須入力項目の漏れや,記載形式,明らかな入力内容の不整合等のチェック,いわゆる一次チェックを経たデータがDDBJ に送られます。SAKURA での入力段階で,各画面の説明・注意に従い適切にご登録いただければ,次の査定作業が大幅に軽減され,より迅速なアクセッション番号の通知が可能となります。ご登録時の注意につきましては既報メールマガジンの「ユーザーの皆様へ,お願いです!」 もご覧下さい。


3)査定 ・二次チェック
SAKURA の一次チェックを経て,DDBJに送られたデータは,祝休日を除き送付翌日にも,私たちアノテーターが査定作業(塩基配列とその付帯情報を公開可能な状態に整える作業)を開始します。一次チェックを経て登録されたとはいえ,しばしばデータには様々な修正を加える必要があり,SAKURA では検知不能なミススペルの修正,入力内容が当該データとして適切かどうか等を1エントリ毎に詳細に査定していきます。

その際,TSUNAMI というアノテーションツールといくつかの補助ツール,内部専用のblast/データベース等を利用しています。TSUNAMI はDDBJ が独自で開発したアノテーションツールで,2001年の導入以来,大小様々な変更を,時代とともに加え現在まで使い続けています。基本的に,1エントリは一人のアノテーターが担当し,連番指定で登録された場合は,その一連の複数エントリは,同じ担当者が査定を行います。同日など,近い時期・短い期間内で同じ登録者から複数回の登録があった場合にも,一人のアノテーターが担当することが多く,できるだけ均一で高品質な内容の構築に努めています。もちろん異なるアノテーターが担当しても,査定結果が一定であるための主な指針として,INSDC で定める基準Feature Table Definition (FT-Doc) とDDBJ の注釈規範があり,これらに従い査定作業が行われます。


4)Feature Table Definition (FT-Doc)
DDBJ に登録されたデータは, 公開と同時にGenBank とEMBL-Bank に送られ,DDBJ が発行したアクセッション番号がGenBank やEMBL-Bank でも共通のものとなります。この毎日のデータ交換を円滑に行いINSD で問題なく公開するために,共通なルールFeature Table Definition(FT-Doc) を定めています。

FT-Doc は国際協力開始当初からのものが,必要に応じて変更され現在に至っていますが,時代の要求等に合わせ,Feature/Qualifier の記載則改定を重ねてきました。日々の登録・更新・公開作業で問題があれば,まずDDBJ 内でアノテーターが検討し,その上で必要な場合は,EMBL-Bank/GenBank と主にメールで協議をしていますが,INSDC で更に検討が必要な問題については,毎年5月に,日本・イギリス・アメリカと開催地を持ち回りで国際実務者会議を行い,そこで直接各バンク代表が顔を会わせて議論し,INSDC としての対応を決定しています。この会議では,時代の要求に合わせたINSD であり続けるために,今まで,Division の新設・廃止,アクセッション番号の桁数の変更,アクセッションprefix の各バンクへの割り当て,次世代シークエンサからの出力データのためのデータベース,Feature/Qualifier の新設・統合・廃止・記載則改定等,大小様々な問題を検討してきました。

このうち,Feature/Qualifier の記載則改定の結果を反映した改定版FT-Doc を毎年公表しています。ここでの決定事項は,査定に直接関係し,私たちの査定作業もこれにより変わります。
最近の例としては,2010年の会議で合意された,トランスポゾン等転移因子の記載方法の変更があります。それまでのrepeat_region Feature での記載から,新設Feature のmobile_element へ変更となりました。
このような改定については,DDBJ HP で広報してはおりますが,全ての登録者に十分認識していただく事はなかなか難しく,改定前の古い記載則に従い登録される事もあり,その場合はご説明して私たちが修正することとなります。当然ながら,FT-Doc 改定に合わせ,SAKURA やTSUNAMI,その他の補助ツールも更新されていきます。

  参照: DDBJ/EMBL/GenBank Feature Table Definition 改訂

後編へつづく
アンケートへご協力下さい

アンケートは終了しました。

ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,配信を希望される方に送らせて頂きます。
配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。
発行:日本 DNA データバンク(DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111