HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 63   2011年8月4日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
金時山
kintokiyama

7月1日に富士山の山開きも行われ,夏山登山シーズン到来です。写真は,金時山山頂からの眺望です。 金時山は,神奈川県と静岡県の境にあり,標高1213m の山です。金太郎伝説の地として伝えられています。
金時神社に記されたものによりますと,金太郎は,天暦10年(956年)5月に誕生しました。 金時山の大自然と母の愛情に包まれ,すくすくと元気な優しい子に育ちました。 時には熊と相撲を取り,力もつけました。 そしてある日,通りかかった源頼光と出会い,その力量を認められ家来となり,頼光四天王の一人として活躍したそうです。
登山道には,金太郎が遊んだという「手毬石」や金太郎が住んでいたという「宿石」などの巨石もあり,楽しい登山になるでしょう。

DDBJ メールマガジン第63号 web 版です。

DDBJ HP の CMS 導入のお知らせ

DDBJ では,CMS を導入し,8月1日にホームページのリニューアルを行いました。
CMS を導入することにより,DDBJ 内の各現場で内容のアップデートが行いやすくなりました。 そして今後,各現場でアップデートを行うことにより,ユーザへより早く,よりわかりやすく情報を伝えることを目指します。

変更箇所:

RSS 設定変更
これまでトップページに設置されていたデータ公開更新のRSS を getentry へ移行しました。 getentry より設定変更をお願いいたします。 (設定変更を行わないと,配信が中止されますのでご注意下さい)

トップページのRSS は,"HotTopics" などのお知らせを配信いたします。 日本語ページでRSS を設定すると日本語のお知らせ,英語ページでは英語のお知らせが配信されます。

Twitter アイコンを追加
トップページにTwitter アイコンを設置しました。"フォロー"をお願いいたします。

検索ボックスの変更
検索対象は,Google 検索を用いたサイト内検索に変更しました。

ユーザの皆様にはお手数をお掛けしますが,ご理解とご協力をお願いいたします。

「第24回 DDBJing 講習会 in 東京」 終了
ing24-07

DDBJ では全国各地で「DDBJing 講習会」を開催しています。 DDBJing 講習会は,塩基配列の登録方法やDDBJ が提供しているデータベース検索・解析サービスをユーザの方々により深く理解して利用して頂く助けになることを目指しています。

6月30日, ライフサイエンス統合データベースセンター にて「第24回 DDBJing 講習会 in 東京」を開催しました。 今回の講習会では,Next-Generation Sequencer(NGS) について中心に講義と実習を行ないました。
講習会で使用した資料は ダウンロードページ から取得できますので,どうぞご利用下さい。

次回の開催はまだ未定ですが,開催に関するお知らせはこのメールマガジンとホームページ上でご案内いたします。また,開催のご要望がありましたら検討いたしますので,お問い合わせ の「講習会」よりご連絡願います。

大量データの公開

DDBJ が登録を受付け,2011年7月から2011年8月にかけて DDBJ/EMBL/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。

徳島大学から登録されたマボヤ (Halocynthia roretzi) 由来の EST データが公開されました。

アクセッション番号は以下の通りです。
  ・FY844421-FY896670 (52,250 entries)  (getentry から検索可能です)

参考:MAGEST

沖縄科学技術研究基盤整備機構から登録されたコユビミドリイシ (Acropora digitifera) の WGS と scaffold CON のデータが公開されました。

アクセッション番号は以下の通りです。
  ・WGS                BACK01000001-BACK01053640 (BACK.gz) (53,640 entries)
  ・scaffold CON     DF093604-DF097774 (4,171 entries)

参考:
  ・沖縄科学技術研究基盤整備機構
   - Marine Genomics Unit
   プレスリリース:
   - 世界で初めてサンゴの全ゲノム解読に成功

  ・国立遺伝学研究所
   プレスリリース:
   - 世界で初めてサンゴの全ゲノム解読に成功

国立環境研究所から登録された Botryococcus braunii 由来の TSA と EST のデータが公開されました。

アクセッション番号は以下の通りです。
  ・TSA data      FX056085-FX112549 (56,465 entries)
  ・EST data      FY358876-FY368220 ( 9,345 entries)

※Botryococcus braunii は石油類似の炭化水素を蓄積することで注目されているようです。
参考:二酸化炭素排出抑制に資する革新的技術の創出

"困った de Q" 第6回 (ユーザから寄せられる Q and A です)

Q.DNA 多型のデータはどのように登録するのがよいでしょうか?

A. 以下の例をご覧下さい。
これは,ネコのあるlocus に関して日米において配列を調査した結果で, 下表のように3種類のhaplotype で示される配列多型を観測し, haplotype 毎には同一の配列であった場合です。

配列多型(haplotype) A B C total
Japan 75 38 0 113
USA 26 32 60 118
total 101 60 70 231

この場合,3通りの登録方法が考えられます。

(a) 配列多型の数と観測した集団の数の積算分を登録する
(上記例では,3(A, B, C) × 2(Japan, USA)= 6通り中,観測されていない日本 におけるhaplotype C を除く5件)
(b) 全てのデータ(上記の例では231個)を個別のデータとして登録する
(c) 配列の同一性にのみ着目して3件の配列データとして登録する

DDBJ では,(a) の登録方法を推奨します。
この場合,下記の要領でサンプルの由来情報をsource feature に記載して下さい。

    source        1..365
                  /country="Japan"
                  /frequency="75 in 113"
                  /haplotype="A"
                  /mol_type="genomic DNA"
                  /organism="Felis catus"


(b) の方法は,DDBJ (INSDC) では,基本的には,配列が同一であっても個別に配列を受け付けますので, 間違った登録方法ではありませんが,データ量が膨大で冗長なものとなり, 検索利用面での利便性を損なう可能性があります。
(c) の方法では,観測した集団の情報を捉えることが困難になります。


上記は平易な例ですが,実際には配列多型数や観測集団数も多く,その組み合わせも多数で複雑な場合が大半です。その場合, SAKURA のテンプレートによる複数エントリの登録法大量登録システム をご利用頂くと比較的簡便に登録が行えます。

詳細は, 多型関連研究における同一配列の代表データ登録 をご参照下さい。

DDBJ アノテータの業務紹介 〜 4.更新について(後編)

ユーザーの皆様にDDBJ の業務内容を知って頂き,より身近に感じて頂くためにDDBJ アノテータの仕事をリレー連載コラムで紹介します。


  更新について(後編)
DDBJ アノテータ 坂井勝呂,杉田里江,三村公子

前編 からのつづき

B. コンタクトパーソン・登録者情報の更新
コンタクトパーソンの所属の変更またはコンタクトパーソンの変更による所属先情報および連絡先情報(E-mail,Phone およびFax)の更新を行ないます。更新された所属先情報は,DDBJ フォーマットのフラットファイルREFERENCE1 上に反映されます。

所属先変更の際,フラットファイルの所属先情報に,新しい所属を記載せず,データ登録時の配列決定を行った旧所属先情報を,引き続き所属先情報として記載したい旨,希望される方もいます。旧所属先をフラットファイルに所属先情報として,所属先変更後も引き続き,記載・公開する事は可能ですが,DDBJ から問合せ・連絡を行なう際に使用する連絡先情報につきましては,連絡可能な情報への変更を必ずお願いしています。

なお,連絡先情報のE-mail,Phone およびFax の3項目につきましては,フラットファイルには希望が無い限り記載いたしません。

  参照コンタクトパーソン情報, 住所, 所属情報を変更したいDDBJ フラットファイルフォーマット改訂

C. 公開予定日の変更
登録時に一定期間非公開を希望した登録の場合,登録時に設定した公開予定日を修正します。新しい公開予定日を指定頂く際,必ず,対象のアクセッション番号をすべて記載し,日付も,半年後,4月頃,または投稿中の論文が受理されるまでといった曖昧な指定ではなく具体的な日付 (例: 2013/06/25)をもって,指定頂いています。もし,公開予定日の日付を特定出来ないと担当アノテータが判断する場合,必ず,登録者に確認を求めています。また,延長される期間について,特に規定はありませんが,多くの登録者の方が5年以内の日付を指定しています。また,変更といっても,延長だけでなく,公開予定日を指定した前倒し公開,即日公開も可能です。しかし,データベース上での公開は,処理状況などにもよりますが,公開作業の開始の翌日以降となりますので,ご了承下さい。

また,DDBJ から公開予定日前に公開予定日到来の案内メールを送信しておりますが,あくまでお知らせとして送信しております。メールトラブルなどにより,正しく送受信されないケースもありますので,登録データの公開予定日につきましては,登録者ご自身で責任をもって管理頂きますようお願いします。

  参照公開予定日を延期したい

D. 非公開データの登録抹消・公開データの利用制限処理
DDBJ に登録した非公開データを登録抹消,または既に公開されているデータに対して利用制限処理を行います。しかし,DDBJ/EMBL-Bank/GenBank で構成する国際塩基配列データベース(INSD,International Nucleotide Sequence Database) の諮問機関である国際諮問委員会において,明文化された方針(登録データの取り扱いについて を参照のこと)の理念に基づき,登録されたデータについて,その抹消・利用制限処理を安易にお受けする事は出来ないと考えています。

従って,抹消・利用制限処理の依頼を登録者より受けたとき,登録内容を更新することによって,抹消・利用制限処理の依頼に至った理由を克服出来ないか確認し,一定の条件下でのみ,依頼を受け付けています。詳細は,以下のリンク先をご参照下さい:

  参照公開されたデータを非公開に戻したいDDBJ に登録したデータを抹消したい

なお,一度データベース上に公開されたデータにつきましては,通常検索サービスから削除する事は可能ですが,getentry (DDBJ における主検索ツール)で,アクセッション番号で検索した場合,永久に閲覧可能な状態であり,EMBL-Bank,GenBank でも主検索ツールにおいては同様な対応となりますこと,また,公開されたデータを取得した不特定多数の第三者データベースにおいては削除されるとは限らない点をご理解お願いします。

E. 塩基配列の更新
塩基配列の更新は,更新後の塩基配列の全長(更新される部分だけでなく)をFASTA 形式で,メールに記載して(または添付ファイルで)送付頂くようお願いしています。 配列と同時に送付頂きたい情報は,以下のリンク先をご参照下さい:

  参照配列を更新したい

特に,配列の更新によって,Feature のlocation の更新もある場合,必ず,更新後のlocation もお知らせ下さい。

また,更新対象アクセッション番号が複数になる場合は,リダイレクション(< )のあとにスペースなしでアクセッション番号を記載したMulti-FASTA 形式が可能です。

公開されているデータの配列を更新しますと,データは即日公開されます。その場合,アクセッション番号に変更はありませんが,フラットファイルでversion 番号が一つ上がります(例:AB000001.1→AB000001.2)。また,CDS のアミノ酸配列も更新された場合,protein_id のversion 番号が上がります(例:BAA12345.1→ BAA12345.2)。また,CDS の更新をともなう配列の更新に際しては,適切にprotein_id が継承されていくこと(例のように,更新対象のエントリのCDS のprotein_id が,version 番号が”1” から”2” に上がっても,BAA12345 の部分が,更新前後で変更が無いこと)は,データベース側と利用者にとって有用な情報となります。継承の可否は,核酸配列,またはアミノ酸配列の相同性を基準とし,当該CDS の下位にあるqualifier(/gene,/product,/note など)のvalue を考慮して,担当のアノテータが判断する場合もありますが,登録者に継承の判断をお願いする場合もあります。継承が不適と判断された場合は,再公開時に新規にprotein_id が発行されます(例えば,更新前はBAA12345.1 だったものが,BAK40000.1 に変更)。

なお,protein_id は,翻訳されるCDS Feature に対してデータ公開時に発行されます。従って,データを非公開で登録された場合,データが公開されるまで,protein_id は発行されません。また,アクセッション番号のように,DDBJ からメール等でprotein_id をお知らせすることもありませんので,登録者ご自身で,データ公開後,確認頂くことになります。

F. 生物名の更新
原則的に,他の登録情報と同様に,登録後,塩基配列の得られた配列種の生物名を,更新することが随時可能です。更新後の生物名がtaxonomy database に登録されていない生物名の場合は,アップデート係からtaxonomy database に生物名の申請登録を行います。また,登録時は,種名が未確定で,"<属名> sp. " などのような"tentative name" で登録されたが,その後,種が同定された場合なども,taxonomy database に,登録された"tentative name" の更新を依頼します。しかし,更新後の生物名が新種の場合,提唱する新種の学名に関する文献が公表されていることが必須ですので,新種に関する論文が公開されていない段階(たとえ,論文が受理されていても)では,生物名の更新は出来ず,論文が公開後(オンラインでも可),改めて,生物名の更新を依頼頂くことになります。

なお,前編でも説明致しましたが,taxonomy database の学名が種々の理由で更新された場合,DDBJ でも変更のあった生物名を有するエントリについて,その生物名の更新作業を行います。登録者には,変更があった旨,メール等で連絡していますが,変更について,問題等がありましたら,アップデート係までお知らせ下さい。アップデート係では,登録者から送られた分類学上の意見およびその典拠となる論文等をtaxonomy database に転送することが可能です。しかし,taxonomy database は,分類学上の権威ではなく,生物名の表記を統一的に管理することに主眼をおいて構築されていますので,分類学的に普及している内容および登録者の分類学的な主張とは相容れない場合もあることをご理解下さい。

  参照Organism qualifier に記載する生物名

G. その他
遺伝子名 (gene qualifier またはproduct qualifier の値に相当)を含む,DDBJ に登録されたFeature/qualifier の登録情報を更新することができます。査定方針は登録時と同じで,FT-Doc およびDDBJ の注釈規範に照らしあわせ,査定を行っています。変更箇所が多数であるとか,複雑多岐にわたるためメールで一つ一つ記載することが煩わしい,ということがあるかと思いますが,そのような場合は,事前に,アップデート係までメールで,希望する更新の概要をお知らせ下さい(例えば,対象アクセッション番号,変更希望のFeature/qualifier 名等)。送付された概要をふまえ,依頼者の負担軽減を図れるよう検討します。場合によっては,アノテーションファイルの再作成等のかたちで更新の依頼をお願いする場合もあります。アノテーションファイルについては,大量登録システム(MSS) の利用(前編) をご参照下さい。

最後に
2回にわたり更新について,説明して参りましたが,更新の依頼で,不明な点があれば,お問い合わせ より「塩基配列データの更新・修正」までご連絡頂きますようお願いします。

ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,配信を希望される方に送らせて頂きます。
配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。
発行:日本 DNA データバンク(DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111