HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 50   2010年5月27日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
 「三島探訪」 〜 清流とうなぎ
unagi 三島には,“富士の白雪朝日で溶ける,溶けて流れて三島にそそぐ”と歌われる,富士山からの清らかで豊かな伏流水が湧き出ています。 三島の中心街にはせせらぎや緑を巡る遊歩道があり,心地良い散策ルートになっています。 三島で発見された,冷たい清流にだけ育つ水草,三島梅花藻(ミシマバイカモ)も見られます。 また,三島の代表的な食の文化として,うなぎがあります。三島のうなぎ屋さんでは,この富士山からの伏流水でさらした,ひときわ美味しいうなぎが食べられます。 三島へいらした際はぜひ,せせらぎとともにうなぎをお楽しみ下さい。

隔月公開の DDBJ メールマガジン第50号 web 版です。
メールマガジンに関するご意見やご質問がありましたら ddbjmag@ddbj.nig.ac.jp までお願いします。
  AJACS & 第22回DDBJing 講習会 in 東京 開催
DDBJ では,DDBJ が提供している塩基配列の登録や検索・解析のためのサービスをユーザの方々により有効に利用していただくために,「DDBJing 講習会」を開催しています。今回は,ライフサイエンス統合データベースセンター(DBCLS) と合同で 2010年6月23-24日 に 「AJACS & DDBJing 講習会 in 東京」 を開催いたします。DBCLS と DDBJ の各 Web サービスの利用等について講義と PC を用いた実習を行います。詳細については,「AJACS & 第22回DDBJing 講習会 in 東京」のお知らせ のページをご覧下さい。

  日 時: 2010年6月23日(水)- 24日(木)
  場 所: ライフサイエンス統合データベースセンター(東京大学本郷キャンパス)会場アクセス
  対 象: DBCLS, DDBJ を利用される方をどなたでも歓迎します(定員30名)
  参加費: 無料

現在,参加申込み受付中です。皆様のご参加をお待ちしています。
*定員になりましたので参加受付はしめきりました。(6/4)
  次世代シークエンサからの生データとアセンブルしたデータセットの公開
DDBJ Sequence Read Archive (DRA) は,次世代シークエンサからの出力データのためのアーカイブです。次世代シークエンサからの出力データは,出力したままの“生”データを DRA に,アセンブルしアノテーションした配列データを DDBJ に登録します。DRA は2008年から活動を開始し,NCBI Sequence Read Archive (SRA)EBI European Read Archive (ERA) との国際協力のもとデータベースを運営しています。下記の図をご参照下さい。


このたび,DRA と DDBJ から生データとアセンブル後のデータセットを2件公開しました。

 慶應義塾大学 榊原研究室 から登録された納豆菌 (Bacillus subtilis subsp. natto str. BEST195 ) ゲノム配列の生データが DRA から,アセンブルした配列データが DDBJ からそれぞれ同時に公開されました。この登録が,DRA と DDBJ から生データとアセンブル後のデータセットが公開された初のケースになります。

 DRA アクセッション番号: DRA000001
  ・DRA000001 データのダウンロードは Anonymous FTP サイトをご利用下さい。

 アセンブル後のゲノム配列データは DDBJ から以下のアクセッション番号で公開されています。
  ・ゲノム配列: AP011541
  ・プラスミド pBEST195S の配列: AP011542

 農業生物資源研究所 QTLゲノム育種研究センター から登録されたイネ コシヒカリ (Oryza sativa Japonica Group, cultivar Koshihikari ) ゲノム配列の生データと配列データが公開されました。

 DRA アクセッション番号: DRA000010
  ・DRA000010 データのダウンロードは Anonymous FTP サイトをご利用下さい。

 アセンブル後のゲノム配列データは DDBJ から以下のアクセッション番号で公開されています。
  ・WGS: BABO01000001-BABO01654543 BABO.gz (654,543 entries)
  ・scaffold CON: DG000025-DG000036 Oryza_sativa_Japonica_Group_CON_100402_1.seq.gz (12 entries)

 関連アナウンス:
イネ コシヒカリ (Oryza sativa Japonica Group, cultivar Koshihikari) WGS 654,543 エントリの新規公開 2010.4.5


DRA はこれまでに登録191件を受け付け,23件を公開してきました。DRA から公開中のデータは データ公開サイト から閲覧可能です。
今回のトピックではゲノム配列データのみ紹介しましたが,DRA はトランスクリプトーム解析や DNA-タンパク質間相互作用解析,small RNA 検出,DNA メチル化解析等のデータも受け付けています。次世代シーケンサの普及に従いデータ登録の増加が予想されており,DRA は受付の効率化を進めております。


2010年4月8日
  getentry の検索結果で画面に表示できない巨大エントリの結果取得方法の自動変更
getentry は DDBJ が WWW で提供しているアクセッション番号などによる高速なエントリ検索システムです。また,公開データが最も早く(通常は公開作業をおこなった翌日)参照できる検索サービスです。

これまで,検索結果において,1エントリのサイズが10メガバイトを超える大きなエントリを表示させようとした場合,システムが不安定となり,その後のサービスが継続できない場合がありました。そこでこの問題を回避するため,データ取得方法を一部変更し,改善をおこないました。

今後は,結果取得方法に WWW (画面表示)を指定した場合でも,検索結果に1エントリサイズが10メガバイト以上の場合(複数エントリを指定した場合には,1つでも該当するものがあれば),自動的に FTP ファイル転送による結果取得に変更されます。

なお,連携処理として,ARSA 検索結果からのエントリ表示,相同性 (blast) 検索結果からのエントリ表示においても,同様の改善表示が適用となります。

この変更は,2010年5月25日より公開となりました。
DDBJ では,今後さらに,皆様からのご意見をもとに,より使いやすいサービスを目指して改善や機能拡張を進めていきます。

2010年5月25日
  Twitter 始めました
DDBJでは,"Twitter" を始めました。お知らせや更新情報などを中心につぶやきます。どうぞご覧下さい。
http://twitter.com/DDBJ_topics
  DDBJ/EMBL/GenBank Feature Table Definition 改訂
Feature Table Definition (FT-Doc) は, DDBJ/EMBL-Bank/GenBank 国際塩基配列データベース構築のために,DDBJ, EMBL-Bank, GenBank が三者間で定めた共通のアノテーション規範です。2010年4月に Feature Table Definition が改訂されました。 Version は,8.3 です。
  DAD リリース 51.0 完成
  大量データの公開
DDBJ が登録を受付け,2010年4月から5月にかけて DDBJ/EMBL-Bank/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。
 イネ コシヒカリ (Oryza sativa Japonica Group, cultivar Koshihikari) WGS 654,543 エントリの新規公開

農業生物資源研究所 から登録されたイネ コシヒカリ (Oryza sativa Japonica Group, cultivar Koshihikari) 由来の WGS データ 654,543 エントリと関連データが公開されました。

アクセッション番号 (Anonymous FTP 一括取得ファイル名) は以下の通りです。
関連ページ
 ゴマノハグサ科の一種 (Striga hermonthicas) EST 67,814 エントリの新規公開

理化学研究所 から登録されたゴマノハグサ科の一種に (Striga hermonthica) 由来する EST データ 67,814 エントリが公開されました。

アクセッション番号 (Anonymous FTP 一括取得ファイル名) は以下の通りです。 関連ページ
これらは4月2日分の新着データとして DDBJ より公開されています。
 マウス (Mus musculus domesticus) GSS 122,131 エントリの新規公開

理研バイオリソースセンター から登録されたマウス (Mus musculus domesticus) strain: C57BL/6NCrlCrlj 由来の GSS データ 122,131 エントリが公開されました。

アクセッション番号 (Anonymous FTP 一括取得ファイル名) は以下の通りです。
関連ページ
これらは4月1日分の新着データとして DDBJ より公開されています。
  DDBJ での特許関連配列データの公開業務の紹介
年々ユーザの関心が高まっている特許関連配列データの公開業務について,特許担当のイケメン(?)アノテータが連載コラムで紹介します。

第1回 日本特許庁の特許配列データ
DDBJ アノテータ 青野 英雄
1. はじめに
私はアノテータとして,公開特許公報に含まれる特許配列データ(特許データ)の登録および公開業務を担当している。
今回のコラムでは,先行技術調査において調査対象とする人が多い思われる日本特許庁(JPO)の特許データを中心に,国際塩基配列データベース(INSDC)での特許データの公開概要,DDBJ の検索ツールを利用した先行技術調査について説明を行いたい。

2. 国際塩基配列データベースからの特許データ公開
DNA Data Bank of Japan(DDBJ)は,米国の GenBank,欧州の EMBL-Bank とともに INSDC を構築している。INSDC は科学研究由来の配列データだけでなく,以下の様に日本,韓国,米国,欧州の各国特許庁から登録された特許データを,各データバンクから公開を行っている。


各国特許庁から送られてくる特許データには,塩基配列とアミノ酸配列データがある。特許データの塩基配列データは各データバンクから公開が行われた後に,INSDC 内で交換が行われる。しかしアミノ酸配列データにおいては登録されたデータバンクから公開が行われるが,他データバンクから公開されたアミノ酸配列データの公開においては,各データバンクの判断となっている。

3. JPO 特許データの概要
3-1)DDBJ に登録される特許データ
DDBJ から公開している特許データは,特許出願後に公開された公開特許公報に含まれる塩基配列とアミノ酸の配列データである。
そのため DDBJ から新規に公開される配列は,基本的に特許権に関する査定および登録が行われる前の配列である。新規公開されたデータのその後の査定状況,既公開データの査定および登録状況については,特許電子図書館(IPDL)等で確認を行う必要がある。

 参考: 「特許電子図書館(IPDL)」

3-2) JPO 特許データの種類と公開頻度
JPO から送られてくる特許データには,日本国内に出願された国内公開公報,国際出願され JPO が国際調査を行った国際公開公報,外国からの日本国指定の国際出願により JPO から公表された公表公報由来の配列が含まれる。
JPO から DDBJ に月に1度の定期公開データ,不定期の追加公開データの送付が行われ,DDBJ からは月に1度以上の公開を行っている。

3-3) JPO 特許データの内容
JPO の特許データには,出願人から提出された配列(塩基配列/アミノ酸配列),生物名,出願人名,発明者名,公開公報番号,公報公開日,出願番号,出願日,優先日および優先出願番号,コメント,配列の特徴を示す Feature 情報などが記載される。
DDBJ では,JPO から送付されるデータを公開フラットファイルフォーマット(FF)に変換し,公開を行っている。また同一の公報番号に複数の配列が含まれる場合は,各配列ごとにアクセッション番号が付与される。

 参考: 「特許・知的所有権と優先権」

3-4) 特許出願中の塩基配列の DDBJ への登録および公開
特許出願中の塩基配列については,特許出願後に発行される公開特許公報に含まれる塩基配列が JPO から DDBJ に送付されるため,DDBJ に新規登録する必要はない。
しかし論文執筆のために,出願前に出願予定の塩基配列を DDBJ に登録を行う必要がある場合は,DDBJ から公開された塩基配列データは「公知」の扱いになるため,DDBJ からの公開には注意が必要である。出願前のデータ公開には,特許法第30条の「発明の新規性喪失の例外規定」に適用されるかを JPO に確認し,慎重に対応する必要がある。

 参考: 「特許法第30条(新規性喪失の例外)の適用について」

4. 先行技術調査のヒント
DDBJ が提供している検索サービスを使用することにより,先行技術調査や特許申請を検討している配列について,配列相同性検索とキーワード検索の側面から調査を行うことができる。

4-1) 特許データの見分け方
検索されたデータにおいて,アクセッション番号の先頭の英文字(プレフィックス)から特許データであるか,また特許データの由来特許庁を判断することができる。JPO の プレフィックス では,E, BD, DD, DJ, DL, DM, FU, FV, FWのアクセッション番号となっている。また特許データの Division は PAT に分類される。そのため公開 FF のアクセッション番号,LOCUS 行を確認することで,特許データであるかを確認できる。

4-2) 配列相同性検索
特許出願予定の塩基配列を手元に保持している場合は,配列相同性検索(BLAST) により類似配列を確認することができる。検索条件で Division から PAT を選択することにより,既公開の特許データを対象に類似配列が存在するかを確認することができる。
類似配列が認められた場合,公開 FF から公報番号を確認し,IPDL 等で出願内容および請求項,審査状況を確認することで,出願予定の内容の先行技術調査を行うことができる。

4-3) キーワード検索
JPO の特許データには英訳された発明タイトルが記載されている。そのため塩基配列データにおいては,キーワード検索システム ARSA を使用することにより,関連キーワードから先行技術調査を行うことが可能である。Advanced Search 画面の検索条件で,Division から PAT を選択することにより,特許データに限定した検索することが可能である。

5. 最後に
先行技術調査のために DDBJ の公開データを利用されている方も多いかと思う。当コラムが,DDBJ での特許データの調査および各データの公開 FF を読み解くための一助になれば幸いである。また一般の研究者の方も,特許データに興味を持って頂けたら幸いである。
次回以降は,KIPO データの紹介,特許データの公開 FF の構造,公開 FF からの公開特許公報の検索方法について説明を行う予定である。
  SAKURA de "Q" 第6回 (ユーザから寄せられる SAKURA に関する Q and A)
Q.掲載する論文が同一でない配列は,「連続したアクセッション番号の発行」を選択しての,登録はできないのでしょうか?

A.SAKURA では,「データ公開ページ」で「連続したアクセッション番号の発行」で「希望する」にチェックした場合, 以下の条件(1),(2),(3)を満たす複数のエントリに対して,連続したアクセッション番号を発行しております。

 (1)全件,即日公開,あるいは同一のデータ公開予定日を持つ
 (2)全件,登録者・コンタクトパーソンが同一
 (3)全件,論文への掲載予定がない (Published Only in DataBase) あるいは,掲載予定の論文が同一であると想定される

原則,SAKURA では,文献情報が違う配列の場合「連続したアクセッション番号の発行」は行っておりませんが, どうしても「連続したアクセッション番号の発行」を希望する場合は,以下の方法で登録作業を行って下さい。

連番登録では,1件目の「REFERENCE 情報」が2件目以降の登録時に [Reference Information #1] として 固定情報となります。
1件目の登録作業が完了しますと,こちらの情報は変更する事が出来ませんので,2件目以降の登録時に1件目と 異 なる「REFERENCE 情報」を入力する場合は,「情報入力メインページ」で [Add Reference Information] を 押して,正しい文献情報を入力して下さい。
その後,「登録付加情報ページ」に,そのエントリに対する正しい文献情報を明確に記入して下さい。

全ての登録作業完了後,修正希望の EntryID と修正内容(正しい「REFERENCE 情報」)を sakura-admin までご連絡下さい。
  アンケートへご協力下さい
アンケートは終了しました。
  ddbjmag@ddbj.nig.ac.jp

この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,「申込み・変更」ページをご利用になるか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
発行:日本 DNA データバンク (DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111