HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 51   2010年7月29日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
  夏の富士山
natunofuji 富士山というと白い雪をかぶった姿が思い浮かびますが,雪が溶けてしまう6月頃から初冠雪のある10月までは写真のような雪のない青い姿になります。 もちろん,下からは見えないだけで,山頂付近には雪渓や永久凍土があります。しかし,温暖化の影響でこれらも縮小傾向にあるそうです。特に,永久凍土が溶けることによって,溶岩の崩落や土石流が発生しやすくなっており,このままでは山の形が変わってしまうかもしれないという予測もあります。
梅雨が明け,これから本格的な富士登山シーズンが始まります。 ここ2-3年は富士登山ブームで,昨年は30万人近い人が山頂を目指しました。雲のない夜には,麓の町から登山者の明かりの列を見ることができます。 日本一高い場所から見る景色やご来光は絶景です。山頂まで行くのは無理でも,富士山の5合目までは車で行くこともできます。ぜひ一度富士山を訪れてみてはいかがでしょうか。

隔月公開の DDBJ メールマガジン第51号 web 版です。
メールマガジンに関するご意見やご質問がありましたら ddbjmag@ddbj.nig.ac.jp までお願いします。
  DRA/ERA/SRA からの公開データの提供を開始しました
DDBJ Sequence Read Archive (DRA) は,NCBI Sequence Read ArchiveEBI Sequence Read Archive との国際協力のもと,次世代シークエンサからの生出力データを収集,公開しています。
DRA/ERA/SRA から公開されているメタデータ XML と fastq ファイルが DRA の Download (FASTQ) サイト から取得できます。

また,DDBJ/EBI/NCBI の上記共同事業を Sequence Read Archive と総称することになりました。これに合わせ, DDBJ Read Archive の名称を DDBJ Sequence Read Archive に変更いたしました。
  AJACS & 第22回 DDBJing 講習会終了
DDBJ では全国各地で「DDBJing 講習会」を開催しています。 DDBJing 講習会は,塩基配列の登録方法や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により深く理解して利用して頂く助けになることを目指しています。
6月23-24日にかけてライフサイエンス統合データベースセンターで 「AJACS & 第22回 DDBJing 講習会」を開催しました。講習会で使用した資料は ダウンロードページ から取得できますので,どうぞご利用下さい。

次回の開催はまだ未定ですが,開催に関するお知らせはこのメールマガジンとホームページ上でご案内いたします。また,開催のご要望がありましたら検討いたしますので,以下のメールアドレスにお問い合わせ下さい。 ddbjing@ddbj.nig.ac.jp
  DDBJ リリース 82.0, DAD リリース 52.0 完成
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。
FTP によるデータの取得は,FTP・WebAPI のページ より可能です。

DDBJ リリース 82.0(2010年6月25日 完成)
エントリ数:120,034,097 総塩基数:115,169,689,543

DAD リリース52.0(2010年7月13日 完成)
エントリ数:17,348,613 総アミノ酸残基数:4,825,871,820aa


次回のリリースにおける予定
DDBJ リリース83.0,DAD リリース53.0 は,通常通り2010年9月に公開予定です。前回のリリースノートより「DDBJ リリース83.0,DAD リリース53.0 は,2010年12月に公開します」とお知らせしていましたが,取消させて頂きます。ユーザの皆様にご迷惑をお掛けいたしました事をお詫び申し上げます。
  DDBJ-XML 形式でのデータ提供終了のお知らせ
DDBJ-XML は,DDBJ が設計した XML 形式で検索結果等を提供する出力形式のひとつです。
DDBJ では,2010年6月25日をもちまして DDBJ-XML 形式でのデータ提供を終了いたしました。 詳細は以下の通りです。
ユーザの皆様にはご不便をお掛けいたしますが,ご理解下さいますようお願いいたします。

 終了日: 2010年6月25日 (金)

サービス 終了
DDBJ 定期リリース
DDBJ 新着データ
Anonymous-FTPの DDBJ-XML 形式でのデータ取得
getentry DDBJ-XML 形式での取得(web表示,E-mail 送付,FTP データ取得)
WABI GetEntry の getXML_DDBJEntry
DDBJ の getXMLEntry

 変換ツールを提供します。配置場所は以下の通りです。



2010年6月25日
  大量データの公開
DDBJ が登録を受付け,2010年6月から7月にかけて DDBJ/EMBL-Bank/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。
 分裂酵母 (Schizosaccharomyces pombe) GSS 113,551 エントリと EST 101,079 エントリの新規公開

大阪市立大学 から登録された分裂酵母 (Schizosaccharomyces pombe) 由来の GSS 113,551 エントリと EST 101,079 エントリが公開されました。
koubo
アクセッション番号 (Anonymous FTP 一括取得ファイル名) は以下の通りです。

これらは7月28日分の新着データとして DDBJ より公開されております。
(写真は統合データベースプロジェクトより)
 マウス (Mus musculus) 胚 small RNA の MGA 397,593 エントリの新規公開

神経研究所 から登録されたマウス (Mus musculus) 胚 由来 small RNA の MGA データ 397,593 エントリが公開されました。

アクセッション番号は以下の通りです。
  • ALAAA0000001-ALAAA0130942 (130,942 entries)
  • ALAAB0000001-ALAAB0116883 (116,883 entries)
  • ALAAC0000001-ALAAC0092019 (92,019 entries)
  • ALAAD0000001-ALAAD0057749 (57,749 entries)

これらは6月15日分の新着データとして DDBJ より公開されております。
  DDBJ での特許関連配列データの公開業務の紹介(2)
年々ユーザの関心が高まっている特許関連配列データの公開業務について,特許担当の男前(?)アノテータが連載コラムで紹介します。今回は、2回目になります。

第2回 韓国特許庁の特許配列データ
DDBJ アノテータ 青野 英雄
1. はじめに
日本 DNA データバンク(DDBJ)では,第1回コラムで紹介した 日本特許庁(JPO)の特許配列データ(特許データ)以外にも,韓国特許庁(KIPO)の特許データの公開も行っている。今回のコラムでは KIPO 特許データの概要を中心に,KIPO 関連機関からのデータ検索方法についても紹介を行いたい。

2. KIPO 特許データの概要
2-1) KIPO 特許データの登録の流れ
DDBJ では2008年3月より,KIPO の塩基配列およびアミノ酸配列の特許データについて公開を行っている。
DDBJ に登録される特許データは,KIPO から Korean Bioinformation Center(KOBIC) に送られ,KOBIC で DDBJ への登録ファイルが作成される。DDBJ では KOBIC から送付されるデータを公開フラットファイルフォーマット(FF)に変換し,公開を行っている。
DDBJ から公開された塩基配列データは,GenBank および EMBL-Bank の各データバンクからも公開されている。アミノ酸配列データにおいては登録されたデータバンクから公開が行われるが,他データバンクから公開されたアミノ酸配列データの公開においては各データバンクの判断となっている。KIPO のアミノ酸配列データにおいては,DDBJ 以外に EBI(European Bioinformatics Institute)からも公開が行われている。
KIPO に蓄積されていた特許データが DDBJ に登録されることで,国際塩基配列データベース(INSDC)のユーザに KIPO 特許データの提供が可能になっている。

2-2)KIPO 特許データの登録状況
KIPO の特許データにおけるアクセッション番号先頭の英文字(プレフィックス)は,DI が指定される。DI000001 から DI499999 が塩基配列データ,DI500001 から DI999999 がアミノ酸配列データとして割り当てられ,現在まで以下の様に282,161件の塩基配列とアミノ酸配列データが公開されている。

  塩基配列データ  : DI000001 - DI168562 (168,562件)
  アミノ酸配列データ: DI500001 - DI613599 (113,599件)

KIPO の特許データは不定期に受け付けており,近日中に追加登録が行われる予定である。

3. KIPO 特許データ検索
3-1)DDBJ からの KIPO 特許データの公開
[ 塩基配列特許データ ]
塩基配列特許データは,getentry,ARSA から公開を行っている。getentry ではアクセッション番号と公報番号による検索,ARSA ではアクセッション番号や公報番号の他にキーワードによる検索を行うことが可能である。また配列相同性検索(BLAST)では検索対象の特許データに KIPO の塩基配列データが取り込まれているため,類似配列の検索が可能となっている。さらに定期リリースデータでの公開も行っている。

[ アミノ酸配列特許データ ]
アミノ酸配列特許データは,getentry と anonymous FTP サイトから公開を行っている。getentry ではアクセッション番号による検索のみ可能である。anonymous FTP サイト では,KIPO のアミノ酸配列特許データを一括して取得が可能である。

3-2)KIPO 関連機関からの検索
DDBJ に登録されている KIPO 特許データは,KIPO が保持している特許データの一部にすぎない。そのため DDBJ に登録されているデータ以外の検索には,KIPO 関連機関からの検索が有効である。

[ KOBIC ]
KOBIC が提供する PATOME@Korea は韓国特許配列データベースであり,「PatSeq DB search」の項目では出願番号,出願人,英訳発明タイトルによる検索が可能である。特許公開公報の出願内容に関わる塩基配列,アミノ酸配列を参照することができるため,配列の取得もしくは参照したい場合には PATOME@Korea が有用である。
また PATOME@Korea では,韓国特許配列の塩基配列,アミノ酸配列を対象にした相同性検索サービスも提供している。しかしながら PATOME@Korea で提供している特許公報の本文は韓国語となっているため,何らかの方法で翻訳して内容を確認する必要がある。

[ Korea Intellectual Property Rights Information Service(KIPRIS)]
PATOME@Korea では特許公報本文が韓国語でのみ参照が可能であったが,KIPRIS が提供している 「KPA」 の検索では特許公報のフロントページおよび要約が英文にて参照可能である。そのため特許公報の出願内容を把握したい場合には有用である。「KPA」は,キーワード,公報番号(出願番号,公開番号),出願人,発明者により検索を行うことができる。
さらに 「K2E-PAT(Korean to English Patent Automatic Translation)」 においては,有料であるが特許公報全文を機械翻訳された英文にて参照が可能である。

4. 最後に
KIPO が保持する特許データの多くが,DDBJ からの公開に至っていないのが現状である。そのため今回のコラムでは,KIPO 関連機関での特許データの検索方法についても言及した。現在,DDBJ では KIPO からのデータをよりスムーズに受け入れる方法を検討中であり,今後,DDBJ から多くの KIPO データが追加公開される予定である。
次回以降のコラムでは JPO 特許データの公開 FF の構造,各特許庁の公報番号による getentry での検索方法,JPO の公開 FF から公報番号を取得し公開特許公報を参照するまでの検索手順について説明を行う予定である。
  "困った de Q" 第1回 ("SAKURA de Q" 同様,ユーザから寄せられる Q and A です)
Q.次世代シークエンサ(454,Solexa,SOLiD など)から得られた配列データの登録はどうすれば良いですか?

A.登録は生データか,解析後の配列データかにより登録先が異なります。

 解析する前の,出力された生データは DRA が登録先になります。DRA への登録には,次世代シークエンサからの「出力データ」と,研究概要やサンプル情報などの出力データを説明する「メタデータ」が必要になります。詳細は,DDBJ Sequence Read Archive (DRA) をご覧下さい。

 アセンブル等によって解析した後の配列データは,長大配列(ゲノム)や大量データを登録する DDBJ 大量登録システム(MSS)をご利用下さい。詳細は,Mass Submission System (MSS) とは? をご覧下さい。



 なお,次世代シークエンサより得られた出力データの解析には DDBJ Read Annotation Pipeline をご利用頂けます(ご利用には申請が必要です)。
  アンケートへご協力下さい
アンケートは終了しました。
  ddbjmag@ddbj.nig.ac.jp

この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・中止・変更の方は,「申込・変更」ページをご利用下さい。
発行:日本 DNA データバンク(DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111