HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 44   2009年08月20日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
sky from DDBJ先日の皆既日食同様に,富士山も雪がすっかり消えた黒い山となってしまいました。多くの人がいだく富士のイメージ,純白の雪に覆われた姿からは程遠いですね。

DDBJ メールマガジン第44号 web 版です。メールマガジンに関するご質問やご意見がありましたら ddbjmag@ddbj.nig.ac.jp までどうぞ。



(撮影:国立遺伝学研究所特任教授 舘野義男)
生命情報・DDBJ 研究センターと日本 DNA データバンクの新スタッフが以下のように決まりました。どうぞよろしくお願いいたします。

 生命情報・DDBJ 研究センター

センター長
大久保 公策  (教授   生命情報・DDBJ 研究センター/遺伝子発現解析研究室)
センター事務局長
五條堀 孝 (教授   生命情報・DDBJ 研究センター/遺伝情報分析研究室    国立遺伝学研究所副所長)
 日本DNAデータバンク(DDBJ) スタッフ

中村 保一  (教授   生命情報・DDBJ 研究センター/大量遺伝情報研究室)
高木 利久  (教授   生命情報・DDBJ 研究センター/データベース運用開発研究室)
神沼 英里   (助教   生命情報・DDBJ 研究センター/大量遺伝情報研究室)
小笠原 理   (助教   生命情報・DDBJ 研究センター/遺伝子発現解析研究室)
大久保 教授 五條堀 教授 中村 教授 高木 教授 神沼 助教 小笠原 助教
DDBJ では,このたび,DDBJ Sequence Read Archive(DRA)DDBJ Trace Archive(DTA) のウェブサイトを公開いたしました。

DDBJ Sequence Read Archive DDBJ Trace Archive
DDBJ Sequence Read Archive (DRA) は次世代シークエンサからの1次解析データのためのアーカイブです。DDBJ Trace Archive (DTA) は,キャピラリ式シークエンサからのシングルパスリードの波形,ベースコール,品質データのためのアーカイブです。DRA と DTA は,EBINCBI との国際協力の下,データを収集しています。

DRA/DTA のウェブサイトでは,データ登録の方法やファイルの転送方法などについて説明しています。次世代/キャピラリ式シークエンサからの出力データを登録する際には,これらのウェブサイトをご覧ください。

また,DTA のウェブサイトでは,DDBJ で受け付けたデータの検索ができます。

DRA と DTA は ライフサイエンス統合データベースプロジェクト の一部です。

DDBJ,EMBL-Bank/EBI,GenBank/NCBI の3大国際 DNA データバンクは,国際塩基配列データベース共同構築の運営・推進を図るために,毎年5月に国際実務者会議を開催しています。 2009年は 5月12日-15日に米国 NCBI で開催されました。 会議では,DDBJ,EMBL-Bank,GenBank 三極の活動の年次報告,INSDC; International Nucleotide Sequence Database Collaboration 運用上の実務的な問題の討論が行なわれました。会議での決定事項は,後日 DDBJ HP に掲載されます。また,この会議での決定事項を受けて,DDBJ/EMBL/GenBank Feature Table: Definition も毎年改訂されます。
DDBJ が登録を受付け,2009年5月から8月にかけて DDBJ/EMBL/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。

 RAP2 アノテーションを付与したイネゲノム「日本晴」配列 build 4 の再公開 2009.8.11
rice 栽培イネ ( Oryza sativa Japonica Group ) 「日本晴」の complete genome 配列が build 3 から build 4 に更新されました。アクセッション番号は AP008207-AP008218 です。
また,この更新により,日本を中心とした国際的なイネゲノムアノテーションプロジェクト,The Second Rice Annotation Project Meeting (RAP2) の解析結果が付加され約28,000個のタンパク質コード領域(CDS)が記載されました。

アクセッション番号(Anonymous FTP 一括取得ファイル名)は以下の通りです。

関連サイト

 カイコ (Bombyx mori) small RNA の MGA 4,448,218 エントリ新規公開 2009.6.3
東京大学から登録されたカイコ (Bombyx mori) small RNA の MGA データ 4,448,218 エントリが公開されました。

アクセッション番号は以下の通りです。
  • AHAAB0000001-AHAAB0547473
  • AHAAC0000001-AHAAC1704525
  • AHAAD0000001-AHAAD2196220
  • (total 4,448,218 entries)
関連ページ: MGA 配列データについて
Anonymous FTP 一括取得:AH_resource_index

これらは6月1日分の新着データとして DDBJ より公開されております。
 タバコ (Nicotiana tabacum) EST 65,102 エントリの新規公開 2009.7.24
tobacco 日本たばこ産業から登録されたタバコ (Nicotiana tabacum) の EST データ 65,102 エントリが公開されました。

アクセッション番号 (Anonymous FTP 一括取得ファイル名) は以下の通りです。

これらは7月23日分の新着データとして DDBJ より公開されております。

(写真は統合データベースプロジェクトより)
Web API for Biology (WABI) では、DDBJ全件など大規模なデータベースに対して高速に検索することが可能な高速 BLAST サービスを公開しました。これまでのサービスと比べ計算時間が半分以下に短縮されます。例えば、DDBJ アクセッション番号が AB000001(DNA 配列長が660 bp)の配列をクエリとし、DDBJ 全件を参照データベースとして検索した場合に、既存サービスでは約10分かかりますが、高速 BLAST では約3分で実行することができます。

BLASTを高速に計算

高速BLASTはNCBI BLASTをPCクラスタの複数サーバで並列して処理することで高速に計算します。 NCBI BLASTを1ノードで実行した場合と比較し、数倍以上の高速化を実現します。

データベース分割による効率の良い計算

NCBI BLASTでは、大規模なデータベースを参照する場合、メモリ使用量がサーバのメモリ容量を超えて極端に遅くなることがあります。高速BLASTでは、サーバのメモリに格納されるようにデータベースを分割するため効率良く高速に計算します。

高速BLASTによる高速化の効果

以下のように計算時間が半分以下に短縮されます。計算時間は多数のジョブ投入による待ち時間を含みません。また、サーバの状態(データベースのキャッシュされているか否かなど)によっても変わります。
クエリ 従来のBLASTの
計算時間
高速BLASTの
計算時間
DNA配列長:36 bp(DDBJアクセッション番号:DM013333) 約10分 約2分
DNA配列長:660 bp(DDBJアクセッション番号:AB000001) 約10分 約3分
DNA配列長:3031 bp(DDBJアクセッション番号:AB489118) 約10分 約3分

高速BLAST の使い方

詳細は,「高速 BLAST について」使い方について のページをご参照下さい。
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。6月23日に DDBJ リリース78.0 が完成しました。リリース78.0 のエントリ数は 105,737,359,総塩基数は 104,597,360,291 です。
FTP によるリリースデータの取得は,FTP・WebAPI のページより可能です。
DDBJ では全国各地で「DDBJing 講習会」を開催しています。 DDBJing 講習会は,塩基配列の登録方法や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により深く理解して利用していただく助けになることを目指しています。 6月17-18日にかけて国立遺伝学研究所,生命情報・DDBJセンターで 第21回 DDBJing 講習会 in 三島 を開催しました。この講習会で使用した資料は ダウンロードページ から取得できますので,どうぞご利用下さい。 o
DDBJing 講習会のページ
DDBJing 講習会資料ダウンロードページ
次回の開催は未定ですが,開催に関するおしらせはこのメールマガジンとホームページ上でご案内いたします。また,開催のご要望がありましたら検討いたしますので,以下のメールアドレスにお問い合わせ下さい。 ddbjing@ddbj.nig.ac.jp
ウイルスのゲノムを網羅しているGenome Information Broker (GIB-V) にて、DDBJリリース78から 52,088 件のデータを公開するとともに、宿主情報を充実させました。UniProt のクロスリファレンス情報を用いて DDBJ には記載されていなかった宿主情報を追記するとともに、TxSearch と連携して DDBJ に記載されている一般名を学名へ変換しています。
Web API for Biology (WABI) に関する論文が 2009 Web Server Issue of Nucleic Acids Research (Volume 37 Issue 12 July 2009) に掲載されました。
"Web API for biology with a workflow navigation system"
Yeondae Kwon, Yasumasa Shigemoto, Yoshikazu Kuwana and Hideaki Sugawara
Nucleic Acids Research, 2009, Vol. 37, No. suppl_2 W11-W16
高速かつ精度の高いマルチプルアライメントプログラム MAFFT サービスをWeb API for Biology (WABI) に>加えました。MAFFT は現九州大学加藤和貴先生によって開発維持されています(http://align.bmr.kyushu-u.ac.jp/mafft/software/)。


Q.「連続したアクセッション番号の発行」を希望した場合,登録作業を一時中断することは可能ですか


A. 可能です。登録作業を一時中断する(翌日以降に作業を行う場合など)には,登録作業中のエントリの必要な情報を全て入力した後,「内容の確認」ページで [Submit OK] ボタンを押し,次のページで[Continue] ボタンを押して登録作業を完了して下さい。([Finish] ボタンを押してしまいますと,設定された登録予定件数が解除され,そのエントリで連番登録が完了となりますのでご注意下さい。)その後ブラウザを閉じて下さい。

続きの登録作業の再開は,SAKURA のトップページの「新規登録 -> Start」から,コンタクトパーソン電子メールアドレスを入力して登録作業をすすめて下さい。

- [Continue] ボタンを押す前に登録作業を中断する場合は,登録中のEntryID を控えてからブラウザを閉じてください。

続きの登録作業は,SAKURA のトップページの「登録途中エントリの再開 -> Resume」から,コンタクトパーソン電子メールアドレスと該当するエントリ(中断した EntryID)を入力して登録作業を再開して下さい。

詳細は, SAKURA トップページ/連続登録法の「連続したアクセッション番号の発行」についてをご覧下さい。
  ddbjmag@ddbj.nig.ac.jp

この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,「申込み・変更」ページをご利用になるか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
発行:日本 DNA データバンク (DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111