DNA Data Bank of Japan
DDBJ メールマガジン 
No.32   2007年6月14日発行
English
apply 申込・変更
top 最新号 top
backnumber 過去の号
ddbj 発行:DDBJ
Search for
サイトマップ
ご利用の前に
DDBJ とは?
塩基配列の登録
  SAKURA
  大量登録
  登録データ更新
検索・解析
  ARSA   getentry
  TXSearch  
  FASTA   BLAST
  SSEARCH
  HMMPFAM
  ClustalW
 
  Web API
 
  GIB
  GIB-V
  GTPS
  GTOP
リリース詳細
リリース取得
  DDBJ リリースノート
  公開中リリース
Q and A
生命情報学へのとびら
  講習会   関連会議
  ゲノム機能発現研究会

 DDBJ の連絡先  mail
Copyright © 1995-2006
DDBJ All rights reserved.
 ■国立遺伝学研究所大型計算機(supernig)の継続申請について 
国立遺伝学研究所大型計算機(supernig)利用申請(継続)手続きのご案内は2007年度よりメールのみとなり, 2007年度の継続申請の受付は5月31日までとなっておりました。なお,今回,ご案内方法が変わったこともあり, 受付期限を引き延ばしております。
継続申請がおすみでない方は,こちらより 手続きが行えますので,お早めにお願いいたします。
また,2006年4月よりすべての手続き(新規・継続・変更・中止)を簡素化し, web経由で可能となりました。 各手続きは,「計算機利用に関する申請」より行えます。

隔月公開の DDBJ メールマガジン第32号 web 版です。 メールマガジンに関するご質問やご意見がありましたら ddbjmag@ddbj.nig.ac.jp までどうぞ。

 ■ARSAサービスの休止 
ARSA (All-round Retrieval of Sequence and Annotation) は DDBJ がWWW で提供している高速なキーワード検索システムです。
機能改善のため,以下の日程でサービスを休止いたします。 休止期間が長いのでご注意下さい。この間の検索には,キーワード検索システム SRSやアクセッション番号などによる検索システム getentryをご利用下さい。

サービス休止期間: 2007年6月20日(水)9時から6月22日(金)18時まで
備考:サービス再開後の機能の変更点は以下の通りです。
・複数データベースからの結果を一括ダウンロード可能
・DDBJ 以外のデータベースでも表示項目を選択可能
・結果画面でデータベースを再選択可能
・結果画面で表示項目を再選択可能
・結果画面で表示件数を再選択可能
・結果画面の下部にページジャンプのリンクを追加
・CSV ダウンロードの変更(.csv->.txt)*
・NarrowSearch の名称を RefineSearch に変更
・SimpleQuery の廃止
・HTTP ダウンロードの廃止
*:現行CSVダウンロード機能では,拡張子が「.csv」ですが,中味がタブ区切りになっておりました。実データに即した拡張子とするため,今後は, 拡張子を「.txt」へと変更いたします。これまで,表記に誤りがありましたことをお詫びいたします。
ユーザの皆様にはご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。

 ■第19回国際実務者会議開催(参加者の斎藤より報告) 
国際塩基配列データベースは,欧州のEBI(欧州生命情報学研究所),米国のNCBI(国立バイオテクノロジー情報センター), 日本のNIG(国立遺伝学研究所)の3機関が共同構築していますが,毎年持ち回りで実務者会議を開催しています。 今年は英国ケンブリッジ南方の田園地帯に位置するゲノムキャンパス内にあるEBIで,5月21日〜23日に開催しました。 国立遺伝学研究所のDDBJ(日本DNAデータバンク)からは,7名が参加し,私も参加した一人です。
実務者会議の主たる議題は,国際塩基配列データベースの書式改訂です。 塩基配列データベースの中で生物学的な記載をコンピュータソフトウェアで読み取りやすくするためのしくみとして, feature tableというものがあります。分子遺伝学の発展にともない,いくつかの新しいfeatureの提案がされましたが,同時に, あまり使われていないfeatureを統合しようという提案もありました。会議の結果についての詳細は別の機会にこのメールマガジン でも報告することになると思います。
例年,実務者会議の直後に同じ場所で開催されていた国際諮問委員会が,今年はTV会議を開催することになりました。 現在準備が進められており,もうすぐ開催の予定です。

 ■相同性検索システム機能更新について 
DDBJ では, WWWE-mailで提供している相同性検索サービス FASTA, BLAST,PSI-BLAST,SSEARCH,HMMPFAM のシステム更新を5月15日に行ないました。 その結果,新機能の追加や表記の変更がありました。詳細は以下の通りです。

[1] FASTA/SSEARCH/PSI-BLAST/HMMPFAMでの複数クエリ受付機能の追加
これまでは,BLAST のみ複数クエリの受付が可能でしたが,FASTA,PSI-BLAST,SSEARCH,HMMPFAM にも複数クエリ受付機能を追加しました。

[2] HMMPFAM 結果へのエントリ表示機能の付加
  • HMMPFAM の検索結果に Pfam エントリへの表示リンクを追加しました
  • seq-fに各アラインメントへのリンクを追加しました
=======================================================================
Parsed for domains:
Model      Domain  seq-f seq-t   hmm-f hmm-t     score  E-value
--------   ------- ----- -----   ----- -----     -----  -------
PF00310.11  1/1       2   264 ..    1   394 []   203.6  4.3e-58    <- (ア)にリンク
PF04051.6   1/1     114   211 ..    1   193 []   -82.6        9    <- (イ)にリンク
PF03915.3   1/1     162   531 ..    1   471 []  -255.9      9.5    <- (ウ)にリンク
   :
   :

Alignments of top-scoring domains:
  (ア)   PF00310.11: domain 1 of 1, from 2 to 264: score 203.6, E = 4.3e-58     
           -------------------------------------------------------
  (イ)   PF04051.6: domain 1 of 1, from 114 to 211: score -82.6, E = 9         
           -------------------------------------------------------
  (ウ)   PF03915.3: domain 1 of 1, from 162 to 531: score -255.9, E = 9.5     
           -------------------------------------------------------
=======================================================================
[3] FASTA/SSEARCH で使用されるプログラム名の統一
これまで,FASTA/SSEARCH で用いられているプログラム名が不揃いで,たとえば,fastx と fastx34_t の2つの表記が混在していました。これをバージョンを含まない表記に統一しました。バージョン番号はトップページ画面のサービス名のロゴ部分に表示します。

[4] FASTA E-mail サービスの program パラメータの変更
program パラメータをバージョン表記なしに統一しました([3]の方針と合わせる為)。当面は,どちらの表記でも実行可能です。
  • 修正前
    program パラメータとして fasta,fastx,tfasta,tfastx が指定可能
    その他, fasta3_t,fastx3_t,tfasta3_t,tfastx3_t が指定可能
  • 修正後
    program パラメータとして fasta, fastx, tfasta, tfastx のみ指定可能
[5] 結果返却 E-mail の文面変更
全サービスで統一しました。

[6] "In HTML format" オプションを "HTML format" 表記に統一しました
結果受け取り方法に E-mail を選択し,HTML format をチェックしなかった場合は,メール本文中にtext 形式で結果が届きます。

どうぞご利用ください。

 ■DDBJing 講習会開催報告 
DDBJ では全国各地で「DDBJing 講習会」を開催しています。
DDBJing 講習会は,塩基配列の登録方法や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々に より深く理解して利用していただく助けになることを目指しています。
5月29-30日にかけて国立遺伝学研究所,生命情報・DDBJセンターで 第17回 DDBJing 講習会 in 三島 を開催しました。 前回の講習会で使用した資料は ダウンロードページ から取得できますので,どうぞご利用下さい。
次回の開催は未定ですが,開催に関するおしらせはこのメールマガジンとホームページ上でご案内いたします。 また,開催のご要望がありましたら検討いたしますので,以下のメールアドレスにお問い合わせ下さい。
ddbjing@ddbj.nig.ac.jp

 ■大量データの公開 
DDBJ が登録を受付け,2007年4月から5月にかけて DDBJ/EMBL/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。

マウス EST 95,566 エントリの新規公開 2007.4.5
放射線医学総合研究所から登録されたマウスの EST データ 95,566 エントリが公開されました。これらは4月3日分の新着データとしてDDBJより公開されております。
アクセッション番号は以下の通りです。
    AV442833-AV503678     AV503747-AV504941     AV504943-AV517878
    AV567729-AV568517     AV568519-AV568529     AV568531-AV568562
    AV568564-AV568588     AV568590-AV568595     AV568597-AV568605
    AV568607-AV568629     AV568631-AV570287     AV570357-AV573382
    AV573409-AV576847     AV576917-AV577109     AV577169-AV588547
anonymousFTP 一括取得:ファイル名 Mus_musculus_EST_070403_1.seq.gz

コムギ EST 194,853 エントリの新規公開 2007.4.5
国立遺伝学研究所から登録されたコムギの EST データ 194,853 エントリが 公開されました。これらは4月3日分の新着データとして DDBJ より公開されております。
参考 URL:  http://dolphin.lab.nig.ac.jp
アクセッション番号: CJ773323-CJ968175 (194,853 entries)
anonymousFTP 一括取得: ファイル名 Triticum_aestivum_EST_070403_1.seq.gz

メダカ strain Hd-rR の WGS 134429 エントリと CON 6928 エントリ,strain HNI の WGS 346141 エントリと CON 38235 エントリの公開 2007.4.18
東京大学から登録されたメダカ strain Hd-rR の WGS データ 134429 エントリ, および,これに対応する CON データ 6928 エントリが公開されました。 また,メダカ strain HNI の WGS データ 346141 エントリ,および,これに 対応する CON データ 38235 エントリも公開されました。 これらは4月2日分の新着データとしてDDBJより公開されており,anonymousFTP サイトから一括取得が可能です。
参考 URL:   http://medaka.utgenome.org/
アクセッション番号:
strain Hd-rR (WGS version 4)
    WGS:BAAF04000001-BAAF04134429 (134429 entries)
    scaffold/CON :scaffold/CON :DF083412-DF090103 (6692 entries)
    ultra/CON :ultra/CON :DF090104-DF090315 (212 entries)
    chromosome/CON:chromosome/CON:DG000001-DG000024(24 entries)
strain HNI (WGS version 1)
    WGS:BAAE01000001-BAAE01346141 (346141 entries)
    scaffold/CON:DF000001-DF038235 (38235 entries)
anonymousFTP 一括取得:ファイル名
    Oryzias_latipes_CON_070402_1.seq.gz
    Oryzias_latipes_CON_070402_2.seq.gz
    Oryzias_latipes_CON_070402_3.seq.gz
    Oryzias_latipes_CON_HNI_070402.seq.gz
    Oryzias_latipes_WGS_070402_1.seq.gz
    Oryzias_latipes_WGS_HNI_070402_1.seq.gz

ヒト EST 134,569 エントリの新規公開 2007.4.24
NEDO human cDNA sequencing project から登録されたヒトの EST データ 134,569 エントリが公開されました。 これらは4月21日の新着データとして DDBJ より公開されており,anonymousFTP サイトから一括取得が可能です。アクセッション番号は以下の通りです。
アクセッション番号:DC294839-DC429407(134,569 entries)
anonymousFTP 一括取得:ファイル名 Homo_sapiens_EST_070421_1.seq.gz
 

 メダカゲノムの論文が Nature に掲載 
メダカ(ニホンメダカ)の全ゲノム情報が国立遺伝学研究所や東京大学の研究チームによって解読され, その概要配列が6月7日発行の英科学誌 Nature (vol447, pp.714-; Jul 7, 2007 / doi:10.1038) に発表されました。
メダカは日本人になじみが深く, 飼育のしやすさなどから日本では実験動物として良く利用されています。そのため, メダカ塩基配列データの多くは日本人研究者によって登録されています。
研究チームは7億塩基を解読し,20,141個の遺伝子を解明しました。8割以上がヒトの遺伝子と類似していることがわかり, そのため解読の成果は,今後脊椎動物進化の過程や,遺伝性疾患の原因の解明に役立つと期待されます。
この塩基配列は,Whole Genome Shotgun(WGS) ならびに Mass sequence for Genome Annotation(MGA) データとして DDBJ より DDBJ/EMBL/GenBank 国際塩基配列データベースに登録されており,アクセッション番号は, BAAF030000(Hd-rR, version 0.9),BAAF04000000(Hd-rR, version 1.0),BAAE01000000(HNI),ならびにACAAA00000001-ACAAA356693(5'SAGE tags) です。 データは getentryで取得または,anonymousFTP一括取得(下記参照)することができます。 また,FTP を利用したリリースデータ取得のページの「WGS データ」と「MGA データ」よりダウンロードすることができますのでどうぞご利用下さい。
参考 URL:   http://medaka.utgenome.org/

アクセッション番号anonymousFTP 一括取得(ファイル名)サイズ(圧縮)
BAAF030000(Hd-rR, version 0.9) Oryzias_latipes_WGS_060607_1.seq.gz 334MB
BAAF04000000(Hd-rR, version 1.0) Oryzias_latipes_WGS_070402_1.seq.gz 302MB
BAAE01000000(HNI) Oryzias_latipes_WGS_HNI_070402_1.seq.gz 269MB
ACAAA00000001-ACAAA0356693
(5'SAGE tag)
ACAAA_variable.gz 3.9MB
 

 ■日韓中バイオインフォマティクス・トレーニングコース 
2007年3月27日から30日まで,中国・上海交通大学にて第6回日韓中バイオインフォマティクス・トレーニングコースが開催され,日本からも 10名の受講生が参加しました。
参加者の一人である平澤竜太郎さんに参加報告レポートをご寄稿いただきましたので紹介します。

日韓中バイオインフォマティクス・トレーニングコースの詳細はこちらをご覧下さい。

************************************************************************************
「日中韓合同バイオインフォマティクストレーニングコースに参加して」

平澤 竜太郎
国立遺伝学研究所・人類遺伝研究部門



「初心者向けのバイオインフォマティクスの講習会があるよ。」

友人から聞いたそんな一言が参加のきっかけになった・・・。
主にマウスを用いた実験生物学を専門としている私にとって,バイオインフォマティックスは,生命現象を網羅的に捉えることが出来る眼と, 統計学やコンピューターの高度な知識が必要とされる,敷居の高い学問という印象があった。しかし,近年では我々の研究分野でも, ゲノムワイドで網羅的な解析や考え方が要求されることが多くなり,何か勉強をするきっかけが欲しい・・・, そんなことを考えていた矢先であった。せっかくの良い機会なのでバイオインフォマティクスという未知の分野に一度触れてみようと考え, この講習会に応募した。まずは,この講習会へ参加する機会を与えてくださった主催者のDDBJのスタッフおよび講師の先生方に深く感謝したい。

講習会が行われた上海交通大学は中国でも有名な理系の総合大学であり,上海市内にいくつかのキャンパスがある。その中でも, 会場となったMinhangキャンパスは,日本では考えられないほどの広大な敷地を持ち,同じキャンパス内にある宿泊施設から教室までは バスで15分ほどかかるほどの広さであった。受講生は日本・中国・韓国から各10人ずつの正式な参加者と上海交通大学の有志の学生を含めて, 計40〜50人ほどが参加していた。他の参加者と話してみた印象では,バイオインフォマティクスの関連分野を専攻している大学院生が 多かった気もするが,初心者だという参加者も比較的多く見受けられた。

講義は2日半にわたり,計10人(日本4人・韓国3人・中国3人)の先生方によって行われ,様々な生命科学関連のデータベースの利用法を 中心に,進化生物学やOmics(生命現象や生体物質の全体を網羅的に捉える学問の総称)といった実用的なバイオインフォマティクスまで 幅広く学ぶことができた。講習会中は1人1台のパソコンを利用し,講義を聴きながらデータベースやデータ解析のためのウェブサイトを 実際にその場で使用してみるという形で行われたが,講義内容は各分野の総論や研究紹介が中心であったため,初心者の私でも特に問題 なく講義についていくことができた。1日10時間にもおよぶ講義はとてもハードでタフなものであったが,幅広い分野を一度に学ぶことができ, 大変有意義な3日間であったと思う。特に,今まで実験生物学を専攻してきた私にとっては,数学や統計学を用いて生命現象の全体像を網羅的 に捉えるという考え方やその重要性に触れられたことは,自分の研究を別の視点から見直すための良いきっかけとなった。

講習会の性質上,研究の即戦力となるような知識や技術を身に付けるような内容にはなっていないが,その分,幅広い内容の講義を聴くことが できるので,初心者にとってはこの分野に触れる良いきっかけとなったのではないだろうか。また,既にこの分野で研究を行っている人にとっても, 日中韓の最先端の研究者が講師として招かれているので,そのような先生方と直に議論できる良い機会となったのではないかと思う。

さらに,中国・韓国からの参加者との交流が持てたことは,この講習会においてとても思い出に残っていることの一つである。 受講生の殆どが同世代の大学院生であることも手伝って,他の参加者ともすぐに打ち解けることができた。研究の話もとても興味深かったが, それ以上に大変印象に残っていることは,お互いの国の文化や言葉などに関する話をして交流を深めることができたことである。特に, 現地の中国人学生の案内で,皆で一緒に大学近辺の街を歩いて,色々な物を見たり食べたりし,共に楽しい時間が過ごせたことは, 私にとって忘れがたい思い出になっている。
加えて,主催者であるDDBJスタッフの配慮もあり,講習会の2日前に現地入りして上海市内の観光をすることができ,講習会以外でも とても楽しい時間を過ごせた。今回は私を含め4人の大学院生が遺伝研から参加しており,彼(女)らのおかげで上海での滞在がより充実したものになった。 特に講習会中はバイオインフォマティクスに不慣れな私をサポートしてくれた彼(女)らに,この場を借りて改めてお礼を言いたい。 最後に,このような手記の執筆の機会を与えてくれたDDBJスタッフにも感謝の意を表すと共に,この駄文が来年度の参加を考えている 学生の助けに少しでもなれば嬉しく思う。
 

 ■DDBJのサービスに関するお詫び 
getentry の停止について2007.4.13
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
保守作業のため,サービスを一時停止いたします。詳細は以下のとおりです。
停止期間: 2007年4月17日(火) 18:00 - 19:00
注)停止期間中は,ARSA,相同性検索(FASTA, BLAST, PSI-BLAST, SSEARCH),SQmatch からの getentry へのエントリ参照ができなくなっておりました (検索はおこなえます)。


ARSA に検索不具合発生 2007.4.24
ARSAは DDBJ が WWW で提供している高速なキーワード検索サービスです。現在,DAD の検索ができない不具合がが発生しています。詳細は下記のとおりです。
・サービス名: ARSA
・発生期間: ・4月23日4時頃から16時20分頃まで
・4月24日2時50分頃から
・現象: ARSA の DAD 検索のご利用ができません。(DAD 検索を行った場合、「システム保守」等のメッセージが出力されます。)
その他の検索には影響はありません。
・対応: 現在原因を調査中です。復旧次第 HP にてご連絡いたします。
ユーザの皆様にはご迷惑をおかけして申し訳ございませんでした。ご理解とご協力をお願いいたします。

ARSA での DDBJ,DAD 検索の一時停止 2007.5.15
ARSAは DDBJ がWWW で提供している高速なキーワード検索サービスです。検索対象データベースのうち,DDBJ ならびに DAD の更新作業を以下の日程で実施いたします。
  • 日 時:2007年5月21日(月)9時より18時まで(終了次第HPにてお知らせいたします) 
  • 内 容:ARSA の DDBJ ならびに DAD 検索の一時停止
  • 備 考:上記停止期間中も ARSA での検索はご利用いただけますが,結果中に DDBJ ならびに DAD の検索結果は含まれません。DDBJ ならびに DAD の検索をお急ぎの場合は,SRS をご利用下さい。)
ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。

BLASTの検索結果の Text View 画面での結果表示不備のお詫び 2007.5.24
DDBJ が WWW で提供している相同性検索サービスのうち BLAST で検索結果の表示に不備があったことが判明しました。詳細は以下のとおりです。
  • 対象サービス:BLAST (結果表示を WWW にした場合)
  • 現象:検索結果表示の Text View 画面において,アラインメント結果が最大 100本 までしか表示されない
  • 発生期間:2007年2月26日10時より5月18日13時まで
  • 原因:2007年2月末のシステム移行時のプログラムの不具合により,Text View 画面のアラインメント結果表示の上限が100本に設定されていた
  • 対応:プログラムを修正し,現在は正しく(表示数の上限なし)表示されます
長期にわたり,正しい検索結果が表示されない状態が続きましたことをお詫び申し上げます。
 



  ddbjmag@ddbj.nig.ac.jp

この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,画面右上の「申込み・変更」ページをご利用になるか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
発行: 日本 DNA データバンク (DDBJ)
  大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111
Last modified: Oct. 07, 2011