What’s New(2007)


DDBJ リリース 72 完成 2007.12.25
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。12月25日に DDBJ リリース72 を完成しました。リリース72 のエントリ数は 79,004,098,総塩基数は 82,592,245,487 です。
FTP によるリリースデータの取得は,FTP・WebAPI のページよりおこなえます。
なお,既にお知らせしているとおり,DDBJ では,DDBJ が登録を受け付けたエントリの E-mail アドレスと電話番号,FAX 番号の非表示化をすすめておりましたが,今リリース公開をもちまして,作業が完了いたしました。今後はフラットファイルを参照しての配列の登録者への連絡が取り難くなります。登録者への連絡が必要な場合はメッセージを転送いたしますので,専用の問い合わせフォームからご連絡ください。
PRF Rel. 118 公開 2007.12.19
12月13日より PRF (Protein Research Foundation)/SEQ データベース Rel. 118 を公開しています。PRF Rel. 118 はエントリ数が 884,108,総アミノ残基数が 297,512,006 aa です。
ニホンザル (Macaca fuscata) GSS 167,159 エントリの新規公開 2007.12.19
理研ゲノム科学総合研究センターから登録されたニホンザル(Macaca fuscata) GSS 167,159 エントリが公開されました。これらは12月18日の新着データとして DDBJ より公開されており,anonymousFTP サイトから一括取得が可能です。

立襟鞭毛虫 (Monosiga ovata) EST 69,143 エントリ と GSS 60,757 エントリの新規公開 2007.12.19
理研ゲノム科学総合研究センターから登録された立襟鞭毛虫 (Monosiga ovata) EST 69,143 エントリ と GSS 60,757 エントリが公開されました。これらは12月18日の新着データとして DDBJ より公開されており,anonymousFTP サイトから一括取得が可能です。
アクセッション番号と anonymous FTP ファイル名は以下の通りです。

参考 URL: http://stt.gsc.riken.jp/

ミラー H-Invitational データベースの所内一部停電による一時休止 2007.12.19
ミラー H-Invitational データベースは,国立遺伝学研究所敷地内の一部停電のため,下記の日程でサービスを一時休止いたします。 ユーザの皆様にはご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
  • 休止期間:2007年12月21日(金)18:00 より 12月25日(火)10:00 まで

サービスを再開しました。(12月25日 9時30分)
国立遺伝学研究所ならびに DDBJ ネットワークサービスの一時停止 2007.12.17
スーパーSINETルータ保守のため,下記期日におきまして,国立遺伝学研究所のネットワークサービスが停止致します。

  • 作業日時:2007年12月19日(水) 20:00 ~ 12月20日(木)03:00
    上記時間帯において10分以内の通信断が発生します。
  • 作業内容:緊急ルータメンテナンス

皆様には大変ご迷惑をお掛け致しますが,ご理解とご協力をお願い致します。
ミラー H-Invitational データベース緊急メンテナンスのため一時休止 2007.12.10
ミラー H-Invitational データベースは緊急メンテナンス作業のために,現在サービス一時休止しております。サービスを再開次第,DDBJ HP にてお知らせいたします。ユーザの皆様にはご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
サービスを再開しました。(12月10日 13時)
RNA ワールドへの対応 --時代の要請にあわせたFeature Table Definition 改訂-- 2007.12.7
DDBJ をご利用いただいている方々の関心事は,多くの場合,ゲノム,mRNA,タンパク質をコードする遺伝子ではないでしょうか。もちろん,分子系統学などの視点から rRNA に関心を持つ方々も多いことでしょう。ここに挙げた情報を記述するだけで良いのでしたら,feature の項目は大まかに mRNA, CDS, rRNA と塩基配列の由来を示すための source だけで済むことになります。
しかし,実際には Feature Table Definition Document (以下,FT-Doc) において定義されている DDBJ/EMBL/GenBank が公式に認める features の数は 62 あります。
FT-Doc は毎年4月と10月の2回改訂されます。この FT-Doc 改訂に関しては,主として,DDBJ/EMBL/GenBank が毎年1回開催しております国際実務者会議(International Collaborators Meeting) において改訂の方針を集中協議して決定します(参考:第20回国際実務者会議報告)。後に各実務担当者がその施行に関する詳細をメールなどにて協議し決定します。
FT-Doc で定義される features は,2007年10月の改訂前には 65 ありました。これは単純に3つ廃止されたということではありません。実際には5つが廃止され,2つが追加されています。データベースは,単に登録データを収集し提供するだけではなく,時代の要請に歩調を合わせて,その在り方を変える努力もしています。
今年(2007年)の国際実務者会議では,「多様な新しい RNA 転写産物を,どう記述すべきか?」が主要な話題の一つでした。近年,miRNA,siRNA などの多様な RNA 転写産物が見出され,その知見も増加しております。今年の改訂前までは,比較的新しい RNA 遺伝子は,すべてmisc_RNA,つまり「その他の RNA 」を示す feature で記載していました。しかし,このような暫定的な方法による対応では,登録者・参照利用者の需要に応えることが困難になっていました。

そこで,この問題を解決するために,新規に2つの RNA を示す features である ncRNA と tmRNA を追加することを決定しました。タンパク質をコードしない RNA ファミリー数は増加することが予想されるため,ncRNA feature に統合します。これに伴い,snRNA,snoRNA,scRNA の3つのfeatures を,2007年12月(今月)までに ncRNA feature に統合します。また,これまでは misc_RNA で記載されている既存データのうち ncRNA,または,tmRNA とすべきデータも適宜,修正します。

このような過去のデータを新規則に合わせる修正をレトロフィットと呼んでいますが,毎年,10月に新 feature を記載可能にするようにデータベースシステムを修正し,12月までに既存データのレトロフィットを行うことが定例になっています。今回のレトロフィットは RNA world に関するパラダイム変化を象徴していますので,ここに紹介いたしました。

第20回国際実務者会議報告より抜粋)

  • 新 feature ncRNA が追加されます。
    近年,"miRNA","siRNA" などの多様な新しい RNA 転写産物が見出されています。このようなタンパク質をコードしない RNA ファミリー数は増加することが予想されるため,新規に,柔軟な対応が可能な ncRNA feature を追加します。
    また,これに伴い,snRNA,snoRNA,scRNA の3つのfeature は,2007年12月までに ncRNA feature に統合されます。

  • /ncRNA_class が追加されます。上記の新規 feature,ncRNA では,non- protein-coding RNA の種類を示すために,新規 qualifier,/ncRNA_class を使用します。

    書式: /ncRNA_class="<ncRNA_class_TYPE>"
    例 : /ncRNA_class="miRNA"

    <ncRNA_class_TYPE> は以下の規定値リストから選択されます。

    "antisense_RNA" "autocatalytically_spliced_intron" "telomerase_RNA"
    "hammerhead_ribozyme" "RNase_P_RNA" "RNase_MRP_RNA"
    "guide_RNA" "rasiRNA" "scRNA"
    "siRNA" "miRNA" "piRNA"
    "snoRNA" "snRNA" "SRP_RNA"
    "vault_RNA" "Y_RNA" "other"


  • 新 feature tmRNA が追加されます。
    tRNA と mRNA の両方の性質を持つ RNA を記載するため,新規に tmRNA feature が使用可能になります。tmRNA に関する情報は,tmRDBtmRNA Websiteに詳しいので,ご参照ください。

  • 新 qualifier /tag_peptide が追加されます。
    tmRNA のタンパク質分解タグペプチドに対応する塩基位置を示すために,tmRNA feature で新規 qualifier /tag_peptide が使用可能になります。

    書式: /tag_peptide=<base_range>
    例 : /tag_peptide=90..122
 
DDBJ 年末年始休業のおしらせ 2007.12.6
DDBJ では,国際塩基配列データベースの構築業務を 2007年12 月29日(土)から2008年1月3日(木)まで休業いたします。
これにともない,SAKURA によるデータ受け付けは2007年 12月27日(木)から2008年1月4日(金)までご利用いただけません。エントリの新規および再公開も,2007年12月27日から2008年1月4日まで行なわれません。ただし、データ検索や ftp は休業期間でも利用可能です。
皆様のご理解・ご協力をお願い申し上げます。

休業期間: 2007年12月29日(土)から2008年1月3日(木)
SAKURA 停止: 2007年12月27日(木)17時 から 2008年1月4日(金)10時まで
新規・再公開停止: 2007年12月27日(木)から2008年1月4日(金)

では,よい年をお迎えくださいませ。

ミラー H-Invitational データベースの一時休止 2007.11.29
下記の要領でミラー H-Invitational データベースのサービスを一時休止いたします。ユーザの皆様にはご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
  • 休止日時: 2007年12月3日(月)9時より 12月5日(水) 24時まで

  • 理由:メンテナンスのため

サービスを再開しました。(12月6日)

ClustalW でのメールによる結果送信不具合発生についてのお詫び  2007.11.14
DDBJが WWW および E-mail で提供している ClustalW において,不具合が発生していたことが判明しました。詳細は下記のとおりです。

  • 対象サービス:ClustalW (WWW,E-mail いずれの場合も)で,結果受け取り方法に E-mail を選択した場合
  • 期間:2007年11月6日 16:06 から 11月9日 11:49 まで
  • 不具合の内容: 解析結果のメールが送信されなかった
  • 原因:ClustalW メール送信プログラムが起動しなかった

メール送信プログラムの起動により,未送信となっていた解析結果は全て送信され,またその後に実行された解析結果は正しくメール送信されています。
ユーザの皆さまにご迷惑をおかけいたしましたことを深くお詫びいたします。

「生命科学の基礎・基盤連携群シンポジウム ライフサイエンスデータベース統合への取組」開催のお知らせ 2007.11.13
総合科学技術会議 科学技術連携施策群 生命科学の基礎・基盤連携施策群では,下記のシンポジウムを開催します。シンポジウムでは,DDBJ の五條堀,大久保が講演をおこないます。参加申込は,下記のサイトに直接お申込ください。

題名: 生命科学の基礎・基盤連携群シンポジウム
ライフサイエンスデータベース統合への取組
日時: 平成19年11月29日(木)13時から
場所: 浜離宮朝日ホール
内容: 補完的課題「生命科学データベース統合に関する調査研究」報告
有識者講演(3題)
有識者及び関係府省担当者によるパネルディスカッション
詳しいプログラム及び申込みに関しては,
    
http://www.renkei.jst.go.jp/sympo/brails/index.html
まで
文責) 総合科学技術会議 科学技術連携施策群
生命科学の基礎・基盤連携群 主監補佐 
柴田 一浩(shibata@renkei.jst.go.jp)
Anonymous FTP から公開されている WGSデータファイルの不具合に関するお詫び 2007.11.12
2007年10月18日に公開された「ヒト腸内微生物群 metagenomic WGS データ 353,805 エントリ」につきまして,Anonymous FTP/database/wgs/ 配下もしくは /database2/wgs/ 配下に存在する BAAU.gz から BABG.gz までの計13ファイルにおきまして,エントリが2重に存在したまま公開されておりました。これらのファイルには,ヒト腸内微生物群 metagenomic WGS データエントリに対応する塩基配列公開ファイル(フラットファイル)が含まれております。
みなさまにご不便をおかけしたことを心よりお詫びいたします。現時点で,エントリが2重に存在する問題は修正されております。該当期間中にファイルを取得された場合は,修正済みの該当ファイルを取得しなおしていただきますようお願い申し上げます。
公開ファイル(フラットファイル)が2重に含まれていた期間,および,該当ファイルと各ファイルに含まれるアクセッション番号は以下の通りです。

  • 期間:2007.10.18 - 2007.11.12 12:30 PM
  • 該当ファイルの詳細

    ファイル名 アクセッション番号
    BAAU.gz BAAU01000001-BAAU01028900
    BAAV.gz BAAV01000001-BAAV01036326
    BAAW.gz BAAW01000001-BAAW01016539
    BAAX.gz BAAX01000001-BAAX01036455
    BAAY.gz BAAY01000001-BAAY01030198
    BAAZ.gz BAAZ01000001-BAAZ01031237
    BABA.gz BABA01000001-BABA01035177
    BABB.gz BABB01000001-BABB01020226
    BABC.gz BABC01000001-BABC01009958
    BABD.gz BABD01000001-BABD01037296
    BABE.gz BABE01000001-BABE01020532
    BABF.gz BABF01000001-BABF01016164
    BABG.gz BABG01000001-BABG01034797


ヒト腸内微生物群 metagenomic WGS データ 353,805 エントリの公開 2007.10.18
所外ネットワーク(SuperSINET)の停止について 2007.11.5
スーパーSINETルータ保守のため,下記期日におきまして,国立遺伝学研究所のネットワークサービスが停止致します。
作業日時:2007年11月8日(木) 20:00 ~ 22:00
上記時間帯において10分間の通信断が1回発生します。
皆様には大変ご迷惑をお掛け致しますが,ご理解とご協力をお願い致します。
Blast 解析不具合発生についてのお詫び 2007.11.5
DDBJが WWW および E-mail で提供している 相同性検索の Blast において,本日,不具合が発生していたことが判明しました。詳細は下記のとおりです。

  • 対象サービス:相同性検索の Blast (WWW,E-mail とも)
  • 期間:2007年11月5日 11:05 から 11:49 まで
  • 不具合の内容: 正しい検索結果が送信されなかった
  • 原因:現在調査中

現在は正しい検索がおこなわれます。上記時間帯に Blast で検索をおこなったユーザの方は,大変申し訳けございませんが,再度検索を実行していただきますようお願いいたします。
ユーザの皆さまにご迷惑をおかけいたしましたことを深くお詫びいたします。

国立遺伝学研究所ならびに DDBJ ネットワークサービス停止 2007.11.2
国立遺伝学研究所の停電のため,下記日程におきまして国立遺伝学研究所の全ネットワークならびに大型計算機 supernig のサービスを停止いたします。
これに伴い,DDBJ のネットワークサービスも停止しますが,サービスによって停止期間が異なりますのでご注意下さい(下記参照)。
期間:2007年11月9日(金)17:00 から 11月10日(土)24:00 まで
DDBJ の各サービスの停止期間:
全てのサービスが再開しました。どうぞご利用下さい (11/12 12:00)

サービス名 停止時刻 再開予定時刻
SAKURA 11/9(金) 13:00 11/12(月) 12:00
getentry,ARSA,SRS,
相同性検索システム,
ClustalW,SQmatch,
TXSearch,
ベクタースクリーニングシステム,
GIB,
PDB Retriever,LIBRA-I,
Lib score,
Anonymous-FTP
11/9(金) 16:00 11/12(月) 12:00
H-Inv DB (ミラーサーバ) 11/9(金) 17:00 11/12(月) 11:00
DDBJ HP 11/9(金) 17:00 11/10(土) 24:00
ご迷惑をおかけしますが,皆様のご理解とご協力をお願い致します。
ARSA 7月に引き続きさらに機能強化 2007.11.2
DDBJ では,7月に続き高速キーワード検索システム ARSA(All-round Retrieval of Sequence and Annotation) に大幅な機能強化をおこないました。
ARSA は,下記のような特徴を有しています。

  • DDBJ (国際塩基配列データベース)を始めとする24種類/3000万件のデータベースを対象に高速なキーワード検索を実現
  • 複雑な検索条件や大量のヒットがある条件で検索しても,24種類すべてのデータベースに対して高速な検索レスポンスを提供
  • DDBJ を対象にした検索では,Features/Qualifiers を指定した詳細な条件による検索が可能
  • SOAP/REST による各種 WEB API の利用が可能

上記に加え,今回追加された主な新機能は下記の通りです。

  • 検索対象 DB への KEGG/PATHWAY データベースの追加
    検索対象となるデータベースに KEGG/PATHWAY を追加しています。 検索結果のリンクをクリックすることで,KEGG の PATHWAY マップを表示することも可能です。

  • DDBJ 以外のデータベースに対する詳細検索機能
    これまで DDBJ 以外の DB については,全文検索のみを提供してきました。今回の機能改善により,全データベースについて,項目を指定した詳細検索が可能になります。(TOP 画面で単一 DB を選択し,Cross Seaerch ボタンを押下)

  • 全24データベースの共通項目による串刺し検索機能
    上記2. で提供する詳細検索機能について,複数 DB を選択し, 共通項目にて串刺し検索を行うことが可能です。(TOP 画面で複数 DB を選択し,Cross Seaerch ボタンを押下)

また,上記以外に下記機能修正・改善を行っています。

  • 検索条件に &(AND 条件), |(OR 条件) を直接入力可能に
    入力例はこちらを参照

  • Refine Search の拡張 (下記文字列についても絞り込み検索が可能になります)
    '」, 「(」, 「)」, 「」, 「
arsatop
新 ARSA トップページ
arsatop
Cross Search ヒットカウント表示画面

DDBJ では,今後さらに,皆様からのご意見をもとにして,より使いやすく強力なキーワード検索システムを目指して機能拡張を進めていきます。
ARSA にて 「Your Comment」 をクリックして, 批判とご提案をご記入下さい。
TXSearch からの参照機能の変更 2007.10.30
TXSearch は, DDBJ のスタッフにより開発された,DDBJ,GenBank および EMBL により統合化された生物分類データベース (Taxonomy Database) を検索するシステムです。DDBJ に塩基配列を登録する際に,生物分類名を確認するために利用できます。
現在提供しております TXSearch では,SRS 参照機能(分類名検索結果から SRS を用いて生物種名,別名,生物種 ID で検索を行い,結果を表示する機能)を備えていますが,下記の日程で参照先を ARSA (All-round Retrieval of Sequence and Annotation) へと変更いたします。
検索機能自体に変更はありませんが,今後はより高速な検索が可能となりますのでどうぞご利用下さい

  • 切替日: 2007年11月2日(金)(切替時刻は午後を予定)
    (切替によるサービス停止はありません)
リリースデータの一部が getentry にて未公開になっていた件についてのお詫び 2007.10.22
getentry は DDBJ が WWW および E-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
このたび,データの一部が未公開になっていた期間があったことが判明しました。詳細は下記のとおりです。

  • 期間:2007年2月1日 から 2007年9月13日まで
  • アクセッション番号:別紙参照
  • 備考:未公開となっていたデータについては,2007年9月12日に実施した getentry の保守作業の際に全て追加いたしました

正しい検索ができない状況が続いていたことにより,ユーザの皆様にご迷惑 お掛けいたしましたことを深くお詫び申し上げると共に,今後このような事態が発生することのないよう努めます。
H-Invitational 関連データベースの更新 2007.10.18
10月18日に,ミラー H-Invitational Database (H-InvDB) が公開されました。データベースの version が "4.6" になりました。
ヒト腸内微生物群 metagenomic WGS データ 353,805 エントリの公開 2007.10.18
東京大学,奈良先端科学技術大学院大学,宮崎大学,徳島大学,独立行政法人海洋研究開発機構,麻布大学,北里大学,三菱総合研究所,理研ゲノム科学総合研究センターから登録された,ヒト腸内微生物群メタゲノム WGS データ 353,805 エントリが公開されました。
研究成果は以下の論文に紹介されています。

アクセッション番号は以下の通りです。

BAAU01000001-BAAU01028900 (28900 entries) (BAAU.gz)
BAAV01000001-BAAV01036326 (36326 entries) (BAAV.gz)
BAAW01000001-BAAW01016539 (16539 entries) (BAAW.gz)
BAAX01000001-BAAX01036455 (36455 entries) (BAAX.gz)
BAAY01000001-BAAY01030198 (30198 entries) (BAAY.gz)
BAAZ01000001-BAAZ01031237 (31237 entries) (BAAZ.gz)
BABA01000001-BABA01035177 (35177 entries) (BABA.gz)
BABB01000001-BABB01020226 (20226 entries) (BABB.gz)
BABC01000001-BABC01009958 ( 9958 entries) (BABC.gz)
BABD01000001-BABD01037296 (37296 entries) (BABD.gz)
BABE01000001-BABE01020532 (20532 entries) (BABE.gz)
BABF01000001-BABF01016164 (16164 entries) (BABF.gz)
BABG01000001-BABG01034797 (34797 entries) (BABG.gz)
これらは10/18分の新着データとしてDDBJより公開されており, Anonymous FTP 一括取得が可能です(ファイル名はカッコ内)。

参考:

Anonymous FTP から公開されている WGSデータファイルの不具合に関するお詫び 2007.11.12
「第18回 DDBJing 講習会 & 第7回寺子屋情報生物学」参加者募集中 2007.10.17
DDBJ では,塩基配列の登録や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により有効に利用していただくために,全国各地で「DDBJing 講習会」を開催しています。 講習会では,DDBJ のスタッフが中心となっておこなう講議や実習を通して,サービスのについての理解を深め,具体的な使い方を学んでいただいています。

2007年11月29-30日に香川大学医学部にて「第18回 DDBJing 講習会 & 第7回寺子屋情報生物学」を開催いたします。今回は,DDBJing 講習会と「バイオインフォマティクス入門」のような寺子屋情報生物学の講義の両方を含む内容です。現在参加申込受付中です。詳細はDDBJing 講習会のページをご覧下さい。 皆様のご参加をお待ちしています!

  • 日時:2007年11月29日(木)13時から18時まで
                 11月30日(金)9時から17時50分まで
  • 場所:香川大学医学部  看護学科教育研究棟2階マルチメディア実習室 (三木町キャンパス)
  • 対象:DDBJを利用される方をどなたでも歓迎します。(定員100名・参加費無料)
  • 講習内容:情報生物学に関する講義ならびにDDBJの Web サービスなどの利用についての講議と実習をおこないます
DAD リリース 41.0 公開 2007.10.12
10月11日よりDAD (DDBJ amino acid database) Rel. 41.0 を公開しています。 DAD rel. 41.0 はエントリ数が 11,364,50,総アミノ残基数が 2,882,657,043 aa となっています。
FTP による定期リリースおよび新着データのダウンロードサイト
DDBJ HP デザイン一新 2007.10.5
DDBJ は10月から,ホームページのデザインを新しくしました。
DDBJ のホームページは長い歴史を反映してたくさんのコンテンツを持っていますが,そのため各コンテンツへのアクセスや検索が複雑になってきている部分がありました。

そこでこの度以下のような改訂を行いました。

  • ホームページデザインを見直し、コンテンツへのナビゲーションを規格化・単純化する

    • グローバルメニューを画面上部に横長に配置しました
      (「Home」「塩基配列の登録」「検索・解析」「FTP・WebAPI」「ドキュメント」「統計情報」「お問い合わせ」)
      ほとんどのコンテンツには グローバルメニュー 二層目ページ(コンテンツの一覧,解説) 希望のコンテンツ,という経路で 2,3クリックで到達できるようになります。二層目以下にはグローバルメニューの左下にパンくずリストを表示(「Home ドキュメント利用の手引き」など)し,現在見ているページが全体の階層構造のなかのどの位置にあたるのかが簡単にわかるようにしました。

    • ローカルメニューを左に配置
      これは主要コンテンツへのショートカットであり,ページによって異なる内容が表示されます。(表示されないページもあります。)

    内容については,継続してアップデートを行っていく予定です。

  • データベースの検索およびホームページの全文検索機能を強化しました
    ページ上部の検索フォームから以下の検索が可能となります

    i)   accession Noによる検索 (getentry)
    ii)  DNAキーワードサーチ (DDBJ release and new へのキーワードサーチ)
    iii)  Proteinキーワードサーチ
    iv)  生物種の学名,分類群の名称等の検索 (TXSearch)
    v)  ホームページの全文検索 (Namazu)
    キーワードサーチ(ii, iii)は,現在は SRS を用いていますが,ARSA の改訂・機能強化の終了後,ページ上部の検索も ARSA を用いた高速な検索に差し替える予定です。

ARSA サービスの休止 2007.10.3
ARSA (All-round Retrieval of Sequence and Annotation) は DDBJ がWWW で提供している高速なキーワード検索システムです。
本年6月に大幅な機能改善をおこないましたが,さらに機能の向上をはかるためのシステム切替作業と,リリース反映作業ならびに定期保守のため,以下の日程でサービスを休止いたします。
休止期間が長いのでご注意下さい。この間の検索には,キーワード検索システム SRS やアクセッション番号などによる検索システム getentry をご利用下さい。
サービス休止期間:
2007年10月25日(木)9時から10月26日(金)21時まで
主な機能改善点

・PATHWAY データベースの追加
・DDBJ 以外のデータベースの項目指定検索が可能に
・複数 DB の共通項目での串刺し検索機能追加
・上記改善に伴う画面構成の変更

その他の機能改善点

・Refine Search の制限解消
  下記文字列についても絞り込み検索が可能になります。
  '」, 「(」, 「)」, 「」, 「
AND」「OR検索時の入力方法の変更
  入力フィールドに直接& (AND)」「|(OR)を入力可能になります。
・Search History の互換性
  現行 ARSA と新 ARSA の Search History に互換性はありません。
  このため、切替後は過去にダウンロードした Search History が利用できなくなります。

ユーザの皆様にはご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
サービスを再開しましたのでどうぞご利用下さい。長期間にわたりご迷惑をおかけしました(10/26 20:00)。

PRF Rel. 117 公開 2007.10.2
9月28日より PRF (Protein Research Foundation)/SEQ データベース Rel. 117 を公開しています。 PRF Rel. 117 はエントリ数が 856,684,総アミノ残基数が 288,916,010aa です。
DDBJ リリース 71 完成 2007.9.27
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。9月27日に DDBJ リリース71 を完成しました。リリース71 のエントリ数は 76,273,34,総塩基数は 79,706,204,461 です。
FTP による定期リリースおよび新着データのダウンロードサイト
また,すでに DDBJ HP でお知らせしているように,DDBJ では DDBJ フラットファイルフォーマットを改訂し,DDBJ が登録を受け付けたエントリに関して,E-mail アドレスと電話番号,FAX 番号を非表示化いたします。この改訂は 2007年12月末,DDBJ 定期リリース72 において完了予定です。DDBJ フラットファイルフォーマット改訂の詳細は,こちらをご覧下さい。
カイコ Bombyx mori GSS 94,904 エントリの公開 2007.9.20
農業生物資源研究所から登録されたカイコ (Bombyx mori) の GSS 94,904 エントリが公開されました。
これらは9/14分の新着データとしてDDBJより公開されており,anonymousFTP サイトから一括取得が可能です。
参考 URL: http://sgp.dna.affrc.go.jp/jp/index.html
アクセッション番号:DE283657-DE378560(94,904 entries)
anonymousFTP 一括取得:ファイル名 >Bombyx_mori_GSS_070914_1.seq.gz
Clustalw の結果不具合のお詫び 2007.9.18
DDBJが WWW および E-mail で提供している ClustalW において,不具合が発生していたことが判明しました。詳細は下記のとおりです

  • 対象サービス:ClustalW
  • 期間:2007年8月30日14時頃から9月7日18時頃まで
  • 不具合の内容:解析結果をE-mailで受信した場合,解析結果をE-mailで受信した場合,TYPE が AUTOMATICとなるような設定がなされた場合(Web の場合はデフォルトを選択,E-mail の場合には is_align 1 を指定し,かつ type の指定をしなかった場合 )に TREE の解析結果が正しく作成されなかった可能性があります。
  • 解析結果:解析結果に間違いがある可能性があります。上記期間に結果をE-mail で受信された方は,お手数ですが,再度解析を実行していただくようお願いいたします。
  • 状況:不具合は修正が完了し,現在は正しく表示されます

ユーザの皆さまには,長期間にわたりご迷惑をおかけしますことをお詫びいたします。
getentry 保守のため一時休止 2007.9.18
getentry は DDBJ が WWW およびE-mail で提供しているアク
セッション番号などによる高速なエントリ検索システムです。
保守作業のため,サービスを一時休止いたします。詳細は以下のとおりです。

  • 休止期間: 2007年9月27日(火) 18:00 - 19:00

注)休止期間中は,ARSA,相同性検索(FASTA, BLAST, PSI-BLAST, SSEARCH),SQmatch からの getentry への
エントリ参照ができなくなります(検索は実行できます)。
ご迷惑をおかけしますが,ご理解とご協力をお願いいたします。
保守作業は終了しました。ご協力ありがとうございました。(9月27日18時40分)

getentry 緊急保守のため一時休止 2007.9.12
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。緊急の保守作業のため,サービスを一時休止いたします。詳細は以下のとおりです。

  • 休止期間:2007年9月12日(水) 17:00 - 18:00

注)休止期間中は,ARSA,相同性検索(FASTA, BLAST, PSI-BLAST, SSEARCH),SQmatch からの getentry へのエントリ参照ができなくなります(検索はおこなえます)。
急なお知らせでご迷惑をおかけしますが,ご理解とご協力をお願いいたします。
保守作業は終了しました。ご協力ありがとうございました。(9月12日18時00分)

H-Invitational Database CIB-DDBJ Flat File Server(ヒトの全長cDNA配列データベース)保守のため停止 2007.9.12
DDBJ が WWW で公開している,H-Invitational Database CIB-DDBJ Flat File Server(ヒトの全長cDNA配列データベース)をシステムメンテナンスのために当分の間停止いたします。再開いたしましたら DDBJ の HP にてご連絡いたします。ご迷惑をお掛け致しますが,皆様のご理解・ご協力をお願い申し上げます。
新 Web サービス "REST" の公開 2007.9.7
DDBJ では,プログラムから利用可能な Web サービスとして REST(Representational State Transfer) サービスを 2007年8月より公開しました。XML Central of DDBJ からご利用可能です。 REST サービスを使うことにより DDBJ で公開している検索システムや解析プログラム,データ取得などを統合して利用することが可能です。

これまでプログラムから利用することが可能なサービスとしてSOAP サービスを公開していました。しかし,SOAP サービスと比較して REST サービスは下記のような利点があります。

  1. 利用しやすい
    WEB ブラウザに URL を入力するだけで動作確認を行うことができます。またプログラムから利用する場合も,Perl, Java, C, Ruby, Python などのプログラミング言語で利用できることを確認しております。さらに telnet や wget コマンドを使って利用することも可能です。
  2. 大規模データを扱いやすい
    REST サービスはサービスの結果をストリームで取得します。したがってサービスの結果を一行ずつ取得することが可能になり,コンピュータのメモリに溜め込まずにマシンの負荷を低くすることができます。このため,これまでの SOAP サービスよりも効率よく大規模データを取得することが可能です。例えば DDBJ の大腸菌ゲノムデータをフラットファイル形式で取得する場合,SOAP と比較して3倍以上速く取得することができます。

一方で,これまでの SOAP サービスにも,利用者のコーディング量が少なくてすみ,拡張性に優れているなどの利点があるため,継続して提供いたします。
DDBJ では,より使いやすい WEB API(Application Program Interface)の機能拡張を進めていきます。ご意見やご提案などがありましたら,xml-admin@ddbj.nig.ac.jp までぜひご連絡ください。
*REST とは?

”生命情報学関連の会議のお知らせ”更新 2007.9.3
以下の会議を追加しました

    2007

  • 日本進化学会2007年大会 (8/31-9/2)
  • 日本遺伝学会第79回大会 (9/19-21)
  • 日本人類遺伝学会第52回大会 (9/12-15)
Clustalw の結果表示不具合のお詫び 2007.8.22
DDBJが WWW および E-mail で提供している ClustalW において,結果の表示に不具合が発生していたことが判明しました。詳細は下記のとおりです。

  • 対象サービス:ClustalW
  • 期間:2007年2月27日から8月7日18時頃まで
  • 不具合の内容:解析結果をE-mailで受信した場合,SHOW ALIGNMENT SCOREオプションとSHOW SEQNO_RANGE SCOREオプションが無効となり,スコアが表示されない
  • 解析結果:解析結果に間違いはありませんでした
  • 状況:不具合は修正が完了し,現在は正しく表示されます

ユーザの皆さまには,長期間にわたりご迷惑をおかけしますことをお詫びいたします。
DDBJ リリース70 におけるメタゲノム CON エントリの大幅な増加について 2007.8.21
DDBJ リリース70 で CON エントリが 983,699 から 3,932,751 と大幅に増加しました。
これは,J. Craig Venter Instituteから登録された,4,087,206 エントリが 2007年4月に追加されたためです。
これらのデータは,海洋メタゲノム研究の成果であり,以下の論文で詳細が紹介されています。

また,下記もご参照ください。

これらエントリは,DDBJ でgetentryから参照することができます。(データは,「FTP を利用したリリースデータ取得」ページの DDBJ 最新リリースデータ,ならびに WGS データからも取得できます)。アクセッション番号は下記です。

      CON entries:    EM000001-EM999999,
EN000001-EN999999, EP000001-EP999999,
EQ000001-EQ087209
Piece WGS entries:    AACY020000001-AACY024124495
停電による遺伝研ネットワーク障害とサービスの停止 2007.8.20
8月20日未明に発生した停電により,国立遺伝学研究所のネットワークサービスに影響がありました。詳細は下記のとおりです。
    停電の発生時刻:8月20日 00:54-01:23
    影響のあったサービス:国立遺伝学研究所のネットワーク通信停止
    現在も利用できないサービス:
  • getentry
  • ARSA
  • FASTA, BLAST, PSI-BLAST, SSEARCH, HMMPFAM, CLUSTALW
  • Anonymous FTP
  • SQmatch
  • 大型計算機 (supernig)
  • H-Invitational Database CIB-DDBJ Flat File Server, ミラーリング H-InvDB

停止中のサービスにつきましては,現在復旧に向けての作業中です。復旧次第DDBJ HP にてご連絡いたします。ご迷惑をおかけしますが,ご理解とご協力をお願いいたします。
全てのサービスが復旧しました。ご迷惑をおかけしました(8月21日 10時30分)
”生命情報学関連の会議のお知らせ”更新 2007.8.16
以下の会議を追加しました

    2007

  • 第7回国際ゲノム会議 (11/27-28)
PRF Rel. 116 公開 2007.8.13
8月8日より PRF (Protein Research Foundation)/SEQ データベース Rel. 116 を公開しています。
PRF Rel. 116 はエントリ数が 832,123,総アミノ残基数が 281,311,678 aa です。
DDBJ リリース 70.1 における INSD-XML 形式の TPA と CON の Anonymous FTP と ARSA での公開不備についてのおわび 2007.8.10
DDBJ リリース 70.1 において、INSD-XML 形式の TPA と CON の Anonymous FTP 公開が行われておりませんでした。結果, Anonymous FTP と ARSA の CON と TPA データについて公開の不備がございました。
公開が行われていなかったデータの内訳

  • INSD-XML 形式 CON データ:3,932,751 エントリ,約61GB ("marine metagenome"データ含む)
  • INSD-XML形式TPAデータ:5,442 エントリ,約74MB
    【参考】前回DDBJリリース69 の INSD-XML 形式 CON データは、983,699エントリ,約11GB

Anonymous FTP について
データの再公開を行いましたので,下記の期間中にリリースデータを取得した方は,再度データを取得し直してください。
  • 公開もれの期間: 2007年6月29日 13:00 - 2007年8月10日 15:00
  • 新規配置したディレクトリ:
    ftp://ftp.ddbj.nig.ac.jp/ddbj_database/ddbj/xml/insdxml_current/

  • 新規配置したファイル:
    ddbjcon1.insd_xml.gz, ddbjcon2.insd_xml.gz, ddbjcon3.insd_xml.gz,
    ddbjcon4.insd_xml.gz, ddbjcon5.insd_xml.gz, ddbjcon6.insd_xml.gz,
    ddbjcon7.insd_xml.gz, ddbjcon8.insd_xml.gz, ddbjcon9.insd_xml.gz,
    ddbjcon10.insd_xml.gz, ddbjcon11.insd_xml.gz, ddbjcon12.insd_xml.gz,
    ddbjcon13.insd_xml.gz, ddbjcon14.insd_xml.gz, ddbjcon15.insd_xml.gz,
    ddbjcon16.insd_xml.gz, ddbjcon17.insd_xml.gz, ddbjcon18.insd_xml.gz,
    ddbjcon19.insd_xml.gz, ddbjcon20.insd_xml.gz, ddbjcon21.insd_xml.gz,
    ddbjcon22.insd_xml.gz, ddbjcon23.insd_xml.gz, ddbjcon24.insd_xml.gz,
    ddbjcon25.insd_xml.gz, ddbjcon26.insd_xml.gz, ddbjcon27.insd_xml.gz,
    ddbjcon28.insd_xml.gz, ddbjcon29.insd_xml.gz, ddbjcon30.insd_xml.gz,
    ddbjcon31.insd_xml.gz, ddbjcon32.insd_xml.gz, ddbjcon33.insd_xml.gz,
    ddbjcon34.insd_xml.gz, ddbjcon35.insd_xml.gz, ddbjcon36.insd_xml.gz,
    ddbjcon37.insd_xml.gz, ddbjcon38.insd_xml.gz, ddbjcon39.insd_xml.gz,
    ddbjcon40.insd_xml.gz, ddbjcon41.insd_xml.gz, ddbjtpa.insd_xml.gz
    


ARSAについて
検索対象データの CON と TPA データに不備がございます。現在データ是正作業を進めておりますが,対応が完了するまでの間, DDBJ データベースの CON と TPA データについては正しい検索が実行できません。データ是正作業が完了次第本ページに掲載いたします。

  • 対象期間:2007年8月8日 18:00 - 現在 (データ是正作業中)
  • 対象データ:ARSA の DDBJ データベースの CON と TPA データ

ARSA のデータ補完作業が完了し,現在は正しい検索結果が得られます。(8/16 18:00)
ユーザの皆さまにはご迷惑をおかけしますことをお詫びいたします。
H-Invitational 関連データベースの更新 2007.8.8
ミラー H-Invitational Database (H-InvDB) が更新されました。 主な更新内容は以下の通りです。

  • cDNA エントリ数が 175,542 から 175,536 に変更になりました。
  • LOCUS エントリ数が 34,701 から 34,699 に変更になりました。
  • ミラー H-Invitational Database (H-InvDB) の version が "4.3" に変更

[H-Invitational 関連データベース]

国立遺伝学研究所ネットワークサービス・ supernig の一時停止 2007.8.7
緊急ネットワークの保守作業に伴い、下記日程にてネットワークサービスを一時停止致します。
この間は,DDBJ のネットワークサービス,国立遺伝学研究所の大型計算機 supernig サービスも停止します。

停止期間: 2007年8月7日(火)18時より21時まで
理由: 緊急ネットワーク保守作業のため

ご迷惑をお掛け致しますが,皆様のご理解・ご協力をお願い申し上げます。
保守作業は終了し,サービスを再開しました。ご協力ありがとうございました。(8月7日21時00分)

キーワード検索 ARSA の機能更新と本運用開始 2007.8.3
DDBJ では,高速キーワード検索システム ARSA(All-round Retrieval of Sequence and Annotation) の試験運用を終えて 2007年6月より,いよいよ本運用を始めました。
ARSA は,下記のような特徴を有しています。

  1. DDBJ(国際塩基配列データベース)を始めとする23種類のデータベースを対象に高速なキーワード検索を実現
  2. 複雑な検索条件や大量のヒットがある条件で検索しても,23種類すべてのデータベースに対して一定の検索レスポンスを提供
  3. DDBJ を対象にした検索では,Features/Qualifiers を指定した詳細な条件による検索が可能

さらに,このたび,これまでの試験運用の間のご意見をもとに次の機能を付加しました

  • 複数データベースからの結果を一括ダウンロードを可能に(右図1)
  • DDBJ 以外のデータベースでも表示項目の選択を可能に(右図2)
  • 結果画面でデータベースを再選択可能に(右図3)
  • 結果画面で表示項目を再選択可能に(右図4)
  • 結果画面で表示件数を再選択可能に (右図5)
  • 結果画面の下部にページジャンプのリンクを追加
ARSA

その他にも細かな仕様改善を加えました。

  • TSV 形式でのダウンロード時の拡張子変更(.csv -> .txt)
  • NarrowSearch の名称を RefineSearch に変更
  • SimpleQuery の廃止
  • HTTP ダウンロードの廃止(FTPダウンロードへの一本化)

また,Java や Perl から ARSA の機能を呼べるように API を充実いたしました(詳細は,DDBJの Webサービス をご参照ください)

DDBJ では,今後さらに,皆様からのご意見をもとにして,より使いやすく強力なキーワード検索システムを目指して機能拡張を進めていきます。ARSA にて 「Your Comment」 をクリックして,批判とご提案をご記入下さい。

XML central of DDBJ web サービスのページ更新 2007.8.3
DDBJ の XML Central of DDBJ ページの Web サービスを使うと,ブラウザーを通してコピー&ペーストの煩雑な手作業の繰り返しを自動化できます。Java や Perl のプログラムで Web サービスのメソッドを呼び出すモジュールを作っておいて,それをワークフローとして組み立てることができます。また,後々モジュールを差し替えることも簡単にできます。
DDBJ の Web サービスではこれまで SOAP(Simple Object Access Protocol) を使ってきましたが REST を介したサービスも拡張していきます。
・参考:新 Web サービス "REST" の公開
[重要] DDBJフラットファイルフォーマット改訂:E-mailアドレスと電話番号,FAX番号の非表示化 2007.8.1
改訂概要
個人情報保護,および,迷惑メール増加などへの対応としまして,DDBJ では,DDBJ が登録を受け付けたエントリに関しましては,E-mail アドレスと電話番号,FAX 番号を非表示化いたします。DDBJ では,ほぼ全ての DDBJ が過去に登録を受け付けたエントリを改訂します。ただし,GenBank,EMBL が受け付けたエントリに関しましては修正しません。この改訂は,2007年12月末,DDBJ 定期リリース72 において完了予定です。
これまで,データベース利用者から各配列の登録者に対する連絡は対象フラットファイルを参照することで自由に行うことが可能でしたが,この改訂により,一般的には,この連絡が取り難くなります。研究上の問題に関して,各配列の登録者への連絡が必要な場合はメッセージを転送いたしますので,お手数ですが,別途設置予定の問い合わせフォームからご連絡ください。その際は簡単な理由(「clone 譲渡を希望」など)を書き添えてください。
申し訳ございませんが,ご理解とご協力をお願いいたします。
改訂詳細
現在,登録者の情報は一般に,REFERENCE 1 の JOURNAL 行に下記のように示されています。

  
 JOURNAL   Submitted (30-NOV-2000) to the DDBJ/EMBL/GenBank databases.
           Hanako Mishima, National Institute of Genetics, DNA Data
           Bank of Japan; Yata 1111, Mishima, Shizuoka 411-8540, Japan
           (E-mail:mishima@supernig.nig.ac.jp, Tel:81-55-981-6853,
            Fax:81-55-981-6849)


本改訂後は,下記の2つの表示形式の何れかを選択することになります。

Type 1: 一般的には,E-mailアドレスと電話番号,FAX番号を非表示とします。


  JOURNAL   Submitted (30-NOV-2000) to the DDBJ/EMBL/GenBank databases.
            Contact:Hanako Mishima
            National Institute of Genetics, DNA Data Bank of Japan; Yata 1111,
            Mishima, Shizuoka 411-8540, Japan
 
Type 2: 登録者が,E-mailアドレスと電話番号,FAX番号の表示をご希望の場合,以下の形式で表示します。


  JOURNAL   Submitted (30-NOV-2000) to the DDBJ/EMBL/GenBank databases.
            Contact:Hanako Mishima
            National Institute of Genetics, DNA Data Bank of Japan; Yata 1111,
            Mishima, Shizuoka 411-8540, Japan
            E-mail :mishima@supernig.nig.ac.jp
            Phone  :81-55-981-6853
            Fax    :81-55-981-6849


DDBJ への既登録分に関しましては,原則,一括で上記のType 1の様に非表示としますが,表示しておく必要がある場合は, ddbjupdt#&64;ddbj.nig.ac.jp にご連絡いただければ,個別に対応いたします。表示・非表示は「E-mailアドレス」「電話番号」「FAX番号」それぞれ個別に指定可能です。
getentry 保守のため一時休止 2007.7.31
getentry は DDBJ が WWW およびE-mail で提供しているアク
セッション番号などによる高速なエントリ検索システムです。
保守作業のため,サービスを一時休止いたします。詳細は以下のとおりです。

  • 休止期間: 2007年8月8日(水) 17:00 - 18:00

注)休止期間中は, 相同性検索(FASTA, BLAST, PSI-BLAST, SSEARCH),SQmatch からの getentry へのエントリ参照ができなくなります(検索はおこなえます)。
ご迷惑をおかけしますが,ご理解とご協力をお願いいたします。
保守作業は終了しました。ご協力ありがとうございました。(8月8日18時00分)

ARSA での DDBJ,DAD 検索の一時停止 2007.7.30
ARSAは DDBJ がWWW で提供している高速なキーワード検索サービスです。検索対象データベースのうち,DDBJ ならびに DAD の更新作業を以下の日程で実施いたします。

  • 日 時:2007年8月8日(水)9時より18時まで(終了次第HPにてお知らせいたします)
  • 内 容:ARSA の DDBJ ならびに DAD 検索の一時停止
  • 備 考:上記停止期間中も ARSA での検索はご利用いただけますが,結果中に DDBJ ならびに DAD の検索結果は含まれません。DDBJ ならびに DAD の検索をお急ぎの場合は,SRS をご利用下さい。)

ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
保守作業は終了しました。ご協力ありがとうございました。(8月8日18時00分)
コオロギ (Gryllus bimaculatus) cDNA 32,010 エントリの新規公開 2007.7.27
徳島大学から登録されたコオロギ (Gryllus bimaculatus) の high throughput cDNA データ 32,010 エントリが公開されました。これらは7/26分の新着データとしてDDBJより公開されており,anonymousFTP サイトから一括取得が可能です アクセッション番号は以下の通りです。
アクセッション番号:AK253140-AK285149(32,010 entries)
anonymousFTP 一括取得:ファイル名 Gryllus_bimaculatus_HTC_070726_1.seq.gz
DDBJ リリース 70.0 の訂正版 70.1 公開 2007.7.24
DDBJ 定期リリース70(2007年6月公開)中にフォーマットの不正なデータが見つかりましたので,2007年7月24日に,訂正版 70.1 を公開しました。

訂正版リリース: DDBJ release 70.1 (2007年7月24日公開)
元のリリース: DDBJ release 70 (2007年6月29日公開)
不正部分: Feature Table format
該当アクセッション番号: 以下の 53 エントリ
     AJ570278, AJ570279, AJ570280, AJ570281, AJ570283,
     AJ570284, AJ570285, AJ570286, AJ570287, AJ570288,
     AJ570289, AJ570290, AJ570291, AJ570292, AJ570294,
     AJ570295, AJ570296, AJ570297, AJ570298, AJ570299,
     AJ570300, AJ570301, AJ570302, AJ570303, AJ570305,
     AJ570468, AJ570470, AJ570471, AJ570472, AJ570473,
     AJ570474, AJ570475, AJ570476, AJ570477, AJ570478,
     AJ570479 AJ570481 AJ570482, AJ570483, AJ570484,
     AJ570485, AJ570486, AJ570487, AJ570488, AJ570489,
     AJ570490, AJ570492, AJ570493, AJ570494, AJ570495,
     X06674, X06675, AJ965256,    
修正されたファイル:
ddbjbct1.seq
  ddbjhum5.seq
  ddbjinv1.seq
参照ページ: FTP による定期リリースおよび新着データのダウンロードサイト

ご迷惑をおかけしましたことをお詫びいたします。

DAD rel. 40 公開 2007.7.24
7月23日より DAD (DDBJ amino acid database) Rel. 40 を公開しています。 DAD rel. 40 はエントリ数が 10,900,421,総アミノ残基数が 2,729,493,910 aa となっています。今リリースより CON division のデータが追加されました。
FTP による定期リリースおよび新着データのダウンロードサイト
DDBJ リリース開始より20周年 2007.7.19
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で>公開しています。1987年7月に DDBJ リリース1 を公開して以来,2007年7月で20周年を迎えました。リリース1 のデータは DDBJ のみで収集・編集したもので,エントリ数は 66,塩基数は 108,970 でした。
参考:「DDBJ 本格活動20周年を迎えて」
”生命情報学関連の会議のお知らせ”更新  2007.7.3
DDBJ リリース 70 完成 2007.7.2
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。6月29日に DDBJ リリース70 を完成しました。リリース70 のエントリ数は 72,801,679,総塩基数は 76,788,510,646 です。
FTP による定期リリースおよび新着データの>ダウンロードサイト
WGS データの一部が getentry にて未公開になっていた件についてのお詫び 2007.6.22
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
このたび,WGS データの一部が未公開になっていた期間があったことが判明しました。詳細は下記のとおりです。

  • 期間:2007年2月27日 から 2007年6月20日まで
  • アクセッション番号:別紙参照
  • 備考:anonymous FTPサイト (WGS データ ならびに生物名リストより取得可能なデータには,上記期間中も全てのデータが正しく含まれていました。

なお,未公開となっていたデータについては,2007年6月19日に実施した getentry の保守作業の際に全て追加し,現在は正しい検索結果が得られます。
正しい検索ができない状況が続いていたことにより,ユーザの皆様にご迷惑 お掛けいたしましたことを深くお詫び申し上げると共に,今後このような事態が発生することのないよう努めます。
H-Invitational 関連データベースの更新 2007.6.19
2007年1月22日より停止していましたミラー H-InvDB のサービスを再開いたしました。また,本再公開に合せてH-Invitational 関連データベースの内容が更新されました。 主な更新内容は以下の通りです。

  • cDNA エントリ数が 167,992 から 175,542 に増加
  • LOCUS エントリ数を 35,005 から 34,701 に変更。
  • ミラー H-Invitational Database (H-InvDB) の version が "4.0" に変更

[H-Invitational 関連データベース]

長期間にわたる休止でご迷惑をおかけしましたことをお詫びいたします。今後はどうぞご利用下さい。

DDBJ メールマガジン No.32 配信 2007.6.15
DDBJ では,隔月でメールマガジンを配信しています。6月14日に第32号を配信しました。今回は,5月に行われた相同性検索システムの機能更新の詳細,Nature に掲載されたメダカゲノムの論文と登録データについて,今年3月に中国上海で行われた日韓中バイオインフォマティクストレーニングコース参加者の手記などです。ホームページでもご覧になれますが,お申し込みいただいた方にはメール配信をいたします。
配信を希望される方は,申込み・変更ページで簡単に手続きできますので,この機会に是非お申し込み下さい。
getentry 保守のため一時休止 2007.6.11
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
保守作業のため,サービスを一時休止いたします。詳細は以下のとおりです。

  • 休止期間: 2007年6月19日(火) 18:00 - 19:00
注)休止期間中は,ARSA,相同性検索(FASTA, BLAST, PSI-BLAST, SSEARCH),SQmatch からの getentry へのエントリ参照ができなくなります(検索はおこなえます)。
ご迷惑をおかけしますが,ご理解とご協力をお願いいたします。
相同性検索システムの機能更新  2007.6.11
DDBJ では, WWWE-mailで提供している相同性検索サービス FASTA, BLAST,PSI-BLAST,SSEARCH,HMMPFAM のシステム更新を5月15日に行ないました。 その結果,新機能の追加や表記の変更がありました。詳細は以下の通りです。

[1] FASTA/SSEARCH/PSI-BLAST/HMMPFAMでの複数クエリ受付機能の追加

これまでは,BLAST のみ複数クエリの受付が可能でしたが,FASTA,PSI-BLAST,SSEARCH,HMMPFAM にも複数クエリ受付機能を追加しました。

[2] HMMPFAM 結果へのエントリ表示機能の付加


  • HMMPFAM の検索結果に Pfam エントリへの表示リンクを追加しました
  • seq-fに各アラインメントへのリンクを追加しました

=======================================================================
Parsed for domains:
Model      Domain  seq-f seq-t   hmm-f hmm-t     score  E-value
--------   ------- ----- -----   ----- -----     -----  -------
PF00310.11  1/1       2   264 ..    1   394 []   203.6  4.3e-58    <- (ア)にリンク
PF04051.6   1/1     114   211 ..    1   193 []   -82.6        9    <- (イ)にリンク
PF03915.3   1/1     162   531 ..    1   471 []  -255.9      9.5    <- (ウ)にリンク
   :
   :

Alignments of top-scoring domains:
  (ア)   PF00310.11: domain 1 of 1, from 2 to 264: score 203.6, E = 4.3e-58     
           -------------------------------------------------------
  (イ)   PF04051.6: domain 1 of 1, from 114 to 211: score -82.6, E = 9         
           -------------------------------------------------------
  (ウ)   PF03915.3: domain 1 of 1, from 162 to 531: score -255.9, E = 9.5     
           -------------------------------------------------------
=======================================================================

[3] FASTA/SSEARCH で使用されるプログラム名の統一

これまで,FASTA/SSEARCH で用いられているプログラム名が不揃いで,たとえば,fastx と fastx34_t の2つの表記が混在していました。これをバージョンを含まない表記に統一しました。バージョン番号はトップページ画面のサービス名のロゴ部分に表示します。

[4] FASTA E-mail サービスの program パラメータの変更

program パラメータをバージョン表記なしに統一しました([3]の方針と合わせる為)。当面は,どちらの表記でも実行可能です。
  • 修正前
    program パラメータとして fasta3_t,fastx3_t,tfasta3_t,tfastx3_t が指定可能
  • 修正後
    program パラメータとして fasta, fastx, tfasta, tfastx が指定可能。

[5] 結果返却 E-mail の文面変更

全サービスで統一しました。

[6] "In HTML format" オプションを "HTML format" 表記に統一しました

結果受け取り方法に E-mail を選択し,HTML format をチェックしなかった場合は,メール本文中にtext 形式で結果が届きます。
どうぞご利用ください。
メダカゲノムの論文が Nature に掲載 2007.6.8
メダカ(ニホンメダカ)の全ゲノム情報が国立遺伝学研究所や東京大学の研究チームによって解読され,その概要配列が6月7日発行の英科学誌 Nature (vol447, pp.714-; Jul 7, 2007 / doi:10.1038) に発表されました。
メダカは日本人になじみが深く, 飼育のしやすさなどから日本では実験動物として良く利用されています。そのため,メダカ塩基配列データの多くは日本人研究者によって登録されています。
研究チームは7億塩基を解読し,20,141個の遺伝子を解明しました。8割以上がヒトの遺伝子と類似していることがわかり,そのため解読の成果は,今後脊椎動物進化の過程や,遺伝性疾患の原因の解明に役立つと期待されます。
この塩基配列は,Whole Genome Shotgun(WGS) ならびに Mass sequence for Genome Annotation(MGA) データとして DDBJ より DDBJ/EMBL/GenBank 国際塩基配列データベースに登録されており,アクセッション番号は,BAAF03000000(Hd-rR, version 0.9),BAAF04000000(Hd-rR, version 1.0),BAAE01000000(HNI),ならびにACAAA0000001-ACAAA0356693(5'SAGE tags) です。
データは getentryで取得または,anonymousFTP一括取得(下記参照)することができます。
また,FTP を利用したリリースデータ取得のページの「WGS データ」と「MGA データ」よりダウンロードすることができますのでどうぞご利用下さい。
参考 URL:   http://medaka.utgenome.org/

アクセッション番号 anonymousFTP 一括取得(ファイル名) サイズ(圧縮)
BAAF03000000(Hd-rR, version 0.9) Oryzias_latipes_WGS_060607_1.seq.gz 334MB
BAAF04000000(Hd-rR, version 1.0) Oryzias_latipes_WGS_070402_1.seq.gz 302MB
BAAE01000000(HNI) Oryzias_latipes_WGS_HNI_070402_1.seq.gz 269MB
ACAAA0000001-ACAAA0356693
(5'SAGE tag)
ACAAA_variable.gz 3.9MB
ARSA サービスの休止 2007.6.5
ARSA (All-round Retrieval of Sequence and Annotation) は DDBJ がWWW で提供している高速なキーワード検索システムです。
機能改善のため,以下の日程でサービスを休止いたします。休止期間が長いのでご注意下さい。この間の検索には,キーワード検索システムSRSやアクセッション番号などによる検索システム getentryをご利用下さい。
サービス休止期間:
2007年6月20日(水)9時から6月22日(金)18時まで
備考:サービス再開後の機能の変更点は以下の通りです。

  • 複数データベースからの結果を一括ダウンロード可能
  • DDBJ 以外のデータベースでも表示項目を選択可能
  • 結果画面でデータベースを再選択可能
  • 結果画面で表示項目を再選択可能
  • 結果画面で表示件数を再選択可能
  • 結果画面の下部にページジャンプのリンクを追加
  • CSV ダウンロードの拡張子変更(.csv->.txt)*
  • NarrowSearch の名称を RefineSearch に変更
  • SimpleQuery の廃止
  • HTTP ダウンロードの廃止

*:現行CSVダウンロード機能では,拡張子が「.csv」ですが,中味がタブ区切りになっておりました。実データに即した拡張子とするため,今後は,拡張子を「.txt」へと変更いたします。これまで,表記に誤りがありましたことをお詫びいたします。

ユーザの皆様にはご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
サービスを再開しましたのでどうぞご利用下さい。長期間にわたりご迷惑をおかけしました(6/22 18:00)。

Rel. 115 公開 2007.6.5
6月5日より PRF (Protein Research Foundation)/SEQ データベース Rel. 115 を公開しています。PRF Rel. 115 はエントリ数が 810,251,総アミノ残基数が 274,842,827 aa です。
第19回国際実務者会議開催 2007.6.5
DDBJ, EMBL, GenBank の3大国際 DNA データバンクは,国際塩基配列データベース共同構築の運営・推進を図るために,国際実務者会議を年1回開催しています。
2007年の国際実務者会議は5月21日から23日に 英国 EBI で開催され,DDBJ からもスタッフ5名とアノテータ2名が出席しました。DDBJ, EMBL, GenBank 三極の活動の年次報告が行なわれた後,国際塩基配列データベース運用上の実務的な問題を討論しました。
実務者会議の詳細は,後日 DDBJ の HP に掲載します。
国立遺伝学研究所ネットワークサービス・ supernig の一時停止 2007.6.4
緊急ネットワークの保守作業に伴い、下記日程にてネットワークサービスを一時停止致します。
この間は,DDBJ のネットワークサービス,国立遺伝学研究所の大型計算機 supernig サービスも停止します。
サービス停止期間:

  • 2007年6月7日(木)14時より17時まで

理由:緊急ネットワーク保守作業のため
ご迷惑をお掛け致しますが,皆様のご理解・ご協力をお願い申し上げます。

SRS 緊急保守のため一時停止 2007.6.1
SRS(Sequence Retrieval System) は,DDBJ が WWW サーバで提供しているキーワード検索サービスです。本日(6/1) 15時20分頃に機器障害が発生し,30分間サービスが中断しました。そのため,緊急保守実施のため,現在サービスを一時停止しております。停止時間は1時間ほどの予定ですが,検索をお急ぎの方は,ARSA をご利用下さい。サービス再開は DDBJ HP にてお知らせいたします。
ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
サービスを再開いたしました。ご迷惑をおかけいたしました。(6/1 18:00)
ARSA での DDBJ 検索の一時停止 2007.5.30
ARSAは DDBJ がWWW で提供している高速なキーワード検索サービスです。検索対象データベースのうち,DDBJ の検索に一時的に不具合が発生しています。詳細は以下のとおりです。
  • 日 時:2007年5月30日(水)10時50分より 
  • 内 容:ARSA の DDBJ 検索の一時停止
  • 備 考: 現在 ARSA での検索はご利用いただけますが,結果中に DDBJ の検索結果は含まれません。DDBJ の検索をお急ぎの場合は,SRS をご利用下さい。

ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
復旧しました。長時間にわたりご迷惑をおかけしました(5/30 23:00)。
BLASTの検索結果の Text View 画面での結果表示不備のお詫び 2007.5.24
DDBJ が WWW で提供している相同性検索サービスのうち BLAST で検索結果の表示に不備があったことが判明しました。詳細は以下のとおりです。

  • 対象サービス:BLAST (結果表示を WWW にした場合)
  • 現象:検索結果表示の Text View 画面において,アラインメント結果が最大 100本 までしか表示されない
  • 発生期間:2007年2月26日10時より5月18日13時まで
  • 原因:2007年2月末のシステム移行時のプログラムの不具合により,Text View 画面のアラインメント結果表示の上限が100本に設定されていた
  • 対応:プログラムを修正し,現在は正しく(表示数の上限なし)表示されます

長期にわたり,正しい検索結果が表示されない状態が続きましたことをお詫び申し上げます。
ARSA での DDBJ,DAD 検索の一時停止 2007.5.15
ARSAは DDBJ がWWW で提供している高速なキーワード検索サービスです。検索対象データベースのうち,DDBJ ならびに DAD の更新作業を以下の日程で実施いたします。

  • 日 時:2007年5月21日(月)9時より18時まで(終了次第HPにてお知らせいたします) 
  • 内 容:ARSA の DDBJ ならびに DAD 検索の一時停止
  • 備 考:上記停止期間中も ARSA での検索はご利用いただけますが,結果中に DDBJ ならびに DAD の検索結果は含まれません。DDBJ ならびに DAD の検索をお急ぎの場合は,SRS をご利用下さい。)

ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
SRSサービス一時停止 2007.5.11
SRS(Sequence Retrieval System) は,DDBJ が WWW サーバで提供しているキーワード検索サービスです。5月10日 21時40分頃に機器障害が発生し,現在サービスを停止しております。サービスの復旧次第 HP にてご連絡いたしますが,検索をお急ぎの方は,ARSA をご利用下さい。
ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
復旧いたしました。ご迷惑をおかけいたしました。(5/11 14:50)
国立遺伝学研究所ネットワークサービス停止 2007.5.10
国立遺伝学研究所ネットワーク保守作業のため,下記日程におきまして全ネットワークサービスを停止いたします。
この間は,DDBJ のネットワークサービスも全て停止します。 また,国立遺伝学研究所の大型計算機 supernig のサービスも停止します。ご迷惑をおかけしますが,皆様のご理解とご協力をお願い致します。
期間:2007年5月15日(火)12:00 から 14:00 まで
PRF Rel. 114 公開 2007.5.2
5月2日より PRF (Protein Research Foundation)/SEQ データベース Rel. 114 を公開しています。
PRF Rel. 114 はエントリ数が 791,254,総アミノ残基数が 268,739,354 aa です。
検索解析サービスの一時停止のお知らせ 2007.4.27
DDBJ が WWWE-mail
で公開している下記のサービスについて,保守作業のため,サービスを一時停止いたします。

日 時: 2007年5月15日 9時より18時(予定)まで
サービス: ・FASTA, BLAST, PSI-BLAST, SSEARCH, HMMPFAM, ClustalW
・Traffic, Result Viewer
備考: ・サービス停止中は,E-mail 受付けの内容はメールサーバに蓄積されます(解析は実行されません)。
・停止前に受付けていたリクエストは,サービス再開後に順次処理されます。

サービスの再開は,DDBJ HP にてお知らせいたします。ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
保守作業は完了し,サービスを再開しました。(18:00)

GIB にデータ追加 2007.4.27
GIB (Genome Information Broker) は WWW でゲノム情報を提供するサービスで,真正細菌・古細菌・真核生物のゲノムデータを提供しています。
2007年3月20日~4月27日に以下のゲノム配列が公開され,GIB でもデータが検索ができるようになりました。

  • Methanococcus maripaludis C5 (by Joint Genome Institute)
  • Saccharopolyspora erythraea NRRL 2338 (by University of Cambridge)
  • Francisella tularensis subsp. tularensis WY96-3418 (by UT Southwestern Medical Center)
  • Desulfotomaculum reducens MI-1 (by Joint Genome Institute)
  • Burkholderia vietnamiensis G4 (by Joint Genome Institute)
  • Herminiimonas arsenicoxydans (by Genoscope)
  • Geobacillus thermodenitrificans NG80-2 (by Nankai University)
  • Corynebacterium glutamicum R (by RITE)
  • Aeromonas salmonicida subsp. salmonicida A449 (by NRC Institute for Marine Biosciences)
  • Prosthecochloris vibrioformis DSM 265 (by Joint Genome Institute)
  • Polynucleobacter sp. QLW-P1DMWA-1 (by Joint Genome Institute)
  • Yersinia pestis Pestoides F (by Joint Genome Institute)
  • Mycobacterium gilvum PYR-GCK (by Joint Genome Institute)
  • Pyrobaculum arsenaticum DSM 13514 (by Joint Genome Institute)
  • Rhodobacter sphaeroides ATCC 17025 (by Joint Genome Institute)
  • Salinispora tropica CNB-440 (by Joint Genome Institute)
  • Enterobacter sp. 638 (by Joint Genome Institute)
  • Pseudomonas stutzeri A1501 (by Joint Genome Institute)
  • Caldicellulosiruptor saccharolyticus DSM 8903 (by Joint Genome Institute)
  • Pseudomonas mendocina ymp (by Joint Genome Institute)
  • Shewanella putrefaciens CN-32 (by Joint Genome Institute)
ヒト EST 134,569 エントリの新規公開 2007.4.24
NEDO human cDNA sequencing project から登録されたヒトの EST データ 134,569 エントリが公開されました。
これらは4月21日の新着データとして DDBJ より公開されており,anonymousFTP サイトから一括取得が可能です。アクセッション番号は以下の通りです。
アクセッション番号:DC294839-DC429407(134,569 entries)
anonymousFTP 一括取得:ファイル名 Homo_sapiens_EST_070421_1.seq.gz
ARSA に検索不具合発生 2007.4.24
ARSAは DDBJ が WWW で提供している高速なキーワード検索サービスです。現在,DAD の検索ができない不具合がが発生しています。詳細は下記のとおりです。

・サービス名: ARSA
・発生期間: ・4月23日4時頃から16時20分頃まで
・4月24日2時50分頃から
・現象: ARSA の DAD 検索のご利用ができません。(DAD 検索を行った場合、「システム保守」等のメッセージが出力されます。)
その他の検索には影響はありません。
・対応: 現在原因を調査中です。復旧次第 HP にてご連絡いたします。

ユーザの皆様にはご迷惑をおかけして申し訳ございません。ご理解とご協力をお願いいたします。
復旧いたしました。ご迷惑をおかけいたしました。(4/24 14:20)

国立遺伝学研究所ネットワークサービス停止  2007.4.19
国立遺伝学研究所ネットワーク保守作業のため,下記日程におきまして全ネットワークサービスを停止いたします。
この間は,DDBJ のネットワークサービスも全て停止します。 また,国立遺伝学研究所の大型計算機 supernig のサービスも停止します。
ご迷惑をおかけしますが,皆様のご理解とご協力をお願い致します。
期間:2007年4月26日(木)14:00 から 16:00 まで
保守作業は終了し,サービスを再開いたしました。ご協力ありがとうございました。(16:40)
「第17回 DDBJing 講習会 in 三島」参加者募集中 2007.4.19
DDBJ では,塩基配列の登録や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により有効に利用していただくために,全国各地で「DDBJing 講習会」を開催しています。 講習会では,DDBJ のスタッフが中心となっておこなう講議や実習を通して,サービスのについての理解を深め,具体的な使い方を学んで頂いています。

2007年5月29-30日に国立遺伝学研究所 生命情報・DDBJ研究センター 2階会議室での講習会の開催が決定しましたのでご案内します。 今回は例年春に開催されている講習会と同じく,国立遺伝学研究所 DNA Data Bank of Japan (DDBJ)の主催で,DDBJ の Web サービスなどの利用についての講議と PC を用いた実習を行ないます。PC を用いた実習の時間を多く設け,より実践的な知識を身に付けていただける講議内容を予定していますので是非ご参加下さい。 詳細はDDBJing 講習会のページをご覧下さい。 皆様のご参加をお待ちしています!

  • 日時:2007年5月29日(火)13時から17時まで
                 5月30日(水)10時から17時まで

  • 場所:国立遺伝学研究所 生命情報・DDBJ研究センター 2階会議室
  • 対象:DDBJを利用される方をどなたでも歓迎します。(定員30名・参加費無料)
  • 講習内容:DDBJの Web サービスなどの利用についての講議とPC を用いた実習を
    行ないます。無線 LAN を用いてネットワークに接続しての実習。参加者はPCを持参
新システムはこれだけ速くなった,がしかし… 2007.4.19
2005年2月3日に第1回スーパーコンピュータシステム仕様策定委員会を開催してから2年余り,2007年2月27日から国立遺伝学研究所において新しいスーパーコンピュータシステムが稼動し始めました。それにともない DDBJ におけるさまざまなデータ処理が大幅に速くなりました。

○データの管理や公開のデータ処理の場合旧システムに比べて次のように高速になりました:


  • 多数のフラットファイル作成:一晩に30万エントリー作成から100万エントリー作成へ増
  • 巨大なフラットファイルの作成:イネ染色体4本分に要した1時間50分を13分に短縮
  • ライブリスト*1の作成:1時間40分を13分に短縮
  • 大量の EST 処理:3-4万エントリー/時から50-80万エントリー/時へ,15-20倍の高速化

これらの高速化は,分散データベースへ転換しかつその特長を活かすべくアプリケーションを改良したことによってもたらされました。

○相同性検索も速くなりました(旧システムとの単体性能比):


  • BLAST が7.71倍、PSI-BLAST が7.89倍、FASTA が4.73倍、SSEARCH が5.55倍
  • CLUSTALW も7.94倍となりました。

これらの高速化は,クロック数が上がったことならびに各アプリケーションの運用を見直したことによります。なお,CPU のコア数*2も 176 から 256 へ 1.45倍に増加し,受付可能数も多くなりました。

さて,新システム導入にあたっては2008年にその時点での最新機器を評価しつつ仕様を強化できる契約を実現しました。したがって,大規模計算機センターの共通の悩みであったレンタル期間末期の陳腐化を多少回避できる見込みです。しかしながら,新型のシークエンサの開発と普及ならびにメタゲノム解析*3 といった新しい研究分野の展開によっては,2005年から2006年にかけて設計した仕様の大前提が脆くも崩れさってしまう恐れがあります。

*1) ライブリスト:GenBank, EMBL とのデータ交換にあたって3センターからの公開データの間で齟齬が生じないようにする(クロスチェック)のために使用される,公開中の全データのリスト。
*2) CPU のコア数:従来のパソコンでは,1つの CPU は1つのコアを持ち(シングルコア),複数のアプリケーションが見掛け上同時実行されている場合でも,それぞれのアプリケーションは細かく分割されてこの1つのコアの上で縞模様のように順次実行されてきました。
最近出てきたパソコンは2つのコアを持つ CPU が使われ始めています。単純に言えばディアルコアの CPU では2種類のアプリケーションをそれぞれのコアで実行できるので,シングルコア CPU の場合の半分の時間で処理が終わる可能性があります。
PC クラスターでは4つのコアを持つ CPU も使われ始めています。
*3) 最近の例:The Global Ocean Survey由来のデータ。600万余りのタンパク質のアノテーションが付与された400万件のコンティグ(AACY020000001-ACYY024124495)
メダカ strain Hd-rR の WGS 134429 エントリと CON 6928 エントリ,strain HNI の WGS 346141 エントリと CON 38235 エントリの公開  2007.4.18
東京大学から登録されたメダカ strain Hd-rR の WGS データ 134429 エントリ,および,これに対応する CON データ 6928 エントリが公開されました。また,メダカ strain HNI の WGS データ 346141 エントリ,および,これに対応する CON データ 38235 エントリも公開されました。これらは4月2日分の新着データとしてDDBJより公開されており,anonymousFTP サイトから一括取得が可能です。

参考 URL:   http://medaka.utgenome.org/

アクセッション番号:

strain Hd-rR (WGS version 4)
    WGS: BAAF04000001-BAAF04134429 (134429 entries)
    scaffold/CON : scaffold/CON :DF083412-DF090103 (6692 entries)
    ultra/CON : ultra/CON :DF090104-DF090315 (212 entries)
    chromosome/CON: chromosome/CON:DG000001-DG000024(24 entries)
strain HNI (WGS version 1)
    WGS: BAAE01000001-BAAE01346141 (346141 entries)
    scaffold/CON: DF000001-DF038235 (38235 entries)

anonymousFTP 一括取得:ファイル名
    Oryzias_latipes_CON_070402_1.seq.gz
    Oryzias_latipes_CON_070402_2.seq.gz
    Oryzias_latipes_CON_070402_3.seq.gz
    Oryzias_latipes_CON_HNI_070402.seq.gz
    Oryzias_latipes_WGS_070402_1.seq.gz
    Oryzias_latipes_WGS_HNI_070402_1.seq.gz

ゲノムネットワークプラットフォーム統合データベース更新 2007.4.18
ゲノムネットワークプラットフォームでは2007年3月28日にデー タが更新されました。遺伝子比較機能が利用できるようになりました。詳しくはこちらをご覧 ください。
http://genomenetwork.nig.ac.jp/
統計「登録塩基数上位30種の順位推移」更新 2007.4.17
DDBJ リリース69 公開にともない,統計の詳細で公開している登録塩基数を生物種別にランキングした
登録塩基数上位30種の順位推移(~DDBJ rel.69)を更新しました。4月2日新着データとして DDBJ より大量公開されたメダカ Oryzias latipes (Japanese rice fish) が24位に、Vitis vinifera (grape) が新たに16位にランクインしました。生物種をクリックして推移のグラフをご覧下さい。
getentry の停止について 2007.4.13
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
保守作業のため,サービスを一時停止いたします。詳細は以下のとおりです。

停止期間: 2007年4月17日(火) 18:00 - 19:00
注)停止期間中は,ARSA,相同性検索(FASTA, BLAST, PSI-BLAST, SSEARCH),SQmatch からの getentry へのエントリ参照ができなくなります(検索はおこなえます)。

ご迷惑をおかけしますが,ご理解とご協力をお願いいたします。
保守作業は終了しました。ご協力ありがとうございました。(4月17日19時10分)

DDBJ メールマガジン No.31 配信 2007.4.13
DDBJ では,隔月でメールマガジンを>配信しています。第31号を配信しました。今回は, DDBJing 講習会(5月29-30日)三島開催のご案内,大型計算機 (supernig) 利用申請継続手続きのご案内, 大量データの公開,カニクイザル脳の完全長cDNAに関する論文などです。ホームページでもご覧になれますが,お申し込みいただいた>方にはメール配信をいたします。
配信を希望される方は,申込み・変更ページで簡単に手続きできますので,この機会に是非お申し込み下さい。
コムギ EST 194,853 エントリの新規公開  2007.4.5
国立遺伝学研究所から登録されたコムギの EST データ 194,853 エントリが公開されました。これらは4月3日分の新着データとして DDBJ より公開されております。
参考 URL: http://dolphin.lab.nig.ac.jp
アクセッション番号: CJ773323-CJ968175 (194,853 entries)
anonymousFTP 一括取得: ファイル名 Triticum_aestivum_EST_070403_1.seq.gz
マウス EST 95,566 エントリの新規公開 2007.4.5
放射線医学総合研究所から登録されたマウスの EST データ 95,566 エントリが公開されました。これらは4月3日分の新着データとしてDDBJより公開されております。
アクセッション番号は以下の通りです。
    AV442833-AV503678     AV503747-AV504941     AV504943-AV517878
    AV567729-AV568517     AV568519-AV568529     AV568531-AV568562
    AV568564-AV568588     AV568590-AV568595     AV568597-AV568605
    AV568607-AV568629     AV568631-AV570287     AV570357-AV573382
    AV573409-AV576847     AV576917-AV577109     AV577169-AV588547
anonymousFTP 一括取得:ファイル名
Mus_musculus_EST_070403_1.seq.gz
DDBJ リリース 69 完成 2007.4.2
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。
3月30日に DDBJ リリース69 を完成しました。リリース69 のエントリ数は 67,523,680,総塩基数は 71,775,679,500 です。
FTP による定期リリースおよび新着データのダウンロードサイト
GIB サービス一時停止 2007.3.27
DDBJ が WWW で提供している GIB は、現在サービスを停止しています。再開次第お知らせいたします。 皆様のご理解とご協力をお願い致します。
GIB は復旧しました。ご迷惑をおかけいたしました。(3月27日11時10分)
公開サービスの緊急保守のお知らせ 2007.3.23
DDBJ が WWW とE-mail で公開している下記のサービスを,緊急保守作業実施のため,本日下記の時間帯に停止いたします。

日 時: 2007年3月23日 15時より17時(予定)まで
サービス名: ・ARSA
・ClustalW
・getentry
・相同性検索(FASTA, BLAST, HMMPFAM, PSI-BLAST, SSEARCH)

サービスの再開は,DDBJ HP にてお知らせいたします。
急なお知らせのため,ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
保守作業は終了しました。ご協力ありがとうございました(17:00)

E-mail 利用による相同性検索検索ならびに ClustalW 解析実行の一時中断 2007.3.23
DDBJ が WWW およびE-mail で提供している相同性検索ならびに ClustalW のうち,E-mail を利用するサービスが,現在解析実行を一時中断しています。詳細は下記のとおりです。

・対象サービス: BLAST, FASTA, HMMPFAM, PSI-BLAST, SSEARCH
ClustalW
・期間: 2007年3月23日9時より

・不具合の内容: ・以下の方法では,受付は可能ですが,解析が実行されない(待ち状態) 状況です。
  「WWW 受付」 → 「E-mail 結果返信」
  「E-mail 受付」 →「E- mail 結果返信」
・WWW 受付 → WWW 結果返信は正常に実行されます。
ご利用の場合: 「WWW 受付 → WWW 結果返信」をご利用下さい。混雑が予想されますが,Traffic で受付番号(Request ID)により個々のプロセスの実行状況を確認出来ます。また,検索画面を閉じてしまっても,Result Viewer で後で結果を確認することが可能です。
お急ぎでない場合は, E-mail 結果返信を指定すれば,サービス復旧の後に結果が送信されます。
復旧: 復旧しましたら,このページでお知らせいたします。

ユーザの皆さまにはご迷惑をおかけしますことをお詫びいたします。

PRF Rel. 113 公開 2007.3.20
3月19日より PRF (Protein Research Foundation)/SEQ データベース Rel. 113 を公開しています。PRF Rel. 113 はエントリ数が 773,622,総アミノ残基数が 262,963,464 aa です。
GIB にデータ追加 2007.3.20
GIB (Genome Information Broker) は WWW でゲノム情報を提供するサービスで,真正細菌・古細菌・真核生物のゲノムデータを提供しています。
2007年2月20日~3月20日に以下のゲノム配列が公開され,GIB でもデータが検索ができるようになりました。

  • Streptococcus sanguinis SK36 (by Virginia Commonwealth University)
  • Clostridium thermocellum ATCC 27405 (by Joint Genome Institute)
  • Methanoculleus marisnigri JR1 (by Joint Genome Institute)
  • Shewanella baltica OS155 (by Joint Genome Institute)
  • Actinobacillus pleuropneumoniae L20 (by Joint Genome Institute)
  • Staphylothermus marinus F1 (by Joint Genome Institute)
  • Mycobacterium sp. JLS (by Joint Genome Institute)
  • Pyrobaculum calidifontis JCM 11548 (by Joint Genome Institute)
  • Burkholderia mallei NCTC 10247 (by The Institute for Genomic Research)
  • Burkholderia pseudomallei 1106a (by The Institute for Genomic Research)
  • Burkholderia pseudomallei 668 (by The Institute for Genomic Research)
  • Rhodobacter sphaeroides ATCC 17029 (by The Institute for Genomic Research)
  • Acinetobacter baumannii ATCC 17978 (by Yale University)
  • Prochlorococcus marinus MIT 9301 (by J Craig Venter Institute)
  • Shewanella loihica PV-4 (by Joint Genome Institute)
相同性検索の検索結果表示不具合のお詫び 2007.3.16
DDBJ が WWW およびE-mail で提供している相同性検索において,結果の表示に不具合が発生していたことが判明しました。詳細は下記のとおりです。

・対象サービス: BLAST, FASTA, PSI-BLAST, SSEARCH
・期間: 2007年2月27日から3月17日11時頃まで
(現在,検索用データベースの再構築を行っており,明日11時頃完了予定)
・不具合の内容:

  • 検索結果の表示で,本来アクセッション番号が表示されるはずが LOCUS 名が表示されるためにリンクエラーとなる(下記例参照)
  • 既に検索が終了したものは,Result Viewer で確認する際にもリンクエラーとなります
・検索結果: 検索結果に間違いはありません

---------------------------------------------------------------------
                                                                 Score    E
Sequences producing significant alignments:                      (bits) Value

AAU58946|U58946.1 Aspergillus awamori transposable element Tan1,...   3979  0.0  
    ↑LOCUS名が表示されるため、リンクエラーとなる
AM270150|AM270150.1 Aspergillus niger contig An07c0330, complete...   3866  0.0  
AM270394|AM270394.1 Aspergillus niger contig An18c0010, complete...    517  e-143
AM270353|AM270353.1 Aspergillus niger contig An16c0010, complete...    517  e-143
---------------------------------------------------------------------

・対応: 検索用データベースの再構築を行います
(作業終了は3月17日(土)11時頃の予定)

ユーザの皆様にとって不便な状況が続いていたことにより,ご迷惑 お掛けいたしましたことを深くお詫び申し上げると共に,今後このような事態が発生することのないよう最大限の努力をいたします。

ダマヤブワラビー (Macropus eugenii) GSS 147,312 エントリの新規公開 2007.3.14
理研ゲノム科学総合研究センターから登録されたダマヤブワラビー (Macropus eugenii) の GSS 147,312 エントリが公開されました。アクセッション番号は以下の通りです。
これらは3月10日の新着データとして DDBJ より公開されており,anonymousFTP サイトから一括取得が可能です。
アクセッション番号:DE842016-DE989327 (147,312 entries)
anonymousFTP 一括取得:ファイル名 Macropus_eugenii_GSS_070310_1.seq.gz
「2月28日付 getentry アクセス不具合」により中断した検索機能サービス復旧 2007.3.13
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
getentry アクセス不具合のお詫び(2月28日付)」において中断していた下記検索機能サービスが、復旧いたしました。ご迷惑をおかけいたしましたことをお詫びいたします。

復旧した検索機能: Locus Name
Gene Name
Product Name
Clone Name
getentry アクセス不具合のお詫び 2007.3.13
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
以下の日時において Web サーバの負荷が高くなったため getentry へのアクセスが不安定になっていました。

アクセスが不安定になっていた日時:2007年3月12日 14:00 - 15:30 頃
ご迷惑をおかけいたしましたことをお詫びいたします。

getentry の停止について 2007.3.12
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
2月27日夜に発生した障害によるサービス中断の後,一部機能の利用をを制限していましたが,その改善と保守作業のため,サービスを一時停止いたします。詳細は以下のとおりです。
停止期間:2007年3月12日(本日) 18:00 - 19:00
ご迷惑をおかけしますが,ご理解とご協力をお願いいたします。
検索・解析サービスの旧システムでの受付について 2007.3.9
2007年2月末に実施された国立遺伝学研究所のスーパーコンピュータシステムの新システムへの更新(リプレース)に伴い,DDBJ では,WWW とE-mail で提供している検索・解析サービスについても,2月末に新システムへの切替を実施しました。切替後は,FASTA,BLAST,PSI-BLAST,SSEARCH,ClustalW については,旧システムでの受付は終了し,3月9日 17時をもって旧システムの運用を停止いたしました。 旧システムに送信された検索・解析内容は,新システムに移行することができないため,システム停止までに検索・解析が終了しなかったクエリは全てキャンセルされました。2月27日以前に送信され,現在までに結果が送信されなかったクエリについては,大変申し訳ございませんが、再度実行くださいますようお願いいたします。
事前のアナウンスが行き届かなかったことを併せてお詫びいたします。
公開サービスの緊急保守のお知らせ 2007.3.9
DDBJ が WWW とE-mail で公開している下記のサービスについて,緊急保守作業実施のため,本日サービスを停止いたします。

日 時: 2007年3月9日 16時より17時(予定)まで
停止する
サービス:
・ARSA
・ClustalW
・getentry
・相同性検索(FASTA, BLAST, PSI-BLAST, SSEARCH, HMMPFAM)

サービスの再開は,DDBJ HP にてお知らせいたします。
急なお知らせのため,ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
保守作業は終了しました。ご協力ありがとうございました(17:30)

DDBJ リリース 68 における INSD-XML 形式の TPA と CON の Anonymous FTP 公開についてのおわび 2007.3.9
電源設備トラブルによる DDBJ の各種サービスの緊急停止についてのおわび 2007.3.5
3月3日に国立遺伝学研究所スーパーコンピュータシステムの電源設備にトラブルが発生し,国立遺伝学研究所ならびに DDBJ の全てのネットワークサービスが緊急停止いたしました。詳細は以下のとおりです。

  • 発生時刻:3月3日 23:20
  • 状況:国立遺伝学研究所ならびに DDBJ の全てのネットワーク通信,公開サービスの停止
  • 復旧:3月5日 14時40分現在全てのサービスが復旧しました。ご迷惑をおかけしました。
getentry URL 変更のお知らせ  2007.3.02
getentry は DDBJ が WWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
2007年3月のスーパーコンピュータシステムの新システムへの更新(リプレース)に伴い,URL をhttp://getentry.ddbj.nig.ac.jp/top-j.htmlに変更いたしました。お手数ですが,リンク等の新 URL への更新をお願いいたします。
getentry アクセス不具合のお詫び 2007.2.28
getentry は DDBJ がWWW およびE-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
2月27日夜に障害によりサービスが中断する状況が発生いたしました。詳細は以下のとおりです。

停止期間: 2007年2月27日 21:03 - 22:15
障害内容: getentry データベースサーバへの接続ができなくなった。
現在の状況: 現在 getentry へのアクセスは可能ですが,下記の検索機能はご利用できません。
  • Locus Name
  • Gene Name
  • Product Name
  • Clone Name

復旧はDDBJ HP にてご連絡いたします。
ご迷惑をおかけいたしますが,ご理解とご協力をお願いいたします。
復旧しました。ご迷惑をおかけいたしました。(3月13日)

カニクイザル脳の完全長cDNAに関する論文 2007.2.19
カニクイザル脳の完全長 cDNA に関する論文が PLOS Biology に発表されました。
この論文は,旧世界ザルの一種であるカニクイザルの脳のトランスクリプトームの完全長 cDNA 配列決定を行い,ヒト,チンパンジー,カニクイザル,マウスの脳発現遺伝子の進化の速度比較を行ったものです。 論文は,日本,アメリカ,台湾の研究者の共同研究の成果に基づいたもので,生命情報・DDBJ 研究センター (CIB-DDBJ) センター長の五條堀孝が著者の一人となっています。脳は,哺乳動物の様々な器官の中で最も複雑な仕組みを有し,脳機能の遺伝学的解明は近年注目を浴びている分野です。 ヒトを含む霊長類の脳は急速な進化を遂げたにもかかわらず、その脳発現遺伝子の進化は緩やかに進行したとされ,さらに種によって進化の速度は異なります。 ヒト,霊長類,マウスの脳遺伝子を比較することで、その理由の解明の糸口となることが期待されます。
論文中に掲載されているカニクイザル脳 cDNA遺伝子配列は,アクセッション番号 AB170063-AB174733 として、DDBJ から DDBJ/EMBL/GenBank 国際塩基配列データベースに登録・公開されています。 データは anonymous FTP 一括取得,または getentry で取得することができます。
GIB にデータ追加 2007.2.19
GIB (Genome Information Broker) は WWW でゲノム情報を提供するサービスで,真正細菌・古細菌・真核生物のゲノムデータを提供しています。
2007年1月26日~2月19日に以下のゲノム配列が公開され,GIB でもデータが検索ができるようになりました。

  • Methylibium petroleiphilum PM1 (by Joint Genome Institute)
  • Lactococcus lactis subsp. cremoris MG1363 (by Bielefeld University)
  • Methanocorpusculum labreanum Z (by Joint Genome Institute)
  • Burkholderia mallei NCTC 10229 (by The Institute for Genomic Research)
  • Streptococcus pyogenes Manfredo (by Sanger Institute)
”生命情報学関連の会議のお知らせ”更新 2007.2.15
以下の会議を追加しました

DDBJ メールマガジン No.30 配信 2007.2.6
DDBJ では,隔月でメールマガジンを配信しています。本日第30号を配信しました。今回は,公開サービスの URL 変更について,DDBJ の新規データベース GIB-V と GTPS 公開,DDBJ の活動に関連する論文の掲載などです。ホームページでもご覧になれますが,お申し込みいただいた方にはメール配信をいたします。
配信を希望される方は,申込み・変更ページで簡単に手続きできますので,この機会に是非お申し込み下さい。
”生命情報学関連の会議のお知らせ”更新 2007.2.5
以下の会議を追加しました

  • 第3回ゲノムネットワークプロジェクト公開シンポジウム『医学・生物学へ展開するゲノムネットワーク』 (2/16)
SSThread サービス終了のお知らせ 2007.2.2
DDBJ が WWW で公開している SSThread サービス(3D-1D 法を用いたタンパク質の二次構造予測)を2月23日をもって終了いたします。長い間ご利用ありがとうございました。
重要:塩基配列データ登録受付・公開業務の停止について 2007.1.29
国立遺伝学研究所スーパーコンピュータシステムは2007年3月に新システムへの移行(リプレース)が予定されています。
それに伴い,下記期間中,DDBJ の塩基配列データの登録や更新,公開等の業務を停止させていただきます。
SAKURA 停止期間:

  • 2007年2月22日(木)17:00から 2007年2月28日(水)9:00まで

2007年2-3月にアクセション番号の発行や登録済みデータの公開が必要な場合は,お早めに処理を御願い致します。皆様のご協力を御願い致します。

ARSA 緊急保守のため停止 2007.1.29
DDBJ のデータベース検索サービスの ARSA は緊急保守のため,現在サービスを停止しています。再開次第お知らせいたします。 皆様のご理解とご協力をお願い致します。
ARSA は復旧しました。ご迷惑をおかけいたしました。(1月29日17時)
GIB にデータ追加  2007.1.25
GIB (Genome Information Broker) は WWW でゲノム情報を提供するサービスで,真正細菌・古細菌・真核生物のゲノムデータを提供しています。
2006年12月27日~2007年1月25日に以下のゲノム配列が公開され,GIB でもデータが検索ができるようになりました。

  • Prochlorococcus marinus AS9601 (by J Craig Venter Institute)
  • Prochlorococcus marinus MIT 9515 (by J Craig Venter Institute)
  • Prochlorococcus marinus NATL1A (by J Craig Venter Institute)
  • Prochlorococcus marinus MIT 9303 (by J Craig Venter Institute)
  • Hyperthermus butylicus DSM 5456 (by University of Copenhagen)
ミラーリング H-Invitational Database 保守のため停止 2007.1.22
DDBJ が WWW で公開している,ミラーリング H-InvDB (ヒト遺伝子アノテーション統合データベース)をシステムメンテナンスのために当分の間停止いたします。再開いたしましたら DDBJ の HP にてご連絡いたします。H-Invitational Database CIB-DDBJ Flat File Server (ヒトの全長cDNA配列データベース)は,引き続き公開しています。
ご迷惑をお掛け致しますが,皆様のご理解・ご協力をお願い申し上げます。
CAMUS サービス終了のお知らせ 2007.1.19
DDBJ が WWW で公開している CAMUS データベースサービス(圧縮 DB の BLAST 検索と多重整列 DB)を2月23日をもって終了いたします。長い間ご利用ありがとうございました。
DAD rel. 38 公開 2007.1.19
1月19日より DAD (DDBJ amino acid database) Rel. 38 を公開しています。 DAD rel. 38 はエントリ数が 3,721,922,総アミノ残基数が 1,138,376,646 aa となっています。
FTP による定期リリースおよび新着データのダウンロードサイト
”生命情報学関連の会議のお知らせ”更新 2007.1.16
以下の会議を追加しました

ClustalW DOTSINOUTPUT オプションご利用のお知らせ  2007.1.16
DDBJ が WWWE-mail で提供している ClustalW のアライメント結果をドットで出力する(以下出力例)DOTSINOUTPUT オプションが利用可能になりました。DOTSINOUTPUT オプションは,ALIGN の解析のみ利用可能で,DOTSINOUTPUT オプションを ON にした場合は TREE や BOOTSTRAP 解析は実行できません。
CLUSTAL W (1.83) multiple sequence alignment

 query      MDMEIEDSSPIDDLKLQKLDTNVYFGPCEILTQPILLQYENIKFIIGVNLSTEK
 P39728-1   ......................................................
 Q759A6-1   -------M.Q.QP.Q.SA..F...LNT.S.AEFIESK..R.F.SIGIPIQ.VVE
 Q6FV15-1   -------------.Q..S.IF..SLAT..E.HT..QR..R.F...GI.NHVF.N
 Q12182-1   -------------.R..NHIF..SVHS..HTDF.VEN..R.F.N.D....L.SH
 Q6CIX1-1   -------LNQM.P.Q.SN..F...LNT.S.YDF.SKND...F.S.GIPV.R---
                             *:*. :::**.   *:.   :  .:*:*:*.:.:. .       
統計「登録塩基数上位30種の順位推移」更新 2007.1.15
DDBJ リリース68 公開にともない,統計の詳細で公開している登録塩基数を生物種別にランキングした登録塩基数上位30種の順位推移(~DDBJ rel.68)を更新しました。 Ascaris suum(large roundworm of pigs)が27位にランクインしました。生物種をクリックして推移のグラフをご覧下さい。
国立遺伝学研究所ネットワークサービスの一時停止ならびに SAKURA 登録受付停止 2007.1.12
2007年3月に予定されている新スーパーコンピュータシステムの移行(リプレース)に関連した一部作業のため,下記期日にてネットワークサービスを停止する予定となっております。
この間は,DDBJ のネットワークサービスも停止します。また,国立遺伝学研究所の大型計算機 supernig, minerva2 のサービスも停止します。
これに伴い,下記期間中の SAKURA によるデータ受付を停止いたします。
停止期間:

  • 2007年1月26日(金)17:00から 1月28日(日)13:00まで
  • 2007年2月 3日(土) 9:00から 2月 4日(日)18:00まで

SAKURA 停止期間:

  • 2007年1月26日(金)15:00から 2007年1月29日(月)9:00まで
  • 2007年2月 2日(金)15:00から 2007年2月 5日(月)9:00まで

ご迷惑をお掛け致しますが,皆様のご理解・ご協力をお願い申し上げます。

Nucleic Acids Research に DDBJ に関する論文掲載 2007.1.11
Nucleic Acids Research では,毎年1月1日にデータベース特集号が発行されています。本年1月1日発行の Vol. 35, Database Issueに,DDBJ の活動ならびに DDBJ の運営するデータベースを紹介する下記の論文が掲載されました。
"DDBJ working on evaluation and classification of bacterial genes in INSDC"
Hideaki Sugawara, Takashi Abe, Takashi Gojobori and Yoshio Tateno
Nucleic Acids Research, 2007, Vol. 35, Database issue D13-D15
(内容)2005年7月から2006年6月の間に DDBJ が登録を受け付け、公開したミツバチの ESTs,病原性大腸菌 K-12 W3110,メダカ WGS,ヒト MGA のゲノムデータ等について。さらに、INSDC に登録されたバクテリア遺伝子の分析評価についても詳細に記載されています。
(PMID: 17108353)
停電による遺伝研ネットワーク障害 2007.1.9
1月9日に発生した停電により,国立遺伝学研究所のネットワークサービスに影響がありました。詳細は下記のとおりです。
    停電の発生時刻:1月9日09:40-10:30
    影響のあったサービス:国立遺伝学研究所のネットワーク通信停止
ネットワークは復旧し,現在は正常にサービスを提供していますが,ARSAにつきましては停止中です。ご迷惑をおかけいたしましたことをお詫びいたします。
ARSAは復旧しました。ご迷惑をおかけしました(1月10日 9時)
DDBJ リリース 68 完成 2006.12.28
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。12月28日に DDBJ リリース68 を完成しました。リリース68 のエントリ数は 64,267,978,総塩基数は 68,259,314,742 です。今回のリリースより全てのファイルサイズの最大が 1.5 GB に変更になりました。
FTP による定期リリースおよび新着データのダウンロードサイト
”生命情報学関連の会議のお知らせ”更新 2006.12.28
以下の会議を追加しました

ページの先頭へ戻る