このうち慶応大学の研究チームからのデータはDDBJに登録され,DDBJ/EMBL/GenBank国際塩基配列データベースに公開されました。
慶応大学から登録されたデータ(90エントリ,5,453,751 bps)
D86989, D86991, D86993-D86996, D86998-D87000, D87002-D87004, D87006-D87007, D87009-D87024, D88268-D88271, AP000343-AP000362, AP000365, AP000522-AP000547, AP000550-AP000558
PIDが削除されたので,DAD (DDBJ Amino Acid Database) のフォーマットも一部変更し,これまでPIDを記述していた欄に以下のようにprotein_idを記述することになりました。
| 変更前 |
LOCUS AB000714 220 aa PRT HUM 27-OCT-1997 DEFINITION Homo sapiens RVP1 protein. ACCESSION AB000714-1 PID d1023862 (以下略) |
| 変更後 |
LOCUS AB000714 220 aa PRT HUM 27-OCT-1997 DEFINITION Homo sapiens RVP1 protein. ACCESSION AB000714-1 PID BAA22986.1 (以下略) |
*Protein IDは「CDSに振る ID+バージョン番号」で構成され,DNAデータベースフ~ラットファイルのCDS featureに "/protein_id" qualifierとして記述されています。 このバージョン番号は配列の変更があった場合にのみ更新されます。
期日:1999年12月17日(金)12:00から18日(土)14:00まで
期日:1999年11月19日(金)12:00~21:00
この期間は,塩基配列データ登録の受付やaccession numberの発行,検索・解析サービスをはじめとするすべての業務を停止します。
皆様には大変ご迷惑をおかけしますが,ご理解とご協力の程お願い申し上げます。
- 1999年12月24日(金)12:00より 塩基配列データの登録,修正,および公開受付の停止
- 1999年12月27日(月) 9:00より 全サービス停止
- 2000年 1月 5日(水) 9:00より 平常業務の開始
では,よい年をお迎えください。 新年もどうぞよろしくお願い申し上げます。
DDBJ
*国立遺伝学研究所では,「2000年問題」に関して既に対策を講じましたが,予期せぬ混乱が生じる可能性も否定できません。 従いまして,1999年12月27日から2000年1月4日まで,当所のコンピュータシステムを停止することになりました。
1999年12月29日(水)13:00より電子メール配送を停止しますので,ご注意下さい。
リリース37(1999年3月)よりDDBJ/EMBL/GenBank国際塩基配列データベース共通の配列のバージョン番号(VERSION行,/protein_id)を採用しています。 この採用にともない,NIDとPIDは今回のリリースから削除されました。 また,今回のリリースからAX,AYで始まるアクセッション番号が追加されました。 AXはEMBLが特許データに発行し,AYはGenBankが通常登録に発行します。
期間:1999年11月12日(金)17:00から11月13日(土)21:00まで
*supernigにおいては12日12時より停止作業を開始します
停止サービス:SAKURA, TxSearch, 大量登録テンプレート作成システム
停止期間:1999年10月20日 (水) 9:00 - 13:00
期日:1999年10月15日(金)12:00~21:00
日時:10月1日(金) 12:00~14:00
対象:所外からのインターネットサービス
- Submitted フィールド追加: JOURNAL 行の Submitted の部分に記述されている日付での検索を出来るようにしました。範囲指定も可能です。
- FtProteinId フィールド追加: Feature 行の proteinid を指定しての検索を出来るようにしました。
- PID, NID フィールド削除: 配列のバージョン番号(VERSION行,/protein_id)採用にともなうPID, NID削除に対応
生物情報ページで使用可能な文字の種類の増加: 生物情報ページで使用できる文字を,[A-Z a-z 0-9 SPACE .] から ["]、不正文字を除く,半角文字を入力できるように修正
●あいさつ
五條堀 孝(生命情報研究センター・センター長)
●集団遺伝学とは ~遺伝子頻度,遺伝的浮動,HW平衡,様々な遺伝的変異など~
舘野 義男(生命情報研究センター遺伝子機能研究室・教授;DDBJバンク長)
●集団遺伝学理論から見たSNP ~DNA多型,塩基置換速度,中立進化と淘汰など~
斎藤 成也(集団遺伝研究系進化遺伝研究部門・助教授;DDBJ担当)
●遺伝子連鎖解析の基礎 ~組換価,連鎖不平衡,LODスコア,家系分析など~
安田 徳一(財団法人遺伝学普及会情報資源研究センター・部長;DDBJ担当)
●DNAチップテクノロジー入門
池尾 一穂(生命情報研究センター遺伝情報分析研究室・助手;DDBJ担当)
●まとめ
菅原 秀明(生命情報研究センター分子分類研究室・教授;DDBJ担当)
●質疑応答
●個別面談
このたび,慶応大学医学部分子生物学教室の研究チーム(清水信義代表)と理化学研究所ゲノム科学総合研究センターの研究チーム(榊佳之代表)からヒトゲノムデータの登録がありました。
慶応大学から登録された塩基配列データは,ヒト8番染色体の塩基配列データ7エントリーで,アクセッション番号はAP000424-AP000430です。 理化学研究所から登録された塩基配列データは,ヒト11番染色体・21番染色体60エントリーで,アクセッション番号はAP000431-AP000490です。
これらのデータは合計67エントリー,7,321,122 bpでHTG divisionとしてDDBJ/EMBL/GenBank 国際塩基配列データベースに公開されました。
- 日本DNAデータバンクと「DDBJ/EMBL/GenBank国際塩基配列データベース」
- DDBJへの塩基配列登録の方法(SAKURA・大量登録ツールMSTなどの利用)
- データベース検索の基礎(キーワード検索,FASTA/BLAST相同性検索など)
- 分子進化解析入門(多重整列,遺伝子系統樹作成,同義・非同義置換数推定など)
- タンパク質立体構造解析入門(PDBブラウザー,二次構造・立体構造予測など
期日: 1999年 9月17日(金)12:00 ~ 21:00
(1) gene name からエントリ検索を可能にしました。
(2) protein IDからエントリ検索を可能にしました。
(3) 複数プライマリが存在するセカンダリを指定した場合そのプライマリエントリを一括出力できるようにしました。
gene nameは現在 361,966個(重複を含む)存在し,1つのgene nameに複数のエントリが存在する場合が多くあります。 これまでget-entryは1アクセッション1エントリが対象のため指定したキーに複数エントリが存在する場合は代表エントリのみを出力していました。 今回の機能拡張により複数エントリが存在した場合でもすべてのエントリを出力できるように改造してあります。 出力エントリが10エントリ以下の場合はそのままエントリの内容を表示し,10エントリを越える場合はアクセッション番号を一覧表示するようにしています。 また一覧表示された全エントリをファイルに一括出力しftpで取得できるようにもなっています。
gene nameで検索する場合は「番号指定」をGene Nameに切り替えて下さい。 Protein IDで検索する場合は「番号指定」をProteinIDに切り替えて下さい。
期日: 1999年 8月 27日(金)12:00 ~ 21:00
期日:1999年8月11日(水)10:00から8月13日(金)18:00まで
リリース37(1999年3月)よりDDBJ/EMBL/GenBank国際塩基配列データベース共通の配列のバージョン番号(VERSION行,/protein_id)を採用しています。 この採用にともない,NIDとPIDはリリース39(1999年10月)よりフラットファイルから削除される予定です。
DDBJの統計もご覧下さい。
- 五條堀孝(1999)ゲノム情報からみた新しい生物学.遺伝,Vol. 53 No. 7, 14-15頁
- 宮崎智,舘野義男(1999)国際DNAデータバンクとDDBJにおけるゲノム情報活動.遺伝,Vol. 53 No. 7, 21-27頁
- 菅原秀明(1999)情報生物学の提案.遺伝,Vol. 53 No. 7, 39-43頁
DDBJing--日本DNAデータバンクをフルに活用しよう!--
日時:1999年9月13日(月) 午後1時~午後5時
場所:静岡県三島市 文部省国立遺伝学研究所 生命情報研究センター 2階AV室
主催:国立遺伝学研究所・生命情報研究センター 日本DNAデータバンク
対象:DDBJを利用される方をどなたでも歓迎します(定員30名;参加費無料)
注)8月9日に申込みの定員30名に達しましたので,今回はこれで締切らせていただきす。 またの機会をご利用下さい。
寺子屋「情報生物学」第1回--集団遺伝学理論を用いたSNPの情報解析入門講座--
日時:1999年9月16日(木) 午後1時~午後5時
場所:静岡県三島市 文部省国立遺伝学研究所 研究員宿泊施設2階セミナー室
主催:文部省国立遺伝学研究所 生命情報研究センター・日本DNAデータバンク
対象:大学院生(修士・博士課程),ポストドクなどの若手研究者を主な対象と
しますが,それ以外の方もおおいに歓迎します(定員50名;参加費無料)。
注)申込み多数のため,会場を国立遺伝学研究所の講堂に変更させていただきました。 締切りまでまだ少し余裕があります。
期日:1999年 7月23日(金) 12:00 ~ 21:00
FASTA/BLAST/SSEARCH利用時に,検索対象データベースとして[DDBJリリース (DNA)] を指定した場合,検索対象Divisionをリストボックスから選択することができます。 これまで選択可能なEST divisionは6種類でしたが,このたび31種類の中から選択できるようになりました。 このEST divisionの31種類は,登録数上位30種と「その他」で構成されています。 検索対象Divisionは複数選択することも可能です。
今回新たに追加したEST divisionは,以下の通りです。
Drosophila melanogaster, Rattus norvegicus, Saccharomyces cerevisiae, Rattus sp. , Schizosaccharomyces pombe, Plasmodium falciparum, Danio rerio, Dictyostelium discoideum, Brugia malayi, Magnaporthe grisea, Emericella nidulans, Neurospora crassa, Bombyx mori, Zea mays, Toxoplasma gondii, Xenopus laevis, Oryctolagus cuniculus, Trypanosoma cruzi, Sus scrofa, Onchocerca volvulus, Glycine max, Schistosoma mansoni, Lycopersicon esculentum, Leishmania major, Cryptosporidium parvum
期日:1999年 6月 18日(金)12:00 ~ 21:00
- フィーチャー情報の入力が必須に: CDS情報,その他のフィーチャー情報,登録付加情報の全てに何の情報も入れられていな い場合は,エラーとなります。
- 日本語版トップページの変更: フィーチャー情報入力が必須になったことにともない,トップページに説明を追加しました。 レイアウト,壁紙も変更になっています。
- 雑誌情報での著者名の入力欄数増: 最近の登録では著者が10人を越えるエントリも増えてきているということから,入力できる著者の最大数を10人から20人に増やしました。
検索方法はE-mail版get-entry 同様に get-version@nig.ac.jp 宛にアクセッション番号とバージョン番号をメールに書いて要求すると, そのエントリが返信されます。 また,get-version@nig.ac.jp 宛に help と書いて送るとヘルプメールが送信されます。 どうぞご利用下さい。
1996年4月のVPP500公開より,現状のNQS設定方法にてVPP500を運用してきました。
この度,その間に寄せられたご利用者からのご意見を基に,
よりVPP500を利用しやすくするため,NQSの設定変更を行ないます。
(2) 変更内容
・時間帯によるキュー区別の廃止:
現状のA時間帯(6:00~20:00),B時間帯(20:00~6:00)を廃止し,
全てのキューを昼夜を問わず利用可能とします。
・CPU使用制限時間の変更:
現状の2時間を以下の通り変更します。
また,特に長時間実行するジョブ用として,sキューを新設します。
| キュー名 | 使用可能 CPU数 |
制限時間 | 同時ジョブ 実行可能数(1) |
重み(2) | 1ユーザあたりの同時 ジョブ実行可能数(*) |
| a01 a04 a08 a16 |
1 4 8 16 |
24時間 18時間 12時間 8時間 |
20 6 3 2 |
5 8 12 24 |
6 3 2 1 |
| s01 s04 |
1 4 |
14日 7日 |
4 2 |
12 24 |
2 1 |
| 投入可能ジョブ本数 | 同時実行可能ジョブ本数(3) | 重み制限(4) | |
| 全ユーザ | 10 | 6 | 30 |
(*)1ユーザあたりの同時ジョブ実行可能数 =
(4)/(2)sum{(2)の値×そのキューで実行中のジョブ本数} > (4)の値となるまでジョブを
投入可能。
(3) 運用開始日:1999年5月28日(金)21:00~
なお,今回はマシンの総点検を実施する関係上,停止時間が長くなっておりますので ご注意下さい。 皆様のご理解とご協力をお願い致します。
期日:1999年5月26日(水)9:00から28日(金)21:00まで
日時:5月21日(金)午前8:30から24日(月)午前10:00まで
停止内容:SAKURA登録システム,Accession番号発行をはじめとする登録や更新に関 する全業務
アクセッション番号はAP000136-AP000219で,HTG DivisionとしてDDBJ/EMBL/GenBank 国際塩基配列データベースに公開されました。
先に科学技術振興事業団(JST)から登録されたヒト21番染色体長腕の領域 (21q22.1;アクセッション番号はAP000084-AP000135)と合わせて合計約13 Mbaseが公開 されています。
期日:1999年 4月23日(金) 12:00 ~ 21:00
また,今回のリリースよりDDBJ/EMBL/GenBank国際塩基配列データベース共通の,配列の バージョン番号システム(Nucleotide ID と Protein ID)を採用しています。 このため従来は4月に公開しているリリースの時期を早め,3月にリリース公開の運びと なりましたことをご了承下さい。 次回のリリースは通常どおり7月となります。
1. DAD, SWISS-PROT の 新着データ取り込み
アミノ酸配列データベースであるDAD, SWISS-PROTの相同性検索用データベースはリ~ リース以降の新着データを取り込んだデータを公開するようにしました (DADは毎日, SWISS-PROTは毎週(金曜日)更新されます)。
2. 検索結果メールへのHTML埋め込み機能追加
E-mailサービスでの相同性検索依頼及びWWWサービスで検索結果をE-mail で受け取る指定をした場合の検索結果メールにHTMLを埋め込む機能を追加しました。
HTMLを埋め込んだメールは,Webブラウザなどで開くとWWW上で結果を受け取ったとき と同じように結果一覧からアクセション番号をクリックしてそのエントリのデータを取得 する,などの操作を行なうことができます。
本機能は以下の方法でお使いいただけます。
・WWWから入力して検索する場合
検索結果を選択する画面においてE-mail の方を指定したときに, 同時にその下にある"In HTML format" をチェックすると HTML 形式の結果が添付ファイルで送られてきます。
・(fasta/blast/ssearch)@nig.ac.jp にメールを送って検索する場合
下記の例のように "html 1" を指定することによってHTML 形式の結果が添付ファイルで送られてきます (1以外を指定した場合には通常の結果が送られます)。
例) blast の場合 program blastn datalib ddbj scores 100 alignments 100 expect 10 gap 1 filter 1 html 1 begin > query aaacccgggtttaaaaaaaacggttttt ........... //
Result ViewerはFASTA/BLAST/PSI-BLAST/CLUSTALWで検索結果の受取方法にWWW を選択した場合にご利用いただけます (E-mailサービスを選んだ場合は見ることができません)。
使用方法
- 相同性検索のトップページもしくは左のメニュー画面でUtility項目のResult Viewer を選択する。
- Result Viewerが表示されるので,FASTA/BLAST/PSI-BLAST/CLUSTALWの中から結果を~ 見たいものを選ぶ。
- 自分が検索を行なった時の検索条件を選択する。
*間違った選択をすると結果のデータに正しくリンクが貼られません。
(1) FASTAの場合--プログラム,データベースを選択する。
(2) BLASTの場合--プログラム,データベース,Gap計算の有無を選択する。
(3) PSI-BLASTの場合--プログラム,データベース,Gap計算の有無を選択する。
(4) CLUSTALWの場合--特に選択する条件はありません。 - あらかじめ控えておいた受け付け番号を入力する。
- すべて正しいことを確認し,入力内容の送信ボタンを押すと結果が表示されます。
期日:1999年3月19日(金)12:00 ~ 21:00
期日:1999年2月26日(金)12:00 ~ 21:00
DDBJでは,WWW server を利用したデータ登録システム SAKURA での登録を推奨しています。 また,インターネットを用いない standalone で登録ファイルを作成したい場合には, sequin 2.60 をanonymous-ftp で配布しています。データ登録にはこちらのツールをご利用下さい。
FASTA/BLAST/PSI-BLAST/SSEARCHの各相同性検索依頼WWWページで, 検索対象データべースとして [C.elegans 全蛋白] または [C.elegans 全DNA] をプルダウンメニューから選択してください。 電子メールサーバをご利用の場合には,datalibとして WORMPEP または WORMDNA を指定して下さい。
全蛋白のデータを対象とした検索を行なった場合, 検索結果中の線虫ゲノムデータの配列名をクリックしていただきますと, Sanger Centre の wormace にリンクされます。
DNAデータのコメント部の情報は,以下の通りです。
染色体番号/ start-end, source, feature, [group]
以下は,GFF フォーマットからの抜粋です。 [http://www.sanger.ac.uk/Users/rd/gff.shtml]
- start, end
- Integers. "start" must be less than or equal to "end". Sequence numbering starts at 1, so these numbers should be between 1 and the length of the relevant sequence, inclusive.
- source
- feature
- The feature type name. We hope to suggest a standard set of features, to facilitate import/export, comparison etc.. Of course, people are free to define new ones as needed.
For example, Genie splice detectors account for a region of DNA, and multiple detectors may be available for the same site, as shown above. - [group]
- An optional string-valued field that can be used as a name to group together a set of records. Typical uses might be to group the introns and exons in one gene prediction (or experimentally verified gene structure), or to group multiple regions of match to another sequence, such as an EST or a protein.
The source of this feature. This field will normally be used to indicate the program making the prediction, or if it comes from public database annotation, or is experimentally verified, etc.
DDBJをご利用いただき,ありがとうございます。
従来より,国立遺伝学研究所のスーパーコンピュータシステム (supernig, VPP500) のオンライン利用者には,DNAデータベースとして DDBJ ($DDBJ), EMBL ($EMBL), GenBank ($GB) の3つのリリースデータおよび日々更新データ ($DDBJNEW, $EMBLNEW, $GBNEW) を公開してまいりました。 しかし,生命科学・技術の目覚ましい発展により, 国際塩基配列データベースに登録される配列データは飛躍的に増え続けています。 その一方で,スーパーコンピュータシステムのディスク容量には限りがあり, このままではデータ量の増加に対応できなくなってまいりました。
そこで,supernig および VPP500 で提供している GenBank リリースデータベースは,リリース111 を公開後 1999年3月31日 をもってその公開を終了することになりました。 また,EMBL リリースデータベースおよび GBNEW と EMBLNEWも, 約半年後に公開を終了する予定です。 公開終了の正確な日時が決まりましたら,再度ご連絡いたします。 つきましては,GenBank や EMBL を指定して解析・検索プログラムをご利用されている方は, 指定データベースを DDBJ へ切り替えていただくようにお願いいたします。
DDBJ, EMBL, GenBank の3つのデータベースは,DDBJ,欧州の EBI, 米国の GenBank が共同構築し国際塩基配列データベースとして運営しているもので, フォーマットの違いはありますが内容は同じものです。 また,$DDBJNEW, $EMBLNEW, $GBNEW についても, 3つのデータベースで新たに公開されたデータをすべて統合して日々更新し, それぞれのフォーマットで公開しているものです。 そのため EBI,GenBank いずれにおいてもデータベースの公開は, 各データベース独自のフォーマットのみで行なっております。 こうした状況をご理解の上, 今回の措置に対する皆様のご理解とご協力をいただきたくお願い申し上げます。
日本DNAデータバンク
期日:1999年 1月22日(金) 12:00 ~ 21:00
検索対象データベース:
・配列データベース DDBJ, DDBJNEW, DAD, SWISSPROT, PIR
・配列関連データベース PROSITE, PROSITEDOC, ENZYME
・タンパク質立体構造データベース PDB
URLはhttp://ftp2.ddbj.nig.ac.jp:8000/srs/で, DDBJのホームページ「データベース検索および解析」からリンクが張られています。
