DNA Data Bank of Japan
DDBJ メールマガジン  
No. 18  2005年1月31日発行
apply 申込・変更
top 最新号 top
backnumber 過去の号
ddbj 発行:DDBJ
Search for
サイトマップ
ご利用の前に
DDBJ とは?
塩基配列の登録
  SAKURA
  大量登録
  登録データ更新
検索・解析
  ARSA   getentry
  TXSearch  
  FASTA   BLAST
  SSEARCH
  HMMPFAM
  ClustalW
 
  Web API
 
  GIB
  GIB-V
  GTPS
  GTOP
リリース詳細
リリース取得
  DDBJ リリースノート
  公開中リリース
Q and A
生命情報学へのとびら
  講習会   関連会議
  ゲノム機能発現研究会

 DDBJ の連絡先  mail
Copyright © 1995-2006
DDBJ All rights reserved.
 ■春遠からじ 
今日の富士山 隔月公開の DDBJ メールマガジン第18号 web 版です。
今回 DDBJing 講習会と日韓バイオインフォマティクス・トレーニングコースの参加者を募集しています。 案内をご覧の上,興味をお持ちの方はどうぞご応募下さい。
メールマガジンに関するご質問やご意見がありましたら ddbjmag@ddbj.nig.ac.jp までどうぞ。 写真は遺伝研から見た富士山です。
 ■DDBJing 講習会 in 大阪 参加受付中 
前回の写真 DDBJ では全国各地で「DDBJing 講習会」を開催しています。 DDBJing 講習会は,塩基配列の登録方法や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により深く理解して利用していただく助けになることを目指しています。
3月2日に大阪大学中之島センターでの開催が決定しましたのでご案内します。 今回は従来の DNA データ登録などの講習に加え,大阪大学蛋白質研究所からも講師をむかえ,PDBj(日本蛋白質構造データバンク)や蛋白質の立体構造についても講議を行ないます。 PC を用いた実習の時間を多く設け,より実践的な知識を身に付けていただける講議内容を予定しています。
詳細は DDBJing & PDBjing 講習会サイトをご覧下さい。 大阪近郊の皆様のご参加をお待ちしています!
写真は前回の様子です。昨年 7/7-8 静岡県三島市・国立遺伝学研究所内で開催しました。
  • 日時:3月2日(水)10時から17時まで
  • 場所:大阪大学中之島センター・キャンパスイノベーションセンター
  • 対象:DDBJ,PDBj を利用される方をどなたでも歓迎します(定員30名・参加費無料)
 ■日韓バイオインフォマティクス・トレーニングコース 参加受付中 
前回の写真 3月7日から10日まで,韓国太田市にある韓国生命工学研究院で,第4回日韓バイオインフォマティクス・トレーニングコースを開催します。 このコースは,日韓中の若手研究者を対象とした定員30名のトレーニングコースで,日韓中の研究者からゲノミックス・プロテオミックス・分子進化・バイオデータベース・遺伝子発現などに関する講議を受けることができます。
詳細は講習会サイトをご覧のうえ,興味をお持ちの方はどうぞご応募下さい。お待ちしています!
写真は前回の様子です。昨年 3/16-19 静岡県三島市・国立遺伝学研究所内で開催しました。
  • 日時:3月7日から10日
  • 場所:韓国、大田市、韓国生命工学研究院
  • 対象:バイオインフォマティックスの研究を行っているか行おうとしている大学院生かポストドクで,日本国籍を有し,英会話ができる人(定員10名)
  • 特典:選考の上受講生に選ばれた人には旅費と滞在費支給(受講料無料)
  • 応募締切:2月15日
 ■データカテゴリ (MGA) 新設と超大量データ公開 
国際塩基配列データベース (INSD) では,超大量の転写物配列に対応するために登録・公開についての検討を進めています。 その一環として,ゲノム配列のアノテーションに有意義な情報を提供する超大量の配列群を受け入れるためのカテゴリ MGA (Mass sequence for Genome Annotation) を創設しました。 MGA は既に存在している超大量のゲノム断片配列を格納している WGS (Whole Genome Shotgun) と同様に Division ではなく,カテゴリに分類されます。 INSD の定める MGA の定義は以下の通りです。
Definition of MGA
MGA is defined as those sequences which are produced in large quantity in view of genome annotation.

1月24日にこの MGA カテゴリに属するデータを公開しました。 配列データは独立行政法人理化学研究所の林崎良英博士をリーダーとする研究グループから登録されたエントリーです。 このデータは CAGE (Cap Analysis Genome Expression) 法によって作出された Mus musculus 由来の転写物 (cDNA) 領域 5'末端,約20bp の長さの配列でエントリー数は 383,264 となっています。
MGA データは ftp サイトより取得できます。

公開された配列は生命情報・DDBJ 研究センターが運営する国際共同遺伝子発現データベース CIBEX (Center for Information Biology gene EXpression database) にて公開されているデータとも連携しています。

 ■DDBJ 新キーワード検索システム ARSA テスト公開 
DDBJ 新キーワード検索システム ARSA (All-round Retrieval of Sequence and Annotation) のプロトタイプ版を昨年12月27日よりテスト公開しています。 富士通製の高速 XML 型データベース検索エンジン「インターステージシュンサク(Interstage Shunsaku)」を基盤技術として採用しています。
第1の特徴は,複雑な検索条件や大量のヒットがある条件で検索しても,これまで提供してきたキーワード検索システムに比べて遥かに短時間で検索結果を返すことができる点です。 どのような条件でも約5〜10秒で検索結果を出力します。
第2の特徴は,国際塩基配列データベースのフラットファイル (FF) 形式で定義されている Feature/Qualifier を個々に選択して詳細な検索条件を指定することができる点です。
  • 検索対象は,DDBJ 定期リリースと DDBJ 新着データです。
  • DDBJ フラットファイル形式に沿った詳細な検索条件を指定することができます。
  • 検索条件やヒット件数に依らず,ほぼ一定(約5秒〜10秒)の検索レスポンスが得られます。
  • 検索結果は,フラットファイル,DDBJ-XML,FASTA の3つの形式で取得することができます。
  • 検索結果をファイルとしてダウンロードすることができます。
どうぞお試し下さい。
※テスト運用中はメンテナンスの為,毎日夜間に2〜3時間程度サービスを停止いたします。

 ■DDBJ リリース公開 
DDBJ が管理・収集している塩基配列データベースは,リリースとして年4回定期的に公開しています。 12月24日に DDBJ リリース60を公開しました。 DDBJ リリースを含め,DDBJ で現在公開中のデータベースは以下の通りです。 1年前のリリース56 と比較すると塩基数で123%,エントリ数で133% の増加率です。
DDBJ リリースも含めた DDBJ で公開中のデータベースや日米欧のデータ量の割合,登録塩基数の多い生物など各種統計資料については DDBJ の統計 をご覧下さい。 FTP による定期リリースおよび新着データのダウンロードサイトは こちら です。
DNA
database
Rel.Date DDBJ
Date
EntriesBases
DDBJ6012/0412/04 40,583,94544,416,752,273
Protein
database
Rel.Date DDBJ
Date
SequencesResidues
DAD3001/0501/05 2,169,069669,311,612
PIR8012/0401/05 283,41696,216,763
SWISS-PROT4510/0411/04 163,23559,631,787
PRF10011/0412/04 291,515102,321,978
PDB PDB サイトでは週1回データの更新を行なっています。DDBJ では
データを毎日チェックし更新しています (12月現在 28,648 エントリ)
・Date----------------リリースノートに記載されている正式公開日付
・DDBJ date-----------DDBJで公開した日付


 ■GIB にデータ追加 
GIB (Genome Information Broker) は WWW でゲノム情報を提供するサービスで,真正細菌・古細菌・真核生物のゲノムデータを提供しています。 2004年10月から2005年1月にかけて公開された以下28生物種のゲノムデータを GIB に取込みました。 1月31日現在で,GIB には真核生物 6・バクテリア 197・古細菌 21,計224種類のゲノムデータが格納されています。
- Anaplasma marginale str. St. Maries
- Azoarcus sp. EbN1
- Bacillus clausii KSM-K16
- Bacillus licheniformis DSM 13
- Bacteroides fragilis YCH46
- Burkholderia pseudomallei K96243
- Campylobacter jejuni RM1221
- Dehalococcoides ethenogenes 195
- Ehrlichia ruminantium Welgevonden
- Francisella tularensis subsp. tularensis
- Geobacillus kaustophilus HTA426
- Gluconobacter oxydans 621H
- Haloarcula marismortui ATCC 43049
- Idiomarina loihiensis L2TR
- Legionella pneumophila Lens
- Legionella pneumophila Paris
- Methylococcus capsulatus str. Bath
- Mycoplasma hyopneumoniae 232
- Salmonella enterica subsp. enterica serovar Paratypi A ATCC 9150
- Silicibacter pomeroyi DSS-3
- Staphylococcus aureus subsp. aureus COL
- Staphylococcus epidermidis RP62A
- Streptococcus thermophilus CNRZ1066
- Streptococcus thermophilus LMG 18311
- Synechococcus elongatus PCC 6301
- Thermococcus kodakaraensis KOD1
- Thermus thermophilus HB8
- Zymomonas mobilis subsp. mobilis ZM4
 ■ゲノム機能研究会による講演の案内 
2月8日にゲノム機能研究会が「ゲノムコピー数変化に基づく食道扁平上皮癌の分子病態解析」という講演会を開催します。 参加費は無料ですが,申し込みが必要です。 興味をお持ちの方は,サイト をご覧の上,メールでお申し込み下さい。
  • 日時:2月8日(火)17時から19時まで
  • 場所:アカデミーヒルズ/ARKフォーラム(東京赤坂)
  • 演題:ゲノムコピー数変化に基づく食道扁平上皮癌の分子病態解析
  • 講師:井本逸勢助教授(東京医科歯科大学・難治疾患研究所・分子細胞遺伝)
 ■DDBJ スタッフコラム7 
真空管1本とPC1個と細胞1個

斎藤 成也
国立遺伝学研究所 集団遺伝研究部門 教授

1946年に米国ペンシルベニア大学で開発された ENIAC は,電子計算機の草分けだった。 当時まだ半導体は発明されておらず,17468本の真空管を使っていた(詳細は,ウィキペディアを参照されたい)。 このため,真空管が故障するたびに,計算が途中で終わってしまったという。 というこの文章を書き終わってしばらくしたら,文章作成に使っていたPCの電源が突然切れてしまい,また立ち上げるという羽目になってしまった。

それはともかく,現在では,真空管1本は,超巨大PCクラスターのPC1個に相当するだろう。 真空管を知らない世代の方もいると思うので,簡単に説明しておくと,ガラスで作った管の内部の空気を大部分とりさって,真空に近い状態にしてあるのが,「真空管」という名前の由来である。 そこには,単純なオン・オフ回路があり,簡単に言えば真空管1本は,半導体1個に対応する。 現在使われている典型的なパソコン(PC)のCPU(Central Processing Unit)1個に,どれだけの数の半導体が使われているのか,よく知らないが,おそらく軽く100万個を越えるのではなかろうか。

真空管と違って,パソコンは1台だけで立派なコンピュータである。 現在の地球上には,おそらく億単位の台数のパソコンが存在するだろう。 このように身近なものになったので,計算速度を増加させるために,これらのパソコンをたくさんつなげて分散処理しようという発想が生じるのは,当然だろう。 これがPCクラスターである。

計算機ではないが,私は中学生のころスタートレック(当時の日本のテレビでは「宇宙大作戦」という名前だった)のファンだったので,あのシリーズからヒントを得て,手の平に乗るような小さな発電機というか,エネルギー発生装置が無数にちりばめられているような宇宙船を夢見たことがある。

このような傾向の人間にとって,PCクラスターの巨大化は,コンピュータ技術の当然の方向である。 実際,私の研究室では,dualCPU のPC16台と15台からなる2セットのPCクラスターを導入して,比較ゲノム解析などに用いている。 ちなみに,これらPCクラスターのニックネームは,thinker16 とmeditator15で ある。

国立遺伝学研究所の電子計算機棟には,64台のPCクラスターが2セットあるほか,もっと高級なサーバークラスのコンピュータを128台連ねたものも使われている。 こちらも,いろいろなニックネームがあるが,それらの紹介は,これらを管理しているグループの人にまかせることにして,PCクラスターについてもう少し話を進めよう。

2個のCPUを1台のパソコンに搭載した dual PC は,現在一般的なものになっているが,普通の研究者ひとりひとりが,ちょっと複雑なソフトウェアや膨大なデータ・文書ファイルを扱う傾向はますます強まってゆくと思うので,個人で多数のPCを使うことが一般化すると考えられる。 また,大規模なシミュレーションには,巨大な計算パワーが必須なので,このような研究分野には数万,数十万個のCPUをつなげたPCクラスターがいずれ登場するだろう。

我々多細胞生物は,名称からもわかるとおり,多数の細胞から成り立っている。 細胞は自立しているという点で,1個のPCと似ているが,ちゃんと分裂して2個になることは,現在のPCにはできない。 そこで私は以下のようなシステムを夢想している。 さすがに今のPCに自己複製能力を求めることは不可能だが,少なくとも,故障したり,ウイルスに感染したりしたら,それを自動的にどこかのセンターに連絡するシステムの開発は可能だろう。 もちろん,あるCPUが動かなくなったら,それ自身が通報することはできないから,CPUが常時相互監視している必要がある。

故障なり,なんなりの問題が生じたことがわかったら,利用者である我々の手をわずらわせることなく,新しいCPUが配送される。 さらに,これらCPUがわれわれの研究室にある必要はないので,大学や研究所など,それぞれの研究単位でCPU格納室を用意し,各自の部屋からそれらにつなげばよい。 このような集中システムであれば,故障したり,あるいは利用者がもっとCPU数を増加させたいときに,利用者が意識するしないにかかわらず,CPUが工場から届けられ,半自動的に交換あるいは追加される,ということは楽だろう。 また多数のCPUが集中していることにより,それらをイントラネットでつなげてグリッドシステムとして使うことも容易だろう。

安易な解決策ではあるが,既存の技術を使うことができるので,これによってCPUの増殖を比較的簡単に実現することができると思うのだが。 もちろん,遠い将来にはCPUの本当の意味での「自己複製能力」が期待される。 ただし,現在の材料では無理だろう。 人工の「CPU細胞」のようなものの開発が必要だ。 たとえば,超高速パラレル計算を常時行なっていると言われている,哺乳類の小脳のような細胞群を自由に細胞培養することができれば,それらを使うことができる時代が来るかもしれない。



  ddbjmag@ddbj.nig.ac.jp

この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,画面右上の「申込み・変更」ボタンをクリックするか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
発行: 日本 DNA データバンク (DDBJ)
  大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111
Last modified: Oct. 07, 2011