|
■春遠からじ
隔月公開の DDBJ メールマガジン第18号 web 版です。今回 DDBJing 講習会と日韓バイオインフォマティクス・トレーニングコースの参加者を募集しています。 案内をご覧の上,興味をお持ちの方はどうぞご応募下さい。 メールマガジンに関するご質問やご意見がありましたら ddbjmag@ddbj.nig.ac.jp までどうぞ。 写真は遺伝研から見た富士山です。
DDBJ では全国各地で「DDBJing 講習会」を開催しています。
DDBJing 講習会は,塩基配列の登録方法や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により深く理解して利用していただく助けになることを目指しています。3月2日に大阪大学中之島センターでの開催が決定しましたのでご案内します。 今回は従来の DNA データ登録などの講習に加え,大阪大学蛋白質研究所からも講師をむかえ,PDBj(日本蛋白質構造データバンク)や蛋白質の立体構造についても講議を行ないます。 PC を用いた実習の時間を多く設け,より実践的な知識を身に付けていただける講議内容を予定しています。 詳細は DDBJing & PDBjing 講習会サイトをご覧下さい。 大阪近郊の皆様のご参加をお待ちしています! 写真は前回の様子です。昨年 7/7-8 静岡県三島市・国立遺伝学研究所内で開催しました。
3月7日から10日まで,韓国太田市にある韓国生命工学研究院で,第4回日韓バイオインフォマティクス・トレーニングコースを開催します。
このコースは,日韓中の若手研究者を対象とした定員30名のトレーニングコースで,日韓中の研究者からゲノミックス・プロテオミックス・分子進化・バイオデータベース・遺伝子発現などに関する講議を受けることができます。詳細は講習会サイトをご覧のうえ,興味をお持ちの方はどうぞご応募下さい。お待ちしています! 写真は前回の様子です。昨年 3/16-19 静岡県三島市・国立遺伝学研究所内で開催しました。
国際塩基配列データベース (INSD) では,超大量の転写物配列に対応するために登録・公開についての検討を進めています。
その一環として,ゲノム配列のアノテーションに有意義な情報を提供する超大量の配列群を受け入れるためのカテゴリ MGA (Mass sequence for Genome Annotation) を創設しました。
MGA は既に存在している超大量のゲノム断片配列を格納している
WGS (Whole Genome Shotgun)
と同様に Division ではなく,カテゴリに分類されます。
INSD の定める MGA の定義は以下の通りです。
Definition of MGA MGA is defined as those sequences which are produced in large quantity in view of genome annotation. 1月24日にこの MGA カテゴリに属するデータを公開しました。 配列データは独立行政法人理化学研究所の林崎良英博士をリーダーとする研究グループから登録されたエントリーです。 このデータは CAGE (Cap Analysis Genome Expression) 法によって作出された Mus musculus 由来の転写物 (cDNA) 領域 5'末端,約20bp の長さの配列でエントリー数は 383,264 となっています。 MGA データは ftp サイトより取得できます。 公開された配列は生命情報・DDBJ 研究センターが運営する国際共同遺伝子発現データベース CIBEX (Center for Information Biology gene EXpression database) にて公開されているデータとも連携しています。
DDBJ 新キーワード検索システム ARSA
(All-round Retrieval of Sequence and Annotation)
のプロトタイプ版を昨年12月27日よりテスト公開しています。
富士通製の高速 XML 型データベース検索エンジン「インターステージシュンサク(Interstage Shunsaku)」を基盤技術として採用しています。
第1の特徴は,複雑な検索条件や大量のヒットがある条件で検索しても,これまで提供してきたキーワード検索システムに比べて遥かに短時間で検索結果を返すことができる点です。 どのような条件でも約5〜10秒で検索結果を出力します。 第2の特徴は,国際塩基配列データベースのフラットファイル (FF) 形式で定義されている Feature/Qualifier を個々に選択して詳細な検索条件を指定することができる点です。
※テスト運用中はメンテナンスの為,毎日夜間に2〜3時間程度サービスを停止いたします。
DDBJ が管理・収集している塩基配列データベースは,リリースとして年4回定期的に公開しています。
12月24日に DDBJ リリース60を公開しました。
DDBJ リリースを含め,DDBJ で現在公開中のデータベースは以下の通りです。
1年前のリリース56 と比較すると塩基数で123%,エントリ数で133% の増加率です。
DDBJ リリースも含めた DDBJ で公開中のデータベースや日米欧のデータ量の割合,登録塩基数の多い生物など各種統計資料については DDBJ の統計 をご覧下さい。 FTP による定期リリースおよび新着データのダウンロードサイトは こちら です。
・DDBJ date-----------DDBJで公開した日付
GIB (Genome Information Broker)
は WWW でゲノム情報を提供するサービスで,真正細菌・古細菌・真核生物のゲノムデータを提供しています。
2004年10月から2005年1月にかけて公開された以下28生物種のゲノムデータを GIB に取込みました。
1月31日現在で,GIB には真核生物 6・バクテリア 197・古細菌 21,計224種類のゲノムデータが格納されています。
2月8日にゲノム機能研究会が「ゲノムコピー数変化に基づく食道扁平上皮癌の分子病態解析」という講演会を開催します。
参加費は無料ですが,申し込みが必要です。
興味をお持ちの方は,サイト をご覧の上,メールでお申し込み下さい。
真空管1本とPC1個と細胞1個
斎藤 成也 1946年に米国ペンシルベニア大学で開発された ENIAC は,電子計算機の草分けだった。 当時まだ半導体は発明されておらず,17468本の真空管を使っていた(詳細は,ウィキペディアを参照されたい)。 このため,真空管が故障するたびに,計算が途中で終わってしまったという。 というこの文章を書き終わってしばらくしたら,文章作成に使っていたPCの電源が突然切れてしまい,また立ち上げるという羽目になってしまった。 それはともかく,現在では,真空管1本は,超巨大PCクラスターのPC1個に相当するだろう。 真空管を知らない世代の方もいると思うので,簡単に説明しておくと,ガラスで作った管の内部の空気を大部分とりさって,真空に近い状態にしてあるのが,「真空管」という名前の由来である。 そこには,単純なオン・オフ回路があり,簡単に言えば真空管1本は,半導体1個に対応する。 現在使われている典型的なパソコン(PC)のCPU(Central Processing Unit)1個に,どれだけの数の半導体が使われているのか,よく知らないが,おそらく軽く100万個を越えるのではなかろうか。 真空管と違って,パソコンは1台だけで立派なコンピュータである。 現在の地球上には,おそらく億単位の台数のパソコンが存在するだろう。 このように身近なものになったので,計算速度を増加させるために,これらのパソコンをたくさんつなげて分散処理しようという発想が生じるのは,当然だろう。 これがPCクラスターである。 計算機ではないが,私は中学生のころスタートレック(当時の日本のテレビでは「宇宙大作戦」という名前だった)のファンだったので,あのシリーズからヒントを得て,手の平に乗るような小さな発電機というか,エネルギー発生装置が無数にちりばめられているような宇宙船を夢見たことがある。 このような傾向の人間にとって,PCクラスターの巨大化は,コンピュータ技術の当然の方向である。 実際,私の研究室では,dualCPU のPC16台と15台からなる2セットのPCクラスターを導入して,比較ゲノム解析などに用いている。 ちなみに,これらPCクラスターのニックネームは,thinker16 とmeditator15で ある。 国立遺伝学研究所の電子計算機棟には,64台のPCクラスターが2セットあるほか,もっと高級なサーバークラスのコンピュータを128台連ねたものも使われている。 こちらも,いろいろなニックネームがあるが,それらの紹介は,これらを管理しているグループの人にまかせることにして,PCクラスターについてもう少し話を進めよう。 2個のCPUを1台のパソコンに搭載した dual PC は,現在一般的なものになっているが,普通の研究者ひとりひとりが,ちょっと複雑なソフトウェアや膨大なデータ・文書ファイルを扱う傾向はますます強まってゆくと思うので,個人で多数のPCを使うことが一般化すると考えられる。 また,大規模なシミュレーションには,巨大な計算パワーが必須なので,このような研究分野には数万,数十万個のCPUをつなげたPCクラスターがいずれ登場するだろう。 我々多細胞生物は,名称からもわかるとおり,多数の細胞から成り立っている。 細胞は自立しているという点で,1個のPCと似ているが,ちゃんと分裂して2個になることは,現在のPCにはできない。 そこで私は以下のようなシステムを夢想している。 さすがに今のPCに自己複製能力を求めることは不可能だが,少なくとも,故障したり,ウイルスに感染したりしたら,それを自動的にどこかのセンターに連絡するシステムの開発は可能だろう。 もちろん,あるCPUが動かなくなったら,それ自身が通報することはできないから,CPUが常時相互監視している必要がある。 故障なり,なんなりの問題が生じたことがわかったら,利用者である我々の手をわずらわせることなく,新しいCPUが配送される。 さらに,これらCPUがわれわれの研究室にある必要はないので,大学や研究所など,それぞれの研究単位でCPU格納室を用意し,各自の部屋からそれらにつなげばよい。 このような集中システムであれば,故障したり,あるいは利用者がもっとCPU数を増加させたいときに,利用者が意識するしないにかかわらず,CPUが工場から届けられ,半自動的に交換あるいは追加される,ということは楽だろう。 また多数のCPUが集中していることにより,それらをイントラネットでつなげてグリッドシステムとして使うことも容易だろう。 安易な解決策ではあるが,既存の技術を使うことができるので,これによってCPUの増殖を比較的簡単に実現することができると思うのだが。 もちろん,遠い将来にはCPUの本当の意味での「自己複製能力」が期待される。 ただし,現在の材料では無理だろう。 人工の「CPU細胞」のようなものの開発が必要だ。 たとえば,超高速パラレル計算を常時行なっていると言われている,哺乳類の小脳のような細胞群を自由に細胞培養することができれば,それらを使うことができる時代が来るかもしれない。 ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,画面右上の「申込み・変更」ボタンをクリックするか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Last modified: Oct. 07, 2011
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||