DNA Data Bank of Japan
DDBJ メールマガジン 
No.29   2006年11月28日発行
English
apply 申込・変更
top 最新号 top
backnumber 過去の号
ddbj 発行:DDBJ
Search for
サイトマップ
ご利用の前に
DDBJ とは?
塩基配列の登録
  SAKURA
  大量登録
  登録データ更新
検索・解析
  ARSA   getentry
  TXSearch  
  FASTA   BLAST
  SSEARCH
  HMMPFAM
  ClustalW
 
  Web API
 
  GIB
  GIB-V
  GTPS
  GTOP
リリース詳細
リリース取得
  DDBJ リリースノート
  公開中リリース
Q and A
生命情報学へのとびら
  講習会   関連会議
  ゲノム機能発現研究会

 DDBJ の連絡先  mail
Copyright © 1995-2006
DDBJ All rights reserved.
 ■風樹の嘆(ふうじゅのたん)のみならず 
我が家の冷蔵庫が突然壊れました。普段何気なく使っているものがないと,結構不便。有難さに気付くのは,使えなくなったり,なくなった時。大袈裟かもしれませんが,身近な人にも言えるのでは。モノは替えがきくけれど,人はそうはいかないです。今年もあと少し,せめて1年に1度,あの人に感謝の気持ちを伝えては---。
隔月公開の DDBJ メールマガジン第29号 web 版です。 メールマガジンに関するご質問やご意見がありましたら ddbjmag@ddbj.nig.ac.jp までどうぞ。
 kouyou
色付いた所内の木々の葉

 ■「第3回 DDBJing & PDBjing 講習会 in 東工大」参加申込み受付中 
DDBJ では,塩基配列の登録や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により有効に利用していただくために,全国各地で「DDBJing 講習会」を開催しています。 講習会では,DDBJ のスタッフが中心となっておこなう講議や実習を通して,サービスについての理解を深め,具体的な使い方を学んでいただいています。

2006年12月21-22日に東京工業大学大岡山キャンパス情報ネットワーク演習棟での講習会の開催が決定しましたのでご案内します。 今回は本年2月に開催された講習会と同じく,PDBj(日本蛋白質構造データバンク)との共同開催で,DDBJ ならびに PDBj が提供しているアミノ酸・タンパク質に関するサービスの利用法についての実習と,タンパク質ならびにゲノム研究に関する講議を行ないます。 PC を用いた実習の時間を多く設け,より実践的な知識を身に付けていただける講議内容を予定していますので是非ご参加下さい。 現在参加申し込み受け付け中です。 詳細は DDBJing 講習会のページをご覧下さい。 皆様のご参加をお待ちしています!
  • 日時:2006年12月21日(木)13時から17時まで
                12月22日(金)10時から17時まで
  • 場所:東京工業大学大岡山キャンパス・大岡山北地区情報ネットワーク演習棟
  • 対象:DDBJ,PDBj を利用される方をどなたでも歓迎します(定員30名・参加費無料)
  • 講習内容:DDBJ と PDBj の Web サービスなどの利用についての講議と PC を用いた実習を行ないます。PC は,会場に備え付けの PC (MacOSX) を利用していただきます。
 
 ■ 大量データの公開 
DDBJ が登録を受付け,10月から11月にかけて DDBJ/EMBL/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。
メダカ(Oryzias latipes) MGA 356,693エントリの新規公開 2006.11.14
MGA カテゴリーに属する超大量データが公開されました。公開されたデータは東京大学の研究グループより 登録されたメダカ(Oryzias latipes)由来の配列で,エントリ数は 356,693 です。 この配列は 5'SAGE(5'-end serial analysis of gene expression)法によって得られた転写産物です。
アクセッション番号:ACAAA0000001-ACAAA0356693 (356,693 entries)
参考 URL:
   http://5sage.gi.k.u-tokyo.ac.jp
   http://medaka.utgenome.org
anonymousFTP 一括取得:
MGA ディレクトリ
  • Master record; ACAAA_master
  • Variable record; ACAAA_variable.gz
プロジェクトインデックス
 
マボヤ (Halocynthia roretzi) EST データ 58,309 エントリの公開 2006.11.2
国立遺伝学研究所から登録されたマボヤ (Halocynthia roretzi) EST データ 58,309 エントリが公開されました。
アクセション番号は下記の通りです。 これらは11/1分の新着データとしてDDBJより公開されており,anonymousFTP サイトから一括取得が可能です。
アクセッション番号:DB728206-DB781564 (53,359 entries)
anonymousFTP 一括取得:ファイル名 Halocynthia_roretzi_EST_061101_1.seq.gz
 
ミツバチゲノム全塩基配列 2006.11.2
セイヨウミツバチ(Apis mellifera)のゲノム全塩基配列が,90の研究機関 からなる国際ミツバチゲノム解読コンソーシアムから Nature 443, 931-949 (26 October 2006) に公表されました。
日本からは理研 GSC などがコンソーシアムに参加しており,その EST 配列が DDBJ から公開されています (過去記事参照)。
 
最小サイズのゲノム配列,キジラミに共生する細菌カルソネラ 2006.11.2
理研から登録されたキジラミに共生する細菌カルソネラの環状ゲノム全塩基配列, 159,662 bp が公開されました。アクセション番号はAP009180 になります。
参考 URL: http://www.riken.go.jp/r-world/info/release/press/2006/061013/index.html
 

 ■INSD-XML version 1.4 の公開 
DDBJ が WWW getentry と anonymous FTP サイトにて提供している INSD-XML データのフォーマットが 10月31日より version 1.3 から version 1.4 へバージョンアップしました。

1. INSD-XML version 1.4 は, getentry では MGA 以外のデータ,anonymous FTP サイトでは WGS, MGA 以外のデータを提供いたします。
2. getentry では, version 1.3 から version 1.4 へ出力フォーマットを変更致しました。
検索時に DNA データベースを指定して 出力形式の INSD-XML_v1_4 を選択すると,結果を INSD-XML version 1.4 フォーマットで表示します。
3.anonymous FTP サイトでは,DDBJ release 68 が公開されるまでの期間,INSD-XML データのフォーマットにつきましては,version 1.3 と version 1.4 を提供いたします。
INSD-XML version 1.3
INSD-XML version 1.4
4.XML データを配置する anonymous FTP サイトの構成を変更致しました。対象は DDBJ release とそれぞれの新着 XML データです。
  • DDBJ-XML は xml/ から xml/ddbjxml/ へ変更致します。
  • INSD-XML は xml/insd/ から xml/insdxml/ へ変更致します。
  • 最新バージョンのINSD-XMLデータをご利用になられるには xml/insdxml_current/ をご参照ください。
    xml/:DDBJ-XML データを配置*
    xml/insd/: INSD-XML v1.3 データを配置*
    xml/ddbjxml/: DDBJ-XML データを配置
    xml/insdxml/: INSD-XML データを配置
    xml/insdxml/v1.3/: INSD-XML v1.3 データを配置*
    xml/insdxml/v1.4/: INSD-XML v1.4 データを配置
    xml/insdxml_current/: INSD-XML の最新バージョンデータ配置ディレクトリ
    * xml/ ,xml/insd/ 及び xml/insdxml/v1.3/ は DDBJ release 68 の公開(2006年12月末予定)時より削除いたします。


 ■2007年1月から3月頃におこなわれるサービスの中断・変更などについて 
国立遺伝学研究所は,2007年3月にスーパーコンピュータシステムの更新(リプレース)を行います。
DDBJが設置された(1986年)当初からデータベースは年々増大していますが,1990年代後半からは特にゲノム配列決定の加速により急速に増加し,2000年以降は毎年ほぼ1.5倍の割合で拡大し,2006年9月のリリース67においては,6100万件650億塩基対の規模を超えるまでになりました。
さらに,配列決定技術の高速化と費用低下による配列決定が普及し,加えて,マイクロアレーや DNA チップ技術などの新技術によるポストゲノム解析による爆発的データ発生,生体高分子の立体構造データの急増,データ蓄積に誘導される生命現象のモデル構築と生体反応のシミュレーションへの展開によって,生命科学におけるデータの生産と利用が多様化し拡大する傾向が顕著になってきています。
現行のスーパーコンピュータシステムは6年前に導入されたシステムであり,当時最新の高性能機器で構成されたシステムでしたが,先に述べたような生命科学研究の急速な進展に対して,処理性能,データ容量,さらに今後の多様な解析ニーズに応えることが困難となってきました。
これらの状況を鑑み,更新予定の新スーパーコンピューターシステムでは,
  • 塩基配列データの量的拡大と質的展開
  • 塩基配列データ以外のデータ資源への展開
  • 多様なデータの連携
  • 全ての機能の高速化と安定化
  • 新規機能の効率的開発
に対応し,
  • 基幹サービスの高速化・安定性
  • 世界的なIT基盤に相応しい高い汎用性・国際性
  • サービスを止めない高信頼性
  • システム運用性の向上と業務継続性
  • 爆発的に増大する計算機資源への要求対応可能
を実現いたします。

新スーパーコンピュータシステムは,各種サーバ(データベース構築サーバ,データ検索サーバ,展開業務系サーバ等),大容量外部記憶装置,大容量バックアップ装置を含む種々の周辺装置と,高速ネットワークシステム,及び,負荷分散装置等から構成され,大規模,超高速かつ多様な分散情報処理機能,ならびに,安定した検索・解析サービスの提供を行うための環境を整備します。

特に,データベース構築サーバ,データ検索サーバ,大規模解析サーバ等には,大規模 UNIX サーバーに加えて,PC クラスターなど並列コンピュータ環境を組み合わせることにより,データ量及び解析要求の増大や高度化に対応する拡張性,費用対効果の向上を実現します。

新スーパーコンピュータシステムへの更新(リプレース)にあたっては,システム及びデータの移行や切換えのため,2007年1月から3月頃に,サービスの中断,終了,URLの変更など,利用者の皆様にご不便をお掛けすることもありますので,あらかじめご了解いただきますようお願いいたします。詳細につきましては,決定次第,下記 DDBJのホームページなどでお知らせいたします。

 Oryzias latipes(メダカ) の WGS データ由来 ultra-contig および chromosome エントリの一部において CONTIG 行内の値が不正であった点に関するお詫び 
以下に示した Oryzias latipes (メダカ) WGS 由来の ultra-contig エントリおよび chromosome エントリにおいて,CONTIG 行に記載された各ピースエントリが引用する配列長の数値が不正になっておりました。
  • CONTIG 行の内容が不正になっている ultra-contig エントリの アクセッション番号とバージョン番号は以下の通りです。現在,修正エントリを再公開しております。修正された ultra-contig の各エントリのバージョン番号は".4"となっております。
    ultra-contig エントリ (42 エントリ)
    DF076134.3, DF076146.3, DF076156.3, DF076165.3, DF076168.3, DF076174.3,
    DF076189.3, DF076197.3, DF076201.3, DF076203.3, DF076205.3, DF076217.3,
    DF076230.3, DF076245.3, DF076247.3, DF076249.3, DF076256.3, DF076258.3,
    DF076269.3, DF076279.3, DF076281.3, DF076285.3, DF076298.3, DF076306.3,
    DF076312.3, DF076313.3, DF076318.3, DF076341.3, DF076366.3, DF076379.3,
    DF076386.3, DF076387.3, DF076391.3, DF076408.3, DF076411.3, DF076417.3,
    DF076418.3, DF076425.3, DF076430.3, DF076449.3, DF076456.3, DF076457.3

  • CONTIG 行の内容が不正になっていた chromosome エントリのアクセッション番号とバージョン番号は以下の通りです。
    chromosome エントリ (20 エントリ)
    DG000001.1, DG000002.1, DG000003.1, DG000004.1, DG000005.1, DG000006.1,
    DG000008.1, DG000009.1, DG000010.1, DG000011.1, DG000012.1, DG000013.1,
    DG000014.1, DG000016.1, DG000018.1, DG000019.1, DG000021.1, DG000022.1,
    DG000023.1, DG000024.1

Chromosome エントリにつきましては,24 エントリでバージョン番号を統一して管理するため,全 24 chromosome エントリを次のように一括更新いたしました。
前バージョン 更新後のエントリ
DG000001.1-DG000024.1-->DG000001.3-DG000024.3
DG000001.2-DG000024.2-->DG000001.4-DG000024.4
なお,DG000001.2-DG000024.2 とDG000001.4-DG000024.4 の内容は,LOCUS 行の日付とバージョン番号を除いて同一です。

anonymous FTPサイト (ftp://ftp.ddbj.nig.ac.jp/ddbj_database/mass/Oryzias_latipes_CON/) で提供をさせていただいていた Oryzias latipes (メダカ) の CON ファイルのうち,以下の3ファイルには不正な CONTIG を含むエントリが含まれております。これらの3ファイルについては使用しないようにご注意願います。
現在,以下の3ファイルは削除させていただいており,修正後のファイルに差し替えております。
ftp://ftp.ddbj.nig.ac.jp/data base/mass/Oryzias_latipes_CON/
Oryzias_latipes_CON_060524_1.seq.gz
Oryzias_latipes_CON_060531_1.seq.gz
Oryzias_latipes_CON_060605_1.seq.gz

  • 修正後のファイルはこちらのリンク先よりご覧いただけます。
  • なお,Oryzias_latipes_CON_060615_1.seq.gz (DG000001.2-DG000024.2を含みます) につきましては,Oryzias_latipes_CON_061018_1.seq.gz (DG000001.4-DG000024.4を含みます) に置き換えさせていただきました。

ご迷惑をおかけしましたことを心よりお詫び申し上げます。  

 ■スパムメールに対する緊急対応についてのお詫びとご報告 
11月初めよりの国立遺伝学研究所メールサーバの大量スパムメール受信に対する緊急対応につきまして は,ユーザの皆様に大変ご不便をお掛けしております。

今回の異常状況は,外部からのメール受信要求が,1日当りで平常時の3倍から5〜6倍程度,1時間当り では平常時の10倍を超える状態が数日間に渡って継続したことによるものです。 ピーク時には所外からのメール受信を一時停止せざるを得ない事態となり,制限付きでの受信解除後も,フリーメール受信拒否を緊急措置として実施しておりました。

そのため,ユーザの皆様よりお問い合わせいただいたメールも受信までに長時間を要したり,場合によって はエラーメールとなって送信者に返信されてしまうケースもあり,お問い合わせにすぐに回答をお送りすること ができない状況が続いておりました。
(所外より遺伝研に向けて送信されたメールにつきましては,外部メールサーバの設定に依存しますが,一定時 間再配送を繰り返すと思われ,最終的に送信出来ない場合は,エラーメールとなって送信者に返信されます。)  

外部からのメール受信数は11月15日頃より次第に減少し,現在ではほぼ平常時の状態に戻ってきており,そ のため,11月11日より緊急措置として実施しておりましたフリーメール受信拒否も11月20日に解除いたしました。

スパムメールは年々増え続けておりその被害は社会問題となりつつあります。今後も今回のような事態が再 発するおそれはありますが,国立遺伝学研究所では,影響を最小限に食い止めるために,メールサーバの増強や 検疫ソフトの検討など,ハード/ソフト両面からの対応策を講じてゆく予定です。

ユーザの皆様に大変ご不便をお掛けいたしましたことをお詫びいたしますとともに,今後も皆様のご理解と ご協力をお願いいたします。


 ■ゲノムひろば2006 に参加 
11月4-5日に東京丸ビルホールで開催された「ゲノムひろば2006」 in 東京に DDBJ がポスター参加をしました。「ゲノムひろば」は,一般の方々に ゲノムおよびゲノム研究の実際をわかりやすく紹介することを目的とした催しです。会場ではポスター展示や 資料配布を行なうだけでなく DDBJ のスタッフが実際に説明に立ち,身近な微生物の遺伝子を例に遺伝子データを扱うDDBJ の役割とともに, 一般の人でも利用できることも紹介しました(DDBJ スタッフコラムにも様子が記されていますので,こちらもご覧ください)。  ゲノムひろば

 ■年末年始の休業のお知らせ 
DDBJ では,国際塩基配列データベースの構築業務を 2006年12月29日(金)から2007年1月3日(水)まで休業いたします。
これにともない,SAKURA によるデータ受け付けは2006年12月27日(水)から2007年1月4日(木)までご利用いただけません。 エントリの新規および再公開も,2006年12月27日から2007年1月4日まで行なわれません。 ご不便をおかけいたしますが,皆様のご理解・ご協力をお願い申し上げます。
休業期間: 2006年12月29日(金)から2007年1月3日(水)
SAKURA 停止: 2006年12月27日(水)から2007年1月4日(木)
新規・再公開停止: 2006年12月27日(水)から2007年1月4日(木)


 ■DDBJ スタッフコラム18  
「伝達は終わらない」

大城戸利久(DDBJアノテータ)

DDBJ でアノテータをしております小生が今回のコラムを担当いたします。ご承知のとおり,DDBJ は国際塩基配列データベース(INSD; 欧州の EMBL,および米国の GenBank)の一員として活動しており,この国際塩基配列データベース共同体(INSDC)の活動が開始されてから,今年で20年の歳月が流れました。アノテータの業務は基本的に登録者から送られてくる塩基配列データを INSDC によって規定されたルールに基づいて査定し,アクセッション番号を通知することになります。その他にもプロジェクトへの協力や学会への参加など,色々とありますが,ここでは割愛します。

さて,先日,東京で開催された“ゲノムひろば2006”に出典者側として参加し,DDBJ の活動とサービスおよび,微生物の多様性と遺伝子・ゲノムに関する内容を紹介する機会を得ました。“ゲノムひろば“は高度で専門的なゲノム研究領域の成果を,普段,専門分野に接することがない方々も含めて多数の皆さんに紹介し,触れていただく機会となります。”ゲノムひろば“の会場には,学術研究の世界とは距離があるもののこの分野に興味を持っていただいている方,大学生,さらには高校生など,多数の参加者が訪れていました。平素,DDBJ の業務で私たちアノテータが接する登録者や利用者は主に生物学に関連した研究を職業にしている方や学生の方々が多く,生物学(特に分子生物学)への理解が高い方々と接する機会が多いことから,”ゲノムひろば”で多数,お見受けした一般の方々と接する機会は限定的になります。

展示ポスターでは,DDBJ のサービスの他に,色々な微生物の形態や特異な働きの紹介,細胞内の配置のイメージおよび環状DNAの写真の掲載し,さらに塩基配列の並びの表示および,ゲノム内で遺伝子としてコードされている領域とそうでない領域との存在などを話しました。“ゲノムひろば”で何人かの方々とお話をさせていただきましたが,その中で,気になった点として,「DNA,遺伝子,ゲノムの関係がわかりにくい」というものでした。ある高校の生物の先生曰く,「大学の入学試験に出る事柄でもあるので,生徒に教えなくてはいけないが,教えるのに苦労されている」とのことでした。“ゲノムひろば”に参加して,教科書的な知識と実状との間に乖離が大きいことを感じました。 少し話しは変わりますが,以前,知人から聞いた話なのですが,大学のオープンキャンパスなどで,来訪者の方々に「DNA を見せます」といったデモをしたときのことです。DNA 溶液が入っているチューブの中にエタノールを加えて,沈殿してきた白い糸状の DNA(恐らくゲノム DNA と思われますが)を見せた時に,それを見た参加者から“DNA って,二重らせんのはしごの形をしていないのですね“,と言われたそうで,苦笑したとのことでした。卒論や学位のテーマで研究を行っている方々でも始めて,ゲノム DNA を抽出した時に同様な経験されているかもしれません。

大学や大学院などでの教育・研究活動では,科学的検証の蓄積や論文を含めた資料の調査,さらに思考を行う作業が繰り返されており,いわば「知識の生産」が絶えず行われています。この生産された知識は多くの人々に共有されるとともに,次世代へ伝達されていくことが必要であると考えます。

INSDC が扱う塩基配列は生物が生存するための遺伝情報を保持する役割を持たされており,有性生殖であれ,分裂や出芽といったような無性生殖であれ,遺伝情報の担い手である DNA(一部は RNA)が親から子孫に引き継がれています。さらにこの遺伝情報は多細胞生物であれば,全ての細胞に分配されており,共有されています。塩基配列は“A(アデニン)”,“C(シトシン)”,“G(グアニン)”,“T(チミン)”が基本となって表現されていますが,一見するとこれは単なる文字列でしかありません。しかも塩基配列はウイルス,原核生物から高等真核生物まで共通の文字列として表現されているので,その裏に存在するはずの情報,由来生物は何か,転写された配列なのかゲノム由来なのか,どんな産物であるのかなどを正確に記述しなければ,殆んど意味不明な何十万,何百万という文字列の集まりでしかないのです。塩基配列データベースの中では塩基配列エントリに生物学的な意味を付与していく作業を行っています。生物学的知見といっても,普遍的部分と見解が定まっていない部分,新たに加えられる部分と様々な状態の箇所が混在しています。従って,可能な限り正確な情報を付与していくために記述ルールを見直しと,それに伴った修正作業が INSDC で絶えず行われており,これは今後も続いていきます。

学術研究・技術開発・教育と密接に関係している INSDC は塩基配列情報のアーカイブスを保存し,利用できる場所です。 欧米を舞台にした外国人作家のミステリー小説を読んでいると,謎解きのために教会の図書館や書庫に保存されている資料(冊子体)を閲覧する場面が登場します。冊子体は劣化が起こるので,温度や湿度,日光への暴露などを十分に注意して管理を行うことが求められるので,不特定多数の方が容易に利用できる状況となっていないケースもあり,場合によっては貴重な(特殊な)資料となりがちです。昨今は電子化によるデータの保存とデータベースの急速な普及が相まって,データの検索や閲覧に対する労力が減っています。 INSDC のデータは電子化されているので,web ブラウザやネットワークを介したプロトコールによって,不特定多数の人々が容易に入手できるような仕組みが構築されています。

利用したい時に直ぐに利用できることが当たり前であることを求める,あるいは求められることは知識や経験の共有と伝達が継続的に行われるためにも,健全な状況であると感じます。遺伝情報を伝えてきたという,生物の営みが我々の思考に影響があるのとすれば,次世代への知識(技術も含めて)の継承と伝達(教えたい,伝えたいなども)は本能的な欲求であると考えても突飛ではなさそうです。



  ddbjmag@ddbj.nig.ac.jp

この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,画面右上の「申込み・変更」ページをご利用になるか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
発行: 日本 DNA データバンク (DDBJ)
  大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111
Last modified: Oct. 07, 2011