DNA Data Bank of Japan
DDBJ メールマガジン 
No. 25  2006年3月30日発行
English
apply 申込・変更
top 最新号 top
backnumber 過去の号
ddbj 発行:DDBJ
Search for
サイトマップ
ご利用の前に
DDBJ とは?
塩基配列の登録
  SAKURA
  大量登録
  登録データ更新
検索・解析
  ARSA   getentry
  TXSearch  
  FASTA   BLAST
  SSEARCH
  HMMPFAM
  ClustalW
 
  Web API
 
  GIB
  GIB-V
  GTPS
  GTOP
リリース詳細
リリース取得
  DDBJ リリースノート
  公開中リリース
Q and A
生命情報学へのとびら
  講習会   関連会議
  ゲノム機能発現研究会

 DDBJ の連絡先  mail
Copyright © 1995-2006
DDBJ All rights reserved.
 ■遥か彼方に希望の光が… 
希望の光? 年度末は「今日中」「できるだけ早く」などという仕事が多いことと思います。 そんな急ぎの仕事に疲れた夕方,目を休めようと廊下に出ると,どんよりとした雲の遥か彼方で夕日に照らされて海がきらきら光っているのが見えました。 右の写真,ほんの2ミリくらいですがご覧いただけるでしょうか。 希望の光です。
隔月公開の DDBJ メールマガジン第25号 web 版です。 メールマガジンに関するご質問やご意見がありましたら ddbjmag@ddbj.nig.ac.jp までどうぞ。

 ■DDBJing 講習会開催決定 
DDBJ では,塩基配列の登録や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により有効に利用していただくために,全国各地で「DDBJing 講習会」を開催しています。 講習会では,DDBJ のスタッフが中心となっておこなう講議や実習を通して,サービスについての理解を深め,具体的な使い方を学んでいただいています。
2006年6月14-15日に DDBJ のある国立遺伝学研究所(静岡県三島市)にて「第15回 DDBJing 講習会 in 三島」を開催することが決定いたしました。 初心者向けの内容で,2日間にわたりデータ登録と検索解析サービスの利用方法に関する講議を行なう予定です。
プログラムや参加受付けなど,詳細が決まり次第 講習会サイト でご案内いたします。 皆様のご参加をお待ちしています!

 ■getentry 検索結果取得方法に新機能追加 
getentry は DDBJ が web サーバと E-mail サーバで提供しているアクセッション番号などによる高速なエントリ検索システムです。 web 版では結果取得の方法が3通り(画面表示・メール送信・FTP ファイル転送)から選択することができ,このうち「FTP ファイル転送」を選択すると最大100,000件までの大量エントリデータを取得することが可能です。
「FTP ファイル転送」を選択した場合,出力結果ファイルの格納場所は画面上に表示されます。 結果として出力されるエントリが大量の場合,ファイル作成に時間がかかります。 これまでは作成状況の確認ができませんでしたが,3月13日より結果取得に際して利用できる2つの新機能を追加しました。
結果取得方法で「FTP ファイル転送」選択時
ファイルの作成状況の確認: 下部フレームの,ファイル名の下の「ファイル作成状況」をクリックすると,作成状況が表示されます。
ファイル作成完了通知メール: ファイル作成完了後に入力されたアドレス宛に通知メールを送信します。
 
3月上旬まで起こっていました「FTP ファイル転送」選択時に一度に取得できるエントリが 5000 件程度に限られるという不具合は解消されましたので,今後はこの機能を大いにご利用下さい。
出力結果ファイルは,完成から24時間経過すると自動的に削除されますのでご注意下さい。
 ■Web 版 BLAST 結果表示画面に機能追加 
DDBJ では 相同性検索サービス BLAST をweb サーバSOAP サーバ ならびに e-mail サーバで提供しています。
このうち Web 版 BLAST には検索結果をグラフィカルに表示し, ClustalW への連携を簡便に行なう Graphical View という機能があります。 結果表示ページから ClustalW 設定画面に移動する際に使用する項目の機能拡張を2月2日に行ないました。 詳細は以下の通りです。
結果表示画面機能拡張
結果表示画面の Graphical View および Text View について,以下の (1),(2) による指定と,2つの間で AND または OR 条件での選択を可能としました。
(1)E Value または Score: どちらか一つを選択し入力欄に値を指定してから SELECT ボタンをクリックすることで条件を満たす配列を選択することができます。
(2) Overlapping Positions: query の範囲を指定し,Entirely または Partially を選択してから SELECT ボタンをクリックすることで条件を満たす配列を選択します(Entirely は入力した範囲がすべて含まれる場合,Partially は入力した範囲が部分的にでも含まれる場合に配列が選択されます。 また,入力欄の片方にだけ値を指定すると入力した位置を含む配列が選択されます)。
さらに複合条件として,E Value または Score の条件と Overlapping Positions の条件との間で,AND または OR を指定することも可能です。
どちらかの条件しか使用しない場合は AND,OR の指定はどちらも同じ扱いです。
 
ClustalW との連携機能の修正
blastx, tblastx で検索し,Query とヒットしたエントリを選択して ClustalW へ連携すると,DNA 配列のエントリとアミノ酸配列のエントリが混在して設定されてしまいます。 これを回避するために blastx, tblastx で検索した場合は,Query を選択できないよう変更しました。
 
その他
ClustalW オプション設定画面に移動するための "GO TO CLUSTALW" ボタンを GraphicalView の下だけでなく,上にも追加しました。スクロールの手間が省けます。
 ■大量データの公開 
DDBJ が登録を受付け,1月から3月にかけてDDBJ/EMBL/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。
ヒト EST 13万エントリの新規公開(3月14日)
理化学研究所ゲノム科学総合研究センターから登録されたヒトの EST データ13万エントリが公開されました。 アクセッション番号は以下の通りです。
DB441779-DB577968 (136190 entries)
 
イネ EST 78万エントリの新規公開(1月31日-2月2日)
農業生物資源研究所から登録されたイネ(Oryza sativa (japonica cultivar-group))の EST データ78万エントリが公開されました。 アクセッション番号は以下の通りです。
CI000001-CI778739
これらのデータは FTP サイト (/database/rice_EST) から取得することができます。
- rice_EST1.seq.gz(CI000001-CI250000:圧縮サイズ83MB)
- rice_EST2.seq.gz(CI250001-CI500000:圧縮サイズ76MB)
- rice_EST3.seq.gz(CI500001-CI778739:圧縮サイズ79MB)
 
ヒトEST 162万エントリの更新(1月17日-26日)
データ登録元の東京大学医科学研究所および株式会社リバース・プロテオミクス研究所の要請により,ヒト EST データ162万エントリの文献情報が更新されました。 アクセッション番号は以下の通りです。
- AU116789-AU117215
- AU117217-AU144110
- AU144112-AU160826
- AU279383-AU280837
- BP192706-BP383670
- DA000001-DA999999
- DB000001-DB384947
これらのデータは getentry で取得することができます。
 ■「ご利用の前に」ページ公開 
DDBJ のサービスをご利用いただく際にご一読いただきたい内容を掲載した ご利用の前に というページを3月28日に公開しました。
このページは「登録に附随する権利と義務」「データ利用に関する説明」「サイトポリシー」「個人情報の取り扱いについて」という項目で構成されています。 各ページの左カラムにあるボタンの上から2番目「ご利用の前に」をクリックしてご参照下さい。

 ■日韓中 Bioinformatics Training Course 開催報告 
講義中の様子 3月14日から17日にかけて静岡県三島市の国立遺伝学研究所で The 5th Japan-Korea-China Bioinformatics Training Course を開催しました。
日韓中の若手研究者31名(日本から11名・韓国から10名・中国から10名)とオブザーバが4日間にわたり朝8時から夜7時半まで講議および実習を受けました。 今回は日韓中の講師に加え,シンガポール・タイ・インドネシアからも講師を招きました。
このトレーニングコースは2007年も開催する予定です。 詳細が決まりましたらホームページや当メールマガジンでご案内いたしますので,興味をお持ちの方はどうぞご参加下さい。
右の写真は講義中の様子です。

 ■S&W SEARCH サービス停止中 
当メールマガジン19号(2005年4月)でもお伝えしましたが,WWW と E-mail で提供している相同性検索サービス S&W SEARCH は,ハードウェア製造社の解散に伴い,2005/4/1以降サービスに支障をきたすようなハードウェア障害が発生した時点でサービスを終了する予定です。
3月22日よりハードウエア障害のためサービスを中止しています。 現在調整中ですが,サービスの再開は難しい状況です。
対応が決まり次第ホームページ上でおしらせいたしますが,利用者の皆様どうぞこの状況をご承知おき下さい。
なお,S&W SEARCH と同様なアルゴリズムを用いた検索サービスとして, SSEARCH が引き続き利用可能です。
皆様にはご不便をお掛けすることになり誠に申し訳ございませんが何卒ご理解とご協力の程よろしくお願い申し上げます。

 ■DDBJ/CIB ヒトゲノム情報工房サービス終了 
DDBJ が WWW で提供している DDBJ/CIB ヒトゲノム情報工房 は,ヒトゲノムの配列情報を多くの人に利用しやすい形で提供することを目的として作られましたが,ここで公開されているのは概要配列に基づくものであり完全配列が公開された現在その役目を終了したと思われます。 このこととハードウエアの障害により,3月31日をもってサービスを終了することになりました。
代替サービスとしてヒトの全長cDNA配列データベースである H-Invitational Database CIB-DDBJ Flat File Server をご利用下さい。
皆様にはご不便をお掛けすることになり誠に申し訳ございませんが何卒ご理解とご協力の程よろしくお願い申し上げます。 2000年4月のサービス開始から6年間にわたるご利用ありがとうございました。

 ■提供データに関するおわびと「おわびと訂正ページ公開 
DDBJ ではデータベースの構築やサービスの提供などに関して間違いのないように注意を払っておりますが,残念ながら2月から3月にかけて以下の問題が発生しました。
いずれも現在は正しい状態でご利用いただくことができますが,ユーザの皆様にご迷惑をお掛けいたしましたことを深くお詫び申し上げます。

これらの報告を含む おわびと訂正 ページを公開しました。 トップページ右カラムからご覧いただくことができます。 このページの内容が増えてゆくことのないように,防止策を強化してゆきます。
SRS「DDBJRELEASE」の AUTHORS と TITLE に関する検索不具合
DDBJ ではキーワード検索サービスの1つとして SRS を提供しています。 SRS のインデックスファイルの一部に不備があり,正しい検索結果を得られない状態が続いていました。
この不具合により検索対象データベースとして「DDBJRELEASE」を選択した場合,AUTHORS と TITLE というフィールドの一部が検索対象となっておりませんでしたので同項目内が正しく検索できませんでした。 Quick Search では「DDBJRELEASE」を選択して検索した場合,Advanced Search では「DDBJRELEASE」または「DDBJ」を選択し, AllText, Authors, Titleのうちひとつでも指定して検索した場合において影響がありました。
3月13日に修正が完了しており,現在は正常に検索結果を得ることができます。
詳細は以下の通りです。
影響のあった範囲:DDBJRELEASE の AUTHORS と TITLE の一部
影響のあった期間:
    - AUTHORS に関する検索 2004/10〜2006/3/13
    - TITLE に関する検索 2006/2〜2006/3/13
対応:対象となる項目の再インデクシング(3月13日対応済)
 
相同性検索における検索対象データベースの一部不備
DDBJ の 相同性検索サービス においてシステム障害が発生し,正確な結果が得られない状態が続いていました。 現在は正常に検索結果が得られる状態です。
詳細は以下の通りです。
影響期間:2006年2月19日12時から2月27日15時30分まで
影響のあったサービス:PSI-BLAST を除く相同性検索の全サービス(WWW,E-mail とも)
影響のあったデータベース:塩基配列データベース
影響のあったディビジョン:
    - BCT(バクテリア(原核生物))
    - GSS (genome survey sequences)
    - INV(無脊椎動物)
    - MAM(哺乳類(ヒト,霊長類,齧歯類を除く))
    - PLN(植物・酵母・藻類)
    - ROD(齧歯類)
    - SYN(合成配列 (合成遺伝子))
    - VRT(脊椎動物)
    - VRL(ウイルス)
 ■DDBJ スタッフコラム14 
ハプロタイプブロックについて一言

小笠原 理
国立遺伝学研究所 大遺伝子発現解析研究室 助手

ゲノムデータの応用として期待されているもののひとつに疾患関連遺伝子の探索がある。 多因子疾患については,疾患関連遺伝子の疾患に対する寄与が小さいため連鎖解析では疾患関連遺伝子を検出するのは現実的には困難であるのに対し,連鎖不平衡解析をつかえば統計的に検出できる可能性が高いという理論 (Science 273:1516) に後押しされて,連鎖不平衡解析が盛んに行われるようになった。

その後の大きな進展の1つは,ハプロタイプブロックの発見である。 大規模な実験の結果,SNPs をマーカーとして用いたとき連鎖不平衡を呈する染色体上の領域の範囲は数kb〜数百kb に及ぶこと,その LD を呈する範囲は,不連続なセグメント構造(ハプロタイプブロック)として見えることがわかってきた。 大雑把に言うと,ブロック内の SNPs は互いに連鎖不平衡を呈するが,異なるブロックに乗っている SNPs の間では連鎖不平衡が無く,染色体はこのようなブロックで敷き詰められていると考えてよい。 この不連続なセグメント構造は,人種を超えて共通であるという。

この観測結果から,このハプロタイプの不連続なセグメント構造の原因は,染色体上の特定の場所で組み換えが非常に起こりやすいためである,という説(組み換えホットスポット説)が提唱された。 簡単のため組み換えがホットスポットでしか起こらないとすると,ホットスポットで区切られた染色体領域は,ひとつの塊として子孫に受け継がれる。 したがって(若干乱暴だが)理屈の上では,ホットスポット間の領域のうえに1つずつ SNP マーカーがあれば,この領域内のほかの SNPs あるいはこの領域内にある疾患に関連した多型とも連鎖不平衡を示すはずである。 解析に用いるマーカーの数を減らすことができるということは,マーカーを準備する上での経済的効率だけでなく,マルチプルテストの影響を低く抑えられるという点で画期的なことであった。HLA 領域に関する研究によると,sperm analysis(一種の家系データ)から求められた組み換えホットスポットと集団データから得られたセグメントの区切りとが見事に一致している (Science 304:581)。 これを根拠に HapMap の最近の論文でも組み換えホットスポット説を推している (Nature 437:1299)。

ところで,上記の観測事実から,ハプロタイプがブロック状の構造を呈する原因は,染色体上に多数の組み換えホットスポットが存在し,多くの場合そこでしか組み換えが起こらないからである,という考え方を認めてしまってもよいものであろうか? この説は表面的には,実験事実に立脚した「事実」であるかのようにみえるが,実際には短い染色体領域で見られた現象をゲノム全体に「外挿」した,ひとつの「仮説」に過ぎないことがわかる。

集団遺伝学的な常識から言えば,ハプロタイプブロックが見える原因は coalescent process で説明できるのではないかと疑ってみるのは自然なことである。 これは,組み換えが染色体上のどこでも同じ確率で起こると仮定しても,ハプロタイプブロックは現れるはずである,ということである。 数式を使わずひらたくいうと,世界中の様々な人種からサンプルを取ったとしても,数十個体程度の個体の共通祖先までの世代数は,直観的な想像に比べてはるかに小さいと見積もられる。 つまり数十個体程度を見たときに,それらの間で起こった組み換えの回数はもともとあまり大きくない。 したがって,組み換えに関してセグメント構造が見えてくる,という考え方である (Am. J. Hum. Genet. 71:1227)。 この場合,サンプルの選び方がハプロタイプブロックの構造に影響してくる可能性も考えなければならなくなってくるかもしれない。

どちらの「仮説」が現実に近いか,本稿で決め付けるつもりはない。 ここではこの問題はまだ議論の余地があることを指摘するにとどめたい。 HapMap が組み換え HotSpot の論拠としている Science 304:581 の論文では集団データから組み換え価を逆算した結果,染色体領域の部分ごとに組み換え価が大きく異なるという解析結果を得ている。 しかし,何十人のデータを取ろうとも,実験データは所詮一回の coalescent process の結果に過ぎないのだが,そのたった一回の試行から組み換え価を逆算して,組み換え価が期待(つまり組み換え価一定)よりも大きく変動しているということを証明する解析は,(組み換え価一定であっても,得られる観測結果は大きな変動を伴っているはずなので)たくさんの前提を含んでおり,非常に複雑である。 したがって,それぞれの前提が解析結果にどのような影響を及ぼしたか,さらに慎重に検討する必要があると思われる。 最近の解析の論文にはよくあることだが,よく論文を読んだ程度で検討できるような話ではなく,解析を再現してみる必要があり,それはいつも非常に困難である。 解析に用いたソフトウェアを公開してくれればすむことなのだが,何とかならないものだろうか。





  ddbjmag@ddbj.nig.ac.jp

この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,画面右上の「申込み・変更」ページをご利用になるか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
発行: 日本 DNA データバンク (DDBJ)
  大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111
Last modified: Oct. 07, 2011