HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 56   2010年12月22日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
凧どころ
tako

写真は,駿河凧です。変形七角形で,武者絵や歌舞伎役者絵の絵柄が特徴です。 静岡県は,「凧どころ」と言われるほど凧の宝庫で,駿河凧の他にも浜松凧,遠州横須賀凧,相良凧,焼津魚凧,井川の扇凧,長泉凧,宗高凧等があります。 凧揚げの歴史は,揚がり具合で吉凶を判断する占いや,戦具として遠方にいる味方への連絡方法に利用したことが始まりと伝えられています。 江戸時代に入ってから,端午の節句に子の誕生を祝ったり,お正月の遊具として凧揚げが流行したようです。 空高く揚がる凧のように,皆様の運気もますます上昇しますように。
本年も DDBJ メールマガジンをお読み頂きありがとうございました。 来年も皆様に有意義な情報をお伝えできるよう勤めてまいりますので,どうぞよろしくお願いいたします。

DDBJ メールマガジン第56号 web 版です。

DDBJ リリース 84.0 完成

DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。
2010年12月22日に DDBJ リリース84.0 が完成しました。
詳細は,DDBJ Release Note をご覧下さい。 FTP によるデータの取得は,FTP・WebAPI のページ より可能です。

DDBJ 年末年始休業のお知らせ

DDBJ では,国際塩基配列データベースの構築業務を 2010年12月29日(水) から 2011年1月3日(月) まで休業いたします。
これにともない,SAKURA によるデータ受け付けは 2010年12月27日(月) から 2011年1月4日(火) までご利用頂けません。 エントリの新規および再公開も,2010年12月27日 から 2011年1月4日 まで行なわれません。 ただし,データ検索や ftp は休業期間でも利用可能です。

       休業期間 : 2010年12月29日(水) 〜 2011年1月3日(月)
       SAKURA 停止 : 2010年12月27日(月)17:00 〜 2011年1月4日(火)10:00
       新規・再公開停止 : 2010年12月27日(月) 〜 2011年1月4日(火)

皆様のご理解とご協力をお願いいたします。よい年をお迎え下さい。

「DDBJing 講習会(23) & PDBj 講習会 in 長浜」 開催

2011年1月17-18日,「DDBJing 講習会(23) & PDBj 講習会 in 長浜」を 長浜バイオ大学 にて開催します。

  日 時: 2011年1月17日(月)- 1月18日(火) 10:30〜16:30 (受付は,10:00より)
  場 所: 長浜バイオ大学 (会場アクセス
  主 催: DDBJ,PDBj,長浜バイオ大学
  対 象: DDBJ,PDBj を利用される方をどなたでも歓迎です(定員40名)
  参加費: 無料

  講習内容:

       1日目 ・PDBj と wwPDB
         ・構造からの機能予測法入門
         ・(実習 1)PDBj Mine の使い方
         ・(実習 2)複雑な構造(電子顕微鏡構造・複合体構造)の見方
       2日目 ・DDBJ の紹介と大量配列のためのクラウド型計算機資源利用法
         ・次世代シークエンサ(NGS)概論とクラウド型解析ツール DDBJ Pipeline
         ・NGS 登録データベース DDBJ Sequence Read Archive
         ・NGS クラウド型解析パイプライン実習
         ・SAKURA を用いた塩基配列登録の方法・実習


参加申込み受付中です。
詳細は,こちら をご覧下さい。

Sequin によるデータ登録受付終了のお知らせ

DDBJ ではこれまで, SAKURA・大量登録システム(MSS)・入力支援ソフト Sequin による塩基配列データの登録を受け付けてきましたが,2011年1月末日をもちまして,Sequin による受付を終了することになりました。
DDBJ への登録には,SAKURA,あるいは大量登録システム(MSS) をご利用頂くことにより,Sequin での登録に比べ,はるかに迅速かつ正確な登録が可能です。 今後はこちらをご利用下さい。

(参考) 塩基配列の登録
(A) Web 経由の塩基配列登録システム SAKURA を利用
(B) 大量登録システム(MSS) を利用

なお,止むを得ない理由でSequin での登録をご希望の場合には,お手数ですが GenBank へご登録下さい。
(参考) http://www.ncbi.nlm.nih.gov/Sequin/

皆様のご理解とご協力をお願いいたします。

「ユーザーの皆様へ,お願いです!」 〜 その3.パーフェクトなデータ更新に向けて

登録されたデータは,即時公開されたり,公開予定日までクローズされたり様々ですが, 「登録時から現在までの期間に一度も変更がされなかった」というものはほとんどありません。 そのぐらい,更新作業というのは当たり前の作業なのです。 もちろん,最初からパーフェクトなデータが入力されてくる事が理想ですが, そうでなかったとしても大丈夫です。私たちがしっかりと皆様のデータをお守りいたします。 今回はすべての皆様にとって避けて通れない,データの変更についてのお願いをまとめました。


1.データを変更する権利のある方は,「登録者」として登録されている方のみになります
データ登録時に,変更依頼者が「登録者」として登録されていなかった場合には,まず,変更依頼者を「登録者」のひとりとして追加する作業が必要になります。 こちらでは,すべてのアクセッション番号について,「登録権利者」の確認をおこなっております。どうぞお気をつけ下さい。

2.公開予定日の変更
変更対象の全アクセッション番号と新公開予定日の具体的な日付(例:2011年12月20日)をお知らせ下さい。 「公開予定日」は必ずご自身で管理して下さい。理由は その2 で記載しています。

3.文献情報の更新
論文が公開されました に従い,お知らせ下さい。 論文に使用していないデータでも,関係配列として文献情報の更新・公開を行う事が可能です。 JOURNAL 名欄は,NCBI のJournals DB を基に表示していますので,希望される略称での表示とならない場合がありますが,その場合にはご相談下さい。 論文がインターネットなどで閲覧できない場合には,お手元に論文のコピーがありましたら添付書類としてお送り下さい。 なお,論文受理の段階で当該論文がweb 上で先行公開される場合では,非公開を希望されてもDDBJ 公開原則が適用され,直ちに公開されますのでご注意下さい。

4.コンタクトパーソン情報の更新
コンタクトパーソン情報, 住所, 所属情報を変更したい に従い,お知らせ下さい。 たとえ公開完了済みのデータであっても,コンタクトパーソンメールアドレスが変更になった場合は必ずお知らせ下さい。 その際対象となるアクセッション番号はもれなくご記載下さい。 公開データで表示される内容とは異なる連絡先を登録する事も可能です。

5.登録内容は永久にメンテナンスされ続けます
アクセッション番号が発行されてしまうと,あるいは論文が公開されてしまうと,そこでDDBJ の仕事は終わりになる,と思われがちですが,そうではありません。そのデータは将来にわたって永久に管理され続けます。 例えば,将来,新発見があり,過去のデータについて,修正の指摘があった場合には,DDBJ はそのデータの登録者の確認を取った後に,データを正しい内容に修正していく必要があります。 そのため,コンタクトパーソンの連絡先アドレス(非公開)は常に最新の内容になるよう,修正され続けていくのです。

6.登録データのアクセッション番号や登録内容が不明になってしまった場合
こちらで検索し,お知らせすることも可能です。しかしながら,同姓同名の方がいらっしゃる場合など,特定できないケースもありますので,ご自身での管理をお願いします。

7.FEATURES 情報に関する変更の場合は
登録データの修正・更新
Feature key の定義
Qualifier key の定義
Organism qualifier に記載する生物名
タンパク質コード配列; CDS feature について
などの規定に則りメールで依頼して下さい。変更点が非常に多い場合は,事前にご相談下さい。

"SAKURA de Q" 第8回 (ユーザから寄せられる Q and A です)

Q.「生物情報ページ」の入力方法について教えて下さい。

A.「情報入力メインページ」で [Organism Information] をクリックすると「生物情報ページ」が開きます。
2010年10月26日より,「生物情報ページ」の入力方法が変更になり,先に生物名を記入して検索を行います。方法は以下の通りです。

①入力欄に生物名を記入して ②[SEARCH]ボタンをクリックすると,Taxonomy database から生物名を検索し, ③検索結果が表示されます。
④検索結果から適するものを選択して,⑤[register] をクリックして下さい。

SAKURAdeQ01


⑥[生物名]の項目に選択した生物名が自動的に入力されますので, ご確認の上 ⑦「生物名の区分」を選択して下さい。

SAKURAdeQ02


⑧生物名が見つからなかった場合は,検索語を修正して再検索して下さい。その際にスペル等を今一度ご確認下さい。
それでも生物名がみつからない場合や,taxonomy database に登録されていない生物名を登録する場合は ⑦「生物名の区分」で [public in taxonomy database] 以外を選択して,⑥「生物名」を入力して下さい。
「生物名の区分」の選択につきましては,「区分選択のガイドライン」を参照して下さい。

SAKURAdeQ03


「生物名の区分」を選択すると以降の入力項目が表示されますので,続けて入力して下さい。 全ての必要事項を入力した後で,[OK] ボタンをクリックすると「生物情報」の入力が完了します。

DDBJ アノテータの業務紹介 〜 1.Primary Database を維持するということ(後編)

ユーザーの皆様に DDBJ の業務内容を知って頂き,より身近に感じて頂くために DDBJ のアノテータの仕事をリレー連載コラムで紹介します。


  Primary Database を維持するということ(後編)
DDBJ チーフアノテータ 真島 淳

前編 からのつづき

3. 需要に応えるために拡張してきた INSDC の歴史

実は, 英語が苦手な私が NCBI や EBI の仕事仲間たちと毎年 meeting して, 英語で discussion し, 比較的頻繁にメールし合うということも思えば不思議な縁です。

一般には, なかなか理解してもらえない feature とか qualifier の拡張・統廃合は, 毎年, 議論されます。 2007 年と少し前になりますが, 過去の象徴的な事例を 拙稿 (署名していませんが): RNA ワールドへの対応にまとめています。 RNA ワールドと言っても化学進化の類の意ではありません。miRNA などに代表されるタンパク質コードの伝令を担わない RNA 産物の記載需要が増えた時期と ncRNA feature 導入についての解説です。 イチイチ署名してませんが, DDBJ のホームページコンテンツには私が書いた文書が多数あります。

上記は書式を時代に合わせる, という1例でしたが, 今度は, 配列決定法の変遷の話題。 EST 受付開始まで行きますと, 少々昔に過ぎて, 私も知らない時代ですが, 当時としては大きな拡張であったろうと思います。 ただ, この時点では DDBJ の中では legacy とか traditional と称している従来の枠組を逸脱する拡張ではありませんでした。 IT 分野の文脈では何故かレガシーに過去の厄介モノの意を含ませる風潮がありますが, 実際の語義は良くも悪くも引き継がれる対象であり, これからも継続すると思います。

この数年で その従来の枠組を逸脱する拡張をしてきました。 2003 年に, ゲノム概要配列の量産の時代に合わせて WGS という枠組を拡張・新設しました。 少し古い記事ですが, WGS のデータ量は新設後, 短期間で飛躍的に増大しました。 2009 年には, いわゆる次世代型とか新世代型などと呼ばれる sequencing platform の普及と配列量産による需要に対応すべく, INSDC に Sequence Read Archive (SRA) が加わりました。 (当時は Short Read Archive と呼ばれていました。) DDBJ も DDBJ Seauence Read Archive (DRA) を新設し対応しています。

時期的には前後しますが, 2003 年から, primary database を逸脱する枠組の拡張が始まりました。 Third Party Annotation (TPA) という別枠で, 配列決定を伴わない配列引用による annotation/assemble/re-assemble の登録を受け付けています。 ただし, データの信頼度を高めるためのハードルとして peer-reviewed な論文公開を伴わないかぎり, データを公開しないという規則の元で運用しています。

生物学, 生命情報科学のコミュニティからの要請・需要の変化に応えるべく, 規則を変化させたり, 枠組を新設したり, いろいろな変化がありましたし, これからも変化することでしょう。 データベースには, システム・ストレージのインフラも大事なのですが, 仕様・枠組に関しても熟考が必要です。 特に, このような「継ぎ足し」のような拡張は通常の保守以上に厄介な局面も多いのです。 現在の課題は, 主に生物多様性研究と個人ゲノム研究の進行に伴うサンプルデータの記述とデータ連携 と感じていますが, それは別の機会に論じてみたいと思います。 ひょっとしたら, この後の回でこの点について何か書く人がいるかもしれません。

    

4. 登録者とデータベースと利用者を繋ぐ DDBJ の現場

もちろん変わらない基本方針はありますが, 上述のように, 運用と規則は拡張されたり細かい変更を経て現在に至ります。もちろん, 今後も何らかの変化は不断に起こることでしょう。 ルールの変更は登録・更新の現場で annotator の業務自体の変更にあたります。 皆, それぞれに柔軟に時に厳密に対応していることと思います。 多分, この文章を書いている人物の優しい (鬼のような?) 指導の賜物でしょうか?

今後のリレー連載への繋ぎの文章として, 次回以降は, 実際の現場で何が起こっているか, を中心に展開していくことと思います。 多分, 私ではない人が これから書くことですので, 内容は推定です。

1) 欠点はあると思いますが, とにかく利用してくれている研究者は多い SAKURA からの登録がどのように扱われているか? 2) EST, WGS, 全ゲノム規模 などの登録を扱う大量登録システム MSS からの登録受付の実情, 3) それら全てのデータを登録受付後に更新・維持管理をする update 担当 が処理する種々の修正依頼, 4) 配列決定の手法も多様化しつつあり, データ量も増え, 立ち上げから対応に追われている DDBJ Seauence Read Archive (DRA) に関する事情などが予定されています。

また, 機会があれば, annotator とシステム仕様策定とか, 新システム検討の関係について述べることがあるかもしれません。 予定していませんが, 私が再登場する回があるかもしれません。 でも, それはないことを密かに願っています。

アンケートへご協力下さい

アンケートは終了しました。

ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,配信を希望される方に送らせて頂きます。
配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。
発行:日本 DNA データバンク(DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111