HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 62   2011年6月28日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
「三島探訪」〜 井上 靖
mishimataisya

文豪・井上 靖は,静岡育ちです。『しろばんば』『夏草冬涛』『北の海』は,井上 靖の自伝的小説3部作品で,静岡での生活が多く書かれています。
『しろばんば』には幼少時代の伊豆湯ヶ島で過ごしたことが, 『夏草冬涛』では三嶋大社近くに下宿し,沼津の中学(現沼津東高校)へ通っていたことも書かれています。
その中に 「すじ向いに三嶋大社の大きな石の鳥居がある。 毎朝,往来へ出ると,神社の方へちょっと頭を下げて行くように伯母に言われているが,いつもこれは省略させて貰ふことにしている。」 とあり,三嶋大社前の情景が思い浮かびます。
豊かな自然,様々な人間関係,ユーモラスでかつ涙も誘い,読み終わるのが惜しいほどに感動が詰まった3部作品です。

DDBJ メールマガジン第62号 web 版です。

DDBJ リリース 86.0,DAD リリース 56.0 完成

DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。
2011年6月20日に DDBJ リリース86.0,DAD リリース 56.0が完成しました。
詳細は,DDBJ Release NoteDAD Release Note をご覧下さい。 FTP によるデータの取得は,FTP・WebAPI のページ より可能です。

DDBJ リリース 86.0
日本特許庁の特許塩基配列データ 公開

日本特許庁(JPO)から登録された 1,591,911件の特許塩基配列データが公開されました。

 アクセッション番号:
 
 
 エントリー数:
 データ種別:
 公表番号:
 発明タイトル:
 FZ437591 - FZ999999
 GB000001 - GB999999
 HV000001 - HV029503
 1,591,911件
 公表特許公報
 JP 2006-507841
 Functional and Hyperfunctional siRNA
平成23年度DDBJオープンシステムプロジェクトの募集

日本DNAデータバンク(以下 DDBJ) では,次世代シーケンサの出現にともなう計算機需要の急激な高まりに対応し, DDBJ が所有する「解析サーバ PC クラスタ(ホスト名 an200)」を所内外の研究者に利用頂くため, 以下の要領で平成23年度「DDBJオープンシステムプロジェクト」を募集いたします。

この研究プロジェクトでは,研究者自身に大規模計算機環境を提供し,様々なデータ解析,シミュ レーションや,バイオ関連のプログラム開発,高速化に関する試用にお使い頂く事が可能です。

研究プロジェクトの対象

本研究プロジェクトの対象となる研究は「最大48ノード(192コア)」を使用する大規模計算を 大量に行う研究を対象とします。(上記ノード内での分割提供も可能です)

応募資格

申込者(代表者)は,「国内の大学に所属する研究者,公共機関に所属する研究者」に限定します。
研究グループのメンバーは,情報・システム研究機構国立遺伝学研究所 DDBJ 塩基配列データベース等利用規規約 に準ずる有資格者,すなわち:

  • 国内の大学に所属する学生・研究者
  • 公共機関に所属する研究者
  • 企業に所属する研究者,技術者

でなければなりません。

オープンシステムプロジェクトの要件

① 研究期間は平成23年8月1日〜平成23年12月15日の間とします。
  (以降についても同様の募集を予定していますが,詳細については改めて公表します)
期間中は,最大48ノード専用システムを無償でご利用できます。

応募締切

平成23年7月11日(月)必着 (応募多数の場合は,早期に締切とさせて頂く場合があります)

詳細は,こちら をご覧下さい。

2011年6月20日    opensystem@ddbj.nig.ac.jp

International Collaborators Meeting 2011(ICM2011) を開催しました

DDBJ, EBI, NCBI の3大国際DNA データバンクは,INSDC; International Nucleotide Sequence Database Collaboration として国際塩基配列データベースの共同構築と運営を行なっています。
3バンクは,生物学の発展に伴って発生するデータ項目や内容の追加・削除・更新など,活動の実務について協議するため, 国際実務者会議(ICM) を年1回開催しています。

会議では,生物学の発展ならびに登録者や利用者のニーズに留意し,これに応えるような対応を討議します。また,研究動向を少し先取りした議論も行われます。 そして,この会議での決定に基づいて,3バンク共通のアノテーション規範である Feature Table Definition の改訂も毎年行なわれ, 通常,1年以内に公開データベースに改訂が反映されることになります。

ICM2011 は,5月23日-27日に大阪で開催されました。東日本大震災の影響が残る中ではありましたが,EBI とNCBI の理解と協力のもと滞りなく会議が終了しました。 今回も多くの議題が提案され,より良いデータバンク活動へ向けて白熱した議論が展開されました。
今回の会議での決定事項は,後日DDBJ ホームページにて報告予定です。塩基配列の登録だけでなく,各種データベースの利用に際しても有用ですので,是非ご参照下さい。

The Bioinformatics Roadshow 開催のお知らせ

The Bioinformatics Roadshow(EBI 講習会)を開催いたします。
EnsemblArrayExpressInterProBRENDAPRIDEIntActReactome などのヨーロッパで開発されている公共データベースの使い方について知ってもらうことを目的とした講習会です。

  日 時: 2011年9月5日(月)- 6日(火)
  場 所: ライフサイエンス統合データベースセンター(DBCLS)
  主 催: EMBL-EBIDBCLS,DDBJ
  共 催: NBDC

詳細は,こちら をご覧下さい。

大量データの公開

国立遺伝学研究所から登録されたタマーワラビー (Macropus eugenii) 由来の EST データが公開されました。

アクセッション番号は以下の通りです。
  ・FY469875-FY736474 (266,600 entries) (getentry から検索可能です)

京都大学から登録されたカタユウレイボヤ (Ciona intestinalis) ゲノムの TPA-WGS, scaffold CON データが公開されました。

アクセッション番号は以下の通りです。
  ・TPA-WGS    EAAA01000001 - EAAA01006374 (EAAA.gz) (6,374 entries)
  ・TPA-scaffold CON    HT000001 - HT001272 (1,272 entries) (getentry から検索可能です)

参考:Ghost Database

ARSA の 一時休止

ARSA は DDBJ が WWW ならびに Web API で提供している高速なキーワード検索サービスです。下記期日におきまして,ARSA サービスを一時休止いたします。

  休止期間: 2011年7月1日(金)9:00〜18:00 (作業が終了次第 サービスを再開し,HP にてお知らせいたします)
  休止理由: DDBJ リリース86.0, DAD リリース56.0 の更新作業
  関連サービスの休止:
   TXSearch からの ARSA 参照機能
   DDBJ HP (上部検索窓) からの DNA/Protein/AllDBs 検索機能

ご迷惑をお掛けいたしますが,ご理解とご協力をお願いいたします。

DDBJ アノテータの業務紹介 〜 4.更新について(前編)

ユーザーの皆様にDDBJ の業務内容を知って頂き,より身近に感じて頂くためにDDBJ アノテータの仕事をリレー連載コラムで紹介します。


  更新について(前編)
DDBJ アノテータ 坂井勝呂,杉田里江,三村公子

4回にわたり,SAKURA および大量登録システム(MSS) を利用した登録法について,説明して参りましたが,本コラムでは,登録作業が完了した(=アクセッション番号が発行された)後の登録情報の更新について,2回にわたり説明します。今回はその前編です。

1. 総論
登録時には,誤りの無いよう,また将来の公開時のことを考慮して過不足なく情報を登録されることと思います。しかし,登録時には未確定で不明であった情報が,暫くたって情報が確定した,登録情報を見直していたら間違いがあった,塩基配列をより長い配列に変更したい等の種々の理由で更新を希望されることもあるかと思います。そのような依頼を受けるのが,更新を担当するアノテータです。

一般的な更新作業は,登録者からの依頼を受け,担当のアノテータが依頼の内容を踏まえ,データベースの登録情報を書き換え,対象エントリの再公開作業等を行い,登録者へ作業完了の報告をする,という流れで行います。

SAKURA または大量登録システム(MSS) のいずれの方法でDDBJ に登録されたとしても,更新の窓口は一つで,更新係宛てへの連絡で依頼を受け付けています。登録時はWEB ベースの登録システムのSAKURA で配列情報を入力可能ですが,更新の場合,そのような入力システムはありませんので,必ず,ご希望の更新内容をメール,または"DDBJ へのお問い合わせ" から更新係宛てへお送り頂くことになります。なお,登録時に非公開の指定を頂いたデータについては,非公開の間はWEB での閲覧は出来ませんので,メールで依頼を頂ければ,公開時のフラットファイル の形式でお送りしています。また,登録内容の更新は,塩基配列の公開前または後のいずれであっても随時可能です。注意頂きたいのですが,DDBJ では,公開されたエントリの更新の場合,即日再公開作業を行います。従って,登録時のように,更新された内容を一定期間非公開にする,という設定が出来ません。詳細は,”Q and A”こちら をご参照下さい。

依頼を受け取った更新担当のアノテータは,登録者の指示に従い,提供された情報をもとに,DDBJ に登録頂いた情報を更新します。EMBL-Bank またはGenBank に登録された配列情報につきましては,登録を担当したデータベースが,公開日の設定等も含めすべての情報に関する更新を担当しますので,それぞれの更新担当部署に連絡をお願いします。

更新担当のアノテータの行う査定の基準・手順は,SAKURA および大量登録システム(MSS) で登録頂いた場合と同様で,Feature Table Definition(FT-Doc) に記載の規則およびDDBJの運用規定に照らし合わせ,更新の依頼内容が適切か否か,情報は正確か,使用されるFeature およびQualifier,ならびにその値の妥当性を,送付された情報から検証・確認し,必要な場合,登録者に確認を求めながら,TSUNAMI 等のデータベース編集ツールを用いて更新作業を進めます。個々の各論については,後述します。

このような一般的な更新作業とは別に,DDBJ の判断で登録内容を更新する場合があります。例えば,FT-DOC の改定による更新です。登録査定の際に参照するFT-DOC は,DDBJ/EMBL-Bank/GenBank の三極の協議の結果,改定を毎年行っています。その結果,過去の登録情報の記載において,最新のFT-DOC の規則と齟齬が生じた場合,更新担当のアノテータはデータベースの内容を書き換え,最新のFT-DOC の規則と合致するように更新します。このような場合の至近の例としては,転移因子(transposable element) の記載のために,昨年の会議で導入が決定されたmobile_element Feature が,既存のrepeat_region Feature から更新された事例があります。また,他の例としては,配列由来種の学名の変更があります。DDBJ/EMBL-Bank/GenBank の三極に登録された塩基配列の由来生物種の学名は,三極が共同で構築しているtaxonomy database で管理していますが,種々の理由から,学名が変更されたり,複数の学名がマージされたりすることがあります。そのような場合,DDBJ でも変更のあった生物名を有するエントリについて,配列由来種の学名を更新し,最新のtaxonomy database の内容と矛盾の無いように致します。いずれの更新の場合でも,ホームページ,メール等で登録者,利用者の皆様に適時報告し,確認をお願いしています。

総論が長くなりましたが,更新を担当するアノテータ宛てによく依頼される更新の内容を,以下の各論で作業の留意点を中心にまとめてみました。

2. 各論
各論の章立ては以下を予定しています:

A. 文献情報の更新・公開 (前編)
B. コンタクトパーソン・登録者情報の更新 (後編)
C. 公開予定日の変更 (後編)
D. データの登録抹消(公開データの利用制限処理)(後編)
E. 塩基配列の更新 (後編)
F. 生物名の更新 (後編)
G. その他 (後編)

A. 文献情報の更新・公開
論文の受理・公開による更新が殆どで,データ登録時に入力されたREFERENCE 情報のタイトル,著者名,雑誌名などを修正致します(DDBJ フォーマットのフラットファイル では,REFERENCE 2 以降のREFERENCE に該当する情報の修正です)。
更新係まで連絡を頂きたい内容としては,以下のリンク先を参照下さい。

  参照論文が受理されました論文が公開されました

なお,論文の別刷りは,論文がインターネットなどで閲覧出来ない場合,または,作業上,必要な場合にのみDDBJ から登録者に送付をお願いしていますが,多くの場合,メールで連絡頂いた情報のみで作業を行っています。

  参照別刷りを送る必要はありますか

登録者の方より,論文に関する情報を適時メールで連絡頂くことを期待していますが,論文公開により配列データの公開依頼が,NCBI またはデータベース利用者などよりDDBJ 宛に寄せられることもあり,登録者からの依頼でなくても,アクセッション番号の公知が確認された場合は,文献情報を更新の上,公開作業を行なわせて頂く場合もありますので,ご了承下さい。

  参照データ公開原則

また,論文に使用されなかったアクセッション番号のデータも,関係配列として文献情報の更新・公開を行わせて頂く事も可能です。希望の場合,お知らせ下さい。

なお,DDBJ では,雑誌名に関する情報は,Journals in NCBI Databases の情報を参照して,更新作業を行っています。例えば,フラットファイルに表示される雑誌名の略称は,ISO (International Organization for Standardization) abbreviation を参照し,記載しています。しかし,ISO abbreviation の規定されない和雑誌などで英名がない場合,省略せず,そのまま記載することもあります。

希望される雑誌名での表示ができない場合もありますが,相談させて頂く事も可能ですので,お知らせ下さい。

後編へつづく
ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,配信を希望される方に送らせて頂きます。
配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。
発行:日本 DNA データバンク(DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111