|
■夏の終わりに
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。
9月29日に DDBJ リリース67 を完成しました。 リリース67 のエントリ数は 61,144,621,総塩基数は
65,443,024,193 です。FTP による定期リリースおよび新着データのダウンロードサイトは
こちらです。
また,現在 DDBJ リリースでは,いくつかのインデックスファイルを除いて,ファイルサイズが 300 MB を超えないように作成されています。次回リリース (Release 68 2006年12月末公開予定) より,ファイルサイズの最大が 1.5 GB に変更になります。これは,近年ネットワーク環境が飛躍的に向上し, ファイル転送可能容量ならびに転送速度が増加したことによるものです。今後は,インデックスファイルのみでなく,ddbj***##.seq と名前のついたファイルのサイズは全て, 最大 1.5 GB になります。
栽培イネ「日本晴」の complete genome 配列エントリ(Build3)が更新されました。アクセッション番号は AP008207-AP008218 です。更新内容は,日本を中心とした国際的なイネゲノムアノテーションプロジェクト,The First Rice Annotation Project Meeting(RAP1) において解析された結果が,付加されたことです。この更新によって,約26,800個のタンパク質コード領域(CDS)が記載され,AP008207-AP008218 は再公開されました。
本データは以下のサイトより取得できます。
関連ページ
農業生物資源研究所から登録されたブタの完全長 cDNA データ1万エントリを公開 しました。アクセション番号は以下の通りです。
これらは9月16日分の新着データとして DDBJ より公開されており,anonymousFTP サイトから一括取得が可能で す。
DDBJ, EMBL-Bank/EBI, GenBank/NCBI の3大国際 DNA データバンクは,国際塩基配列データベース共同構築の運営・推進を図るために,国際実務者会議を年1回開催しています。
2006年は NCBI のあるメリーランド州ベセスダで5月15日-17日に開催され,DDBJ からは国際実務者会議に5名のスタッフが出席しました。DDBJ, EMBL, GenBank 三極の活動の年次報告が行なわれた後,INSDC; International Nucleotide Sequence Database Collaboration 運用上の実務的な問題を以下のように討論しました。 検討事項と今後の課題
Feature と Qualifier の改訂
その他の変更
getentry は DDBJ が WWW および
E-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。このたび,web 版 getentry で CONTIG エントリを検索する場合の検索結果の 取得方法が変わりました。
取得方法[画面表示]を選択した場合の検索結果の配列取得機能を以下の様に変更・追加しました。
getentry は DDBJ が WWW および
E-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
このたび,一部のエントリが web 版 getentryで表示できない状態が発生していたことが判明いたしました。 表示できなかったエントリは,DDBJ ならびに GenBank から公開された contig エントリのピースエントリになっている contig エントリで,2006年6月8日に DDBJ が公開した CON 7296エントリ(2006年4月20日に公開したメダカ strain Hd-rR WGS 22万エントリに対応)の一部も含まれています。 詳細は以下の通りですが,該当期間にweb 版 getentry を用いて, 以下の「状況」欄に該当する内容で検索を行なったと思われる方は,お手数をお掛け致しますが再度検索を実行して下さいますようお願い申し上げます。 なお,e-mail 版の getentry はこの影響を受けていませんでした。 web 版ついても対応作業が完了し,現在は正常に検索結果を得ることができます。 長期間にわたって正しい検索ができない状況が続いていたことにより,ユーザの皆様にご迷惑をお掛けいたしましたことを深くお詫び申し上げると共に,今後このような事態が発生することのないよう最大限の努力をいたします。
「DDBJ は誰のモノか?」
真島 淳(DDBJ Chief Annotator) 本題に入る前に簡単な自己紹介が必要であろう。 著者は足掛け8年,DDBJ でアノテータをしている。 肩書きからは職務内容がわかりにくいが,主な仕事は「DDBJ に登録されてくるデータ,塩基配列とその付随情報をデータベースに読み込むための整理整頓」である。 仕事の細かい中身の説明は,別の機会に譲るとしてアノテータは,ともかくも特殊な専門技術者である。 職名アノテータの上に「チーフ」と付くので,その集団のリーダー格である。 が,多くの小集団において「○○部長」「主任」「チーフ」とは雑用係の別名である。それでも,データベース仕様,記載規則に関して,一応それなりに発言権を持っているはず,多分,おそらく。 さて本題に入ろう。 DDBJ は公共の国際塩基配列データベースである。 これが,「誰のモノか?」と問われれば「公共」と冠する以上,皆の共有物と考えるのが妥当であろう。で,終わりにしても良いのだが,もらった枠を埋める都合上,別の側面も考えてみよう。 最近,評判の悪い金融系「会社は株主のモノ」的に議論すれば,国の予算で運営されているので,日本が国家として所有するモノである,という言い方も可能。これまた,評判が悪かった某監督交代「人事異動」騒動のように「社主・取締役のモノ」論なら,運営に関与する遺伝研の教員がこれにあたる。これらに対立する考え方として「働く社員のモノ」という視点から,データベースに携わる私自身を含めた作業者,システム管理をしてくれている技術者,広報担当者,事務担当者のモノとも言える。 さらに某プロスポーツチーム vs 某ファンド関連の騒動から連想されるように,チームを愛するファンの視点から「ファンのモノ」的にも考えることが出来るだろう。 ファンとは,一般化すれば,お客様,神様?いや,顧客。 DDBJ は競技団体でも利潤追求団体でもない。 ファンも(多分)いないが,準えるべきは愛用者であろうか。 つまり相当するのは,登録者と利用者である。 賢明な読者諸氏も先刻ご承知とは思うが,特に直接編集などに関わる立場からは「登録者と利用者,加えて,公共性」が「DDBJ,誰のモノ」論への模範解答である。 しかし問題は正にココにある。データベースを運営する上で,ちょくちょく運用方針を決める必要が生じる。 このとき悩ましい事態は,利用者と登録者の立場を考えると,双方の利益が矛盾する(ようにみえる)場合である。 単純な例を挙げよう。利用者から,時折,データが間違っている,とご指摘をいただく。見れば,なるほど,その利用者のご指摘は学術的に正当であるように思える。 しかし,これを直すとなれば,その是非を登録者に問うことが必要なケースもある。 そこに専門的な争点がある場合,利用者と登録者では解釈が異なる状況があり得ることは,ご理解いただけると思う。 「誰のモノ」論を,もう一度,別の視点から捉え直そう。 DDBJ と個々のデータの関係は学術雑誌と掲載論文に似た位置付けである。 つまり個々の配列データは登録者が DDBJ を通じ公表した成果である。 最初の問題を「DDBJに登録された個別データは誰のモノか?」と読みかえた場合,答えは「登録者」。 近年のデータ捏造疑惑に関する批判では,peer-review 論文における,referee,editorのあり方に関する言及があった。しかし, 一般に,個々に論文の内容に関して,通常の学術的批判をするならば,その著者に対して,であろう。 類似の批判を DDBJ の登録データに 対して行うとき,データベース管理者に矛先が向かうことが多い気がする。 そこに登録者の記載があるにもかかわらず,である。 何故であろうか? データベース側の広報が足りない,そもそもコンテンツが読み難い,こんなことを言い出すこと自体が責任転嫁だ,という厳しい批判の数々も事実であろう。 アチコチでご指摘を受けるし,私も意識していない訳ではない。 しかも塩基配列データベースは学術雑誌の論文投稿と違い,その登録先に関して寡占,実質は独占に近い。だから責任も重い。 ただ,その割りには実働の作業者は少ないし,予算も少ないし,上司もアノテータ仲間もチーフに注文が多い...何の話だっけ?チーフアノテータは上司と仲間の板ばさみにも悩んでいる, という話...ではない,それも事実ではあるが。 本筋に戻ろう。 DDBJ は広く一般から登録を受け付け公表するという,実は非常に特異な性質を持つ,データベースである。 しかし,何となく他のデータベースと同様!?に検索が可能になっており,記載が揃っている(...か,のように見える)。 そのため,類似の構造を持つ特定個人,または,団体が明確な意思と選択を持って構築したデータベースと同列に扱われてしまう,という宿命のようなものがあるのではないか? 世界中の研究者から塩基配列の登録を恒常的に受け付けることにより,抱える配列データは著しく肥大した。この成長量は当初の企画者が想定した状態を上回るものだっただろう。データ増大はデータベースにとって最大のメリットであるが,同時に種々の困難を生じてきた。最大の問題はデータベースの成長に管理者が追いついていないことである。 DDBJが業務を開始した当時のことは,私も物語としてしか,知らない。 約20年前,当時は塩基配列の決定自体が論文になる時代であり,登録も検索の要求も −現在とは比較にならないほど− 少なかったらしい。 その頃は,おそらく手綱を握ることは比較的容易だっただろう。 しかし,登録者と利用者からの要求は,時代とともに増加し変遷し厳しくなった。 塩基配列をめぐる周辺の状況も多様化した。 例えば,当時は EST を想定していなかったはずだ。 このような矛盾を解消する策を講じるのは,我々の仕事だ。 しかし大袈裟に聞こえるかもしれないが,今,DDBJ が機能していること自体が奇跡と思えるような逸話が内輪には少なからずある。 「公共のモノ」とは,ともすれば管理者の手も届かない,誰のモノでもない,ということにも近しい。 最後にお願いをして終わろう。 公共物であれば使用権には義務を伴うのは自然なこと。 DDBJ に登録してくださる研究者の皆様へは論文を投稿する際に準じた責任感を,DDBJ を参照利用される皆様へは論文を読むときのような細心さを,どうか意識していただきたい。 それこそが,DDBJが皆様のモノであり続けるために不可欠,つまりは利用権を守るための「不断の努力(憲法第12条風)」ではないだろうか。 ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,画面右上の「申込み・変更」ページをご利用になるか,次のメールアドレスまでご連絡下さい: ddbjmag@ddbj.nig.ac.jp
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Last modified: Oct. 07, 2011
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||