HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 60   2011年4月27日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
新茶
ochabatake

茶(学名:Camellia sinensis)は,ツバキ科ツバキ属の常緑樹です。 秋頃,ツバキに似たきれいな花が咲きますが,茶園では,新芽に備える栄養が取られてしまうため,花が咲かないように手入れをしているそうです。
日本一の茶の産地である静岡県牧之原台地の茶畑も新芽の収穫季節を迎えています。 「新茶」は,その年の最初に摘み採った新芽で作られたお茶のことを言います。 温暖な地域から摘み採りが始まり,桜前線の様に徐々に北上していきます。 例年,4月上旬から鹿児島で始まり,4月中旬頃から静岡,4月下旬頃から京都や八女などの主産地で収穫されるようです。 若葉のすがすがしいさわやかな香りと味,鮮やかな色の新茶をぜひお楽しみ下さい。

DDBJ メールマガジン第60号 web 版です。

BLAST, ClustalW サービス再開

東日本大震災に伴う政府および東京電力からの節電の呼びかけに呼応し,サービスを停止しておりましたが, 受付ジョブ数を制限してサービスを再開しました。混み合う場合もありますが,どうぞご利用下さい。(2011.04.12)

また,その他のサービス再開のお知らせは,決定次第 HPTwitter にてお知らせいたします。

大量データの公開

岡山大学 から登録されたオオムギ はるな二条 (Hordeum vulgare subsp. vulgare cv. Haruna Nijo) 染色体 3H 由来の WGS 配列データ 8,583 エントリが公開されました。

アクセッション番号は以下の通りです。

  ・BACC01000001-BACC01008583 (8,583 entries)

これらは4月5日分の新着データとして DDBJ より公開されております。

"困った de Q" 第4回 (ユーザから寄せられる Q and A です)

Q.ゲノム配列,mRNA,またはアミノ酸配列を登録する際に,特有の名称を記載することは可能でしょうか?また,DDBJ へ登録すると,遺伝子名も公式に命名されたことになりますか?

A. 遺伝子名,locus 名は "gene qualifier" へ, mRNA 転写産物名,翻訳産物名はそれぞれmRNA,CDS feature の "product qualifier" への記載は可能です。 アミノ酸モチーフの名称の場合は,適切な記載方法はありませんが,misc_feature の "note qualifier" へ記載することは可能です。

しかし,DDBJ へ特有の名称を登録しても,それぞれの生物または生物群を研究するコミュニティに,その命名が受け入れられる保証はありません。

DDBJ は,遺伝子命名に関する権限は持っていません。また,特定の遺伝子命名管理団体との公式な協調も行っておりません。特に問題がない限り,登録者の意向に基づいて記述しています。

  参照: DDBJ の遺伝子命名に関する考え方データの優先権


遺伝子命名などは,それぞれの研究コミュニティの扱う領域になります。
例えば,ヒトならば HUGO Gene Nomenclature Committee (HGNC), マウスならば MGI - Mouse Nomenclature などへご相談下さい。

DDBJ アノテータの業務紹介 〜 3.大量登録システム(MSS) の利用(前編)

ユーザーの皆様にDDBJ の業務内容を知って頂き,より身近に感じて頂くためにDDBJ アノテータの仕事をリレー連載コラムで紹介します。


  大量登録システム(MSS) の利用(前編)
DDBJ アノテータ 大城戸 利久

1. 初めに
私はまだが勤務する前の時期でしたので,設立に関して詳細はわかりかねますが,DDBJ 内部で保存されている活動の歴史を見ると,1998年10月に大量登録部を開設した,と記録されています。 当時の大きなトピックは,日本の研究機関もメンバーの一員であった国際ヒトゲノムシーケンシングコンソーシアムからヒトゲノム配列データが,大量に産生されている時期でした。INSDC がデータの登録・公開の中心的な機関となり,DDBJ も当然のことながら,その一翼を担うこととなりました。 シーケンシング技術も日進月歩で進み,ゲノムなどの長大な配列,或いは転写物配列の大量登録が予想され,大量登録部設立の動機付けになったのかもしれません。
大量登録部の設置から10余数年,シーケンサを含む解析技術の発展,学術的知見の蓄積など生命科学研究の状況が変化するのに伴い,DDBJ は大量登録システム(MSS) を通じて様々なタイプのデータを受け付けてきました。 その例としてヒトイネカイコメダカ 等の大規模なゲノム配列や,マウスカニクイザルトマト における大量の転写物配列の登録など,日本発,或いは我が国の貢献が大きい国際協調プロジェクトより生み出された配列の登録が挙げられます。
本コラムではMSS における登録・受付の実態を,『登録方法と流れ』と『データ査定』 に分けて紹介します。今月は『登録方法と流れ』 に関連した話しです。

2. MSS を用いた登録方法
A) MSS への入口
初めて利用される方は登録方法の概略が説明されていますので,「Mass Submission systemとは?」 を訪れて下さい。また,このページから登録の申し込み画面(大量登録システム利用申し込み) に移動できます。申し込みページに移動しますと多数の入力項目が出てきますが,先ずは必須項目に適切な情報を入力して下さい。全ゲノム規模のデータですと,更に複数の入力項目がありますので,可能な限り多くの情報を入力し,申し込みを行って下さい(図1.登録依頼)。
申し込みを受領すると,アノテータが記載内容を読み,査定や受付方針を大まかに推定・判断します。次いでアノテータは,登録の方法やツールの利用案内に関するメールを登録者宛に送信します(図1.返信:仮登録依頼)。登録に必要なドキュメント類,サンプルファイルを一読していただく共に,DDBJ で開発した登録ファイルのチェックツールをダウンロードし,登録ファイルの作成を進めて下さい。

mss

  図1.大量登録の流れ

B) 登録ファイルの作成 -SAKURA との違い-
INSDC は,核酸の塩基配列並びに付随する情報(アノテーション)をエントリとして格納するデータベースです。各々のエントリは,それぞれ複数の要素から構成されており,一定の構造や関係性を有しつつ保存されています。
SAKURA の登録ではWeb 画面を通して,1エントリ毎に「塩基配列」と「アノテーション」 を入力していき,データベースに格納されていきます。
一方,大量登録システムは図1 でも示されている通り,登録者がテキスト形式で登録ファイル(「塩基配列」と「アノテーション」)を作成し,DDBJ に送付していただく方法を採用しています。「塩基配列」 はFASTA 形式ですので,なじみのある方も多いとと思いますが,「アノテーション」 は多少,特殊なフォーマットであると思うかもしれません(図2)。

mss2

  図2.アノテーションファイル (例:タンパク質コード領域を含むヒトmRNA配列の登録)

MSS では,登録者から様々な登録データが送られてきますが,登録ファイルの受け付けに関して我々データベース側は,“データベースに投入することが可能なフォーマットを登録者の皆さんに提示し,その形式に基づいて作成されたファイルを使用して登録データを受け付ける” というスタンスに立っています。
現在,DDBJ は登録ファイルの作成ツールを提供しておりませんが,登録ファイルのチェックツールを提供しています。このチェックツールは,ファイルが正しい形式で作成されているか,Feature,Qualifier が適切に使用されているか,などのチェックを行います。また,タンパク質翻訳が行われるCDS フィーチャに対しては,翻訳エラーの有無について調べます。この翻訳チェックツールはconceptual な翻訳のみならず,特殊な翻訳 (リボゾーマルスリッページミトコンドリアゲノムにおけるmRNA へのアデニン付加によるストップコドンの生成 など)に対してもチェック可能ですので,ファイルの送付前にご利用下さい。
ファイルの作成にご苦労をされるかもしれませんが,我々としては登録者の方々にご協力と理解をお願いする次第です。現在稼働中の受付形態をどう改良するのかは,今後の課題です。

C) データの送受方法
登録ファイルの授受には,電子メール或いはFTP を使用します。昨今は,数千件程のEST やGSS,全ゲノム規模データなども圧縮後の登録ファイルを電子メールで送付可能です。しかしながら,受信可能な容量制限を超えたメールが送信されますと,受信側のサーバから送信者宛てに「受信できませんでした」 という旨のメールが返信されます。メールでデータを送付したものの,しばらく(概ね2-3業務日)経過してもDDBJ の担当者から何も返事がない場合には,メールが不達になっている可能性がありますので,大量登録の窓口宛てにご連絡を下さい。
登録件数が数万件以上のような大規模データの場合には,ファイル送付専用のFTP サイトを提供しています。利用を希望される時は大量登録の窓口宛てにご連絡を下さい。

D) 査定手順
詳細は次回以降に説明しますが,ここでは基本的な事柄を紹介します。査定方法は原則的にSAKURA での登録データと変わることはなく,FT-Doc に記載されたルール並びにDDBJ の内部規定による査定方針に従い,データを精査していきます。ファイルのフォーマットチェックを初め,『必要な Feature とQualifier を適切に使用しているか』,『具体的な内容が正確に入力されているか』 の確認後,不適切な入力内容の修正や削除依頼,さらには追加情報の提供・記載等を求めつつ,登録者との間で確認を行いながら進めていきます。

E) アクセッション番号発行・データの公開と非公開
データベースに登録可能なファイルを受領しますとアクセッション番号の発行作業を実施します。アクセッション番号は主に電子メールで登録責任者(コンタクトパーソン)に通知し,一連の登録作業は完了します。
登録者からの要求に従い,即日公開作業を開始する,或いは一定期間データの非公開の処理を行いますが,アクセッション番号発行後のデータの更新や公開依頼は,Update 係で受け付けますので,連絡先をお間違えないようにお願いします(登録データの修正・更新)。

後編へつづく
ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,配信を希望される方に送らせて頂きます。
配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。
発行:日本 DNA データバンク(DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111