HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 57   2011年2月1日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
北国街道
tako

1月17-18日,「DDBJing 講習会(23) & PDBj 講習会」が長浜で行われました。
長浜は,琵琶湖の北東岸に位置し,長浜城の城下町として栄えました。 元々は「今浜」と言われていた地を,豊臣秀吉が織田信長の「長」をとり「長浜」に改名したと言う,歴史が刻み込まれた町です。
時代を経て,北国街道や琵琶湖交通の要衝の地として,商人をはじめ多くの人々が集まりました。 参勤交代の際には,福井藩から南の大名がこの街道を通り,江戸へ向う途中の重要な宿場町でした。 長浜では現在も古い街並みが残り,旧街道を感じることができます。 黒漆喰で塗られた黒壁の建物や舟板塀や虫籠窓などが街道沿いを連ね,タイムスリップしたような気持ちになれます。

DDBJ メールマガジン第57号 web 版です。

Nucleic Acids Research に DDBJ に関する論文掲載

Nucleic Acids Research では,毎年データベース特集号が発行されています。2011年1月発行の Vol. 39, Database Issue に,DDBJ の活動に関連する下記の論文が掲載されました。

"The International Nucleotide Sequence Database Collaboration"
Guy Cochrane, Ilene Karsch-Mizrachi, and Yasukazu Nakamura on behalf of the International Nucleotide Sequence Database Collaboration.
Nucleic Acids Research, 2011, Vol. 39, Database issue D15-D18

"The Sequence Read Archive"
Rasko Leinonen, Hideaki Sugawara, and Martin Shumway on behalf of the International Nucleotide Sequence Database Collaboration.
Nucleic Acids Research, 2011, Vol. 39, Database issue D19-D21

"DDBJ progress report"
Eli Kaminuma, Takehide Kosuge, Yuichi Kodama, Hideo Aono, Jun Mashima, Takashi Gojobori, Hideaki Sugawara, Osamu Ogasawara, Toshihisa Takagi, Kousaku Okubo, and Yasukazu Nakamura.
Nucleic Acids Research, 2011, Vol. 39, Database issue D22-D27

DAD リリース 54.0 完成

DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。
2011年1月14日に DAD リリース 54.0 が完成しました。
詳細は,DAD Release Note をご覧下さい。 FTP によるデータの取得は,FTP・WebAPI のページ より可能です。

公開日: 2011年1月14日
エントリ数: 18,867,995   総アミノ酸残基数: 5,305,737,486aa
現在公開されているリリースの情報

FTP の dra ディレクトリの構成変更

FTP の /ddbj_datababase/dra 配下に "fastq" と "sralite" ディレクトリを新設しました。
これまで /dra 直下に置かれていたデータは今後は "fastq" に配置され,"sralite" では新たに SRA lite 形式のデータを提供します。 SRA lite は 塩基配列+Quality value データを含んでおり,SRA toolkit で fastq や fasta ファイルを抽出できます。
ddbj_database 以下の構成の詳細は,同ディレクトリ内の README.TXT をご参照下さい。 定期監視されている場合は, お早めの変更をお願いいたします。

「DDBJing 講習会(23) & PDBj 講習会 in 長浜」 終了
nagahama

DDBJ では全国各地で「DDBJing 講習会」を開催しています。 DDBJing 講習会は,塩基配列の登録方法や DDBJ が提供しているデータベース検索・解析サービスをユーザの方々により深く理解して利用して頂く助けになることを目指しています。
1月17-18日, 長浜バイオ大学 にて 「DDBJing 講習会(23) & PDBj 講習会 in 長浜」を開催しました。講習会で使用した資料は ダウンロードページ から取得できますので,どうぞご利用下さい。

次回の開催はまだ未定ですが,開催に関するお知らせはこのメールマガジンとホームページ上でご案内いたします。また,開催のご要望がありましたら検討いたしますので,お問い合わせ の「講習会」よりご連絡願います。

大量データの公開

DDBJ が登録を受付け,2010年12月から2011年1月にかけて DDBJ/EMBL-Bank/GenBank 国際塩基配列データベースから公開した大量データは以下の通りです。



かずさ DNA 研究所が登録したバイオ燃料作物, ナンヨウアブラギリ(Jatropha curcas) の全ゲノム と cDNA の配列データが公開されました。

参考 URL:
アクセッション番号 (Anonymous FTP 一括取得ファイル名) は以下の通りです。


Korea Research Institute of Bioscience and Biotechnology から登録された肝吸虫 (Clonorchis sinensis) の EST データが公開されました。

アクセッション番号 (Anonymous FTP 一括取得ファイル名) は以下の通りです。


海洋研究開発機構から登録された未培養好熱性アーキア (Candidatus Caldiarchaeum subterraneum) のゲノム配列が公開されました。

参考 URL: http://www.jamstec.go.jp/j/about/press_release/20101216/

アクセッション番号 (Anonymous FTP 一括取得ファイル名)  は以下の通りです。

「ユーザーの皆様へ,お願いです!」 〜 その4.登録したいデータの量が多くて困った時のヒント集

実験結果も着々と蓄積し,「あとは論文にするだけ」とほっとするのもつかの間, 「その前にアクセッション番号を取得しなくては!時間がな〜い。」 そんな経験はおありでしょうか。近年,配列決定のスピードアップやコストダウンがはかられ, 大量の配列データを保持されている研究者の方が増えているようです。 DDBJでは, 独立に配列が決定された結果については,すべて登録して頂く事を推奨しています。 今回は,一度に多数のデータにアクセッション番号を発行する ”大量登録 システム(MSS)”と, 登録データ量が多い場合に役立つヒントなどをご紹介いたします。


DDBJ は,The International Nucleotide Sequence Databases Collaboration(INSDC ) を構成する primary database ですので,すべての塩基配列について, その配列が受け入れ基準を満たしており,これを広く一般に公開することを目的とするならば,学術論文の投稿予定の有無に関わらず登録を受けつけ, アクセッション番号を発行しています。

参照:DDBJ に登録可能なデータ

DDBJ では,データ登録用入力システムとして,SAKURA システム大量登録システム(MSS)を用意しております。
SAKURA は,1エントリ単位で,対話型入力システムです。
MSS は,EST, WGS, 全ゲノム規模などの登録をする場合に多くの方が利用していますが, 「事前に一部データをサンプルとして提示して頂き,アノテーション内容(入力事項)をどのように記載するべきかなど, 登録者とDDBJ 担当者との間で事前調整をした後に,全データについての,登録用ファイルを電子メールまたは ftp でお送くり頂く」方式となっています。

MSS で使用する登録ファイル作成には,少々コツが必要ですが,一度作成して頂けば, 同じ要領で何度でも大量データを登録する事が可能ですので,非常に便利なシステムになっています。 (SAKURA で連番登録実行時に,登録件数が多くなり過ぎ,途中で何がなんだかわからなくなってしまった経験をお持ちの方は, MSS 利用が向いていると考えられます)

時々,ご依頼の中に「登録件数が確定していますが,うまく登録ファイルを作成できません。アクセッション番号の予約をしてもらえないでしょうか」 というものがあります。
大変申し訳ありませんが,アクセッション番号の予約発行はできません。 必ず登録ファイルを作成して下さい。アクセッション番号発行可能なファイルを頂いた後に番号を発行します。 ファイル作成がうまくできないでお困りの場合には,こちらでサポートする事も可能ですので利用申し込み後にどうぞご相談下さい。

SAKURA とMSS,どちらでもお好きな方をご利用頂けますが,「500,000 bp より大きい配列」 「WGS」「MGA」 については,MSS のみで受け付けております。

実際の登録にあたり, ご自身のデータをどう登録するのがふさわしいのかわからない,とお悩みの方は お問い合わせ から,どうぞお気軽にご相談下さい。

以下では,過去にありました質問の一部を記載しています。


Q1. 原核生物の16S rRNA のみからなる配列の登録では,順鎖側または逆鎖側のいずれで登録すべきでしょうか?

A1. 原核生物の 16S rRNA のみの配列の場合は,順鎖側の配列をご登録下さい。

確認方法:BLAST のページで検索対象データベース欄から, 塩基配列データベースとして 16S rRNA (Prokaryotes) を選択して,実行します。


Q2. 海水や土壌などの「環境から取得したデータ」の生物名はどのように登録すればよいですか?

A2. 海水や土壌などの「環境フィールドから,生物種の単離・培養の過程を経ず,PCR, DGGE あるいは,その他の方法で直接, 分子を単離・決定された塩基配列」は,環境サンプル(environmental sample) としてご登録をお願いします。 しかし,同じく環境フィールドからサンプルが得られた場合でも, サンプルから単離・培養されている個体(群)から配列が得られた場合,環境サンプルとは扱わず, 配列の由来種の生物名(学名)でのご登録をお願いします。


Q3. The Barcode of Life Data Systems(BOLD) に登録予定または登録済みのデータ はどのように登録すればよいですか?

A3.The Barcode of Life Data Systems(BOLD) に登録予定のデータについては,塩基配列は,SAKURA または MSS へ, 波形データは,DDBJ Trace Archive (DTA) へ登録して下さい。

MSS 利用者のうち,一部の方では下記の図にあります DDBJ Trace Archive (DTA), DDBJ sequence Read Archive(DRA) の両方に登録して頂く場合がございます。

*1)SRA:NCBI Sequence Read Archive/ ENA Sequence Read Archive
*2)Trace Archive:NCBI Trace Archive/ ENA Trace Archive


Q4. DDBJ Trace Archive(DTA) とはどのようなデータベースでしょうか? DDBJ sequence Read Archive(DRA) とはどのようなデータベースでしょうか?

A4. DTA は,キャピラリ式シークエンサからの出力自体(シングルパスリードの DNA sequence chromatograms (traces), base calls, quality estimates)を登録するためのデータベースです。 DRA は,Roche 454 GS System®, Illumina Genome Analyzer®, Applied Biosystems SOLiD System® などの, いわゆる次世代シークエンサからの出力データのためのデータベースです。


Q5. 次世代シークエンサによって配列決定されたmRNA の配列は,どのように登録すればよいですか? 次世代シークエンサによって配列決定されたゲノム配列は,どのように登録すればよいですか?

A5. 次世代シークエンサによって配列決定されたmRNA 配列は,原則 DRA に登録をお願いします。 従来のEST などとは区別しておりますので,MSS では登録を受け付けておりません。

次世代シークエンサによって配列決定されたゲノム配列は, raw reads data については, DRA への登録をお願いします。( 必須ではありませんが, 強く推奨します)

raw reads data を加工した配列およびアノテーションが付加された配列は,MSS から登録をお願いします。 ドラフト配列の場合は,WGS, scaffold CON となりますが,完成度の高いゲノム配列は通常(general) データとして登録できます。

アンケートへご協力下さい

アンケートは終了しました。

ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,配信を希望される方に送らせて頂きます。
配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。
発行:日本 DNA データバンク(DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111