HOME > Hot Topics

次世代シークエンサからの生データとアセンブルしたデータセットの公開

DDBJ Sequence Read Archive (DRA) は,次世代シークエンサからの出力データのためのアーカイブです。次世代シークエンサからの出力データは,出力したままの“生”データを DRA に,アセンブルしアノテーションした配列データを DDBJ に登録します。DRA は2008年から活動を開始し,NCBI Sequence Read Archive (SRA)EBI European Read Archive (ERA) との国際協力のもとデータベースを運営しています。下記の図をご参照下さい。


このたび,DRA と DDBJ から生データとアセンブル後のデータセットを2件公開しました。

 慶應義塾大学 榊原研究室 から登録された納豆菌 (Bacillus subtilis subsp. natto str. BEST195 ) ゲノム配列の生データが DRA から,アセンブルした配列データが DDBJ からそれぞれ同時に公開されました。この登録が,DRA と DDBJ から生データとアセンブル後のデータセットが公開された初のケースになります。

 DRA アクセッション番号: DRA000001
  ・DRA000001 データのダウンロードは Anonymous FTP サイトをご利用下さい。

 アセンブル後のゲノム配列データは DDBJ から以下のアクセッション番号で公開されています。
  ・ゲノム配列: AP011541
  ・プラスミド pBEST195S の配列: AP011542

 農業生物資源研究所 QTLゲノム育種研究センター から登録されたイネ コシヒカリ (Oryza sativa Japonica Group, cultivar Koshihikari ) ゲノム配列の生データと配列データが公開されました。

 DRA アクセッション番号: DRA000010
  ・DRA000010 データのダウンロードは Anonymous FTP サイトをご利用下さい。

 アセンブル後のゲノム配列データは DDBJ から以下のアクセッション番号で公開されています。
  ・WGS: BABO01000001-BABO01654543 BABO.gz (654,543 entries)
  ・scaffold CON: DG000025-DG000036 Oryza_sativa_Japonica_Group_CON_100402_1.seq.gz (12 entries)

 関連アナウンス: イネ コシヒカリ (Oryza sativa Japonica Group, cultivar Koshihikari) WGS 654,543 エントリの新規公開 2010.4.5


DRA はこれまでに登録191件を受け付け,23件を公開してきました。DRA から公開中のデータは データ公開サイト から閲覧可能です。
今回のトピックではゲノム配列データのみ紹介しましたが,DRA はトランスクリプトーム解析や DNA-タンパク質間相互作用解析,small RNA 検出,DNA メチル化解析等のデータも受け付けています。次世代シーケンサの普及に従いデータ登録の増加が予想されており,DRA は受付の効率化を進めております。

*DDBJ Read Archive は DDBJ Sequence Read Archive に名称を変更いたしました。詳細は こちら をご覧下さい。



2010年4月8日