DDBJ リリース 119.0

DAD (DDBJ amino acid database) リリース 89.0

  • 公開日:2020年3月24日
  • エントリ数:110,528,765 総アミノ酸残基数(aa):34,722,270,677
  • DAD Release Note
*anonymous FTP site の directory 構成変更のお知らせ
アクセッション番号の書式拡張に伴い、bulk sequence data には 6文字の prefix を持つアクセッション番号の割り当てが開始されています。 このようなデータを提供していくために anonymous FTP site の directory 構成を変更いたしました。6文字のプレフィックスの場合、ファイルは、最初の2文字のディレクトリの下にあるアクセッション番号のプレフィックスの3番目と4番目の文字にちなんで名付けられたサブディレクトリに分割されます。
例:WGS データを格納する directory の構成

ddbj_database/wgs/WGS_ORGANISM_LIST.html
                 /WGS_ORGANISM_LIST.txt
                 /AA/AA/AAAABA.gz
                 /AA/AA/AAAABB.gz
                 /AA/AA/AAAABC.gz
                 /:
                 /AA/AAAA.gz
                 /AA/AAAB.gz
                 /AA/AAAC.gz 
*GenBank と ENA からの bulk sequence data 読み込み遅延のお詫び
今回のリリースでは、以下の理由により、大量の bulk sequence data が欠落しています。
  • 非常に大規模な配列データが GenBank と ENA から来た
  • DDBJ はアクセッション番号の新フォーマットにまだ対応していない
問題を解消するため作業を進めていますが、bulk sequence data のすべてがいつ読み込めるか不明です。
ご不便をおかけして申し訳ありませんが、ご理解いただきますようお願い申し上げます。
</dt>