
東北地方太平洋沖地震で,震災に遭われた多くの方々へ,心よりお見舞い申し上げます。
政府および東京電力からの震災に伴う節電の呼びかけに呼応し,2011年3月14日より国立遺伝学研究所 大型計算機(supernig),
相同性検索サービス,DDBJ read annotation pipeline,GIB,MiGAP を停止しています。
また,上記以外のサービスについては計画停電のスケジュールに合わせて停止しています。
サービス停止のお知らせは,決定次第 HP,
Twitter にてお知らせいたします。
ユーザの皆様にはご不便をお掛けしていますが,ご理解とご協力をお願いいたします。
今後ともDDBJ をよろしくお願いいたします。
DDBJ メールマガジン第59号 web 版です。
DDBJ が管理・収集している塩基配列データベースは,リリースとして定期的に年4回オンライン上で公開しています。
2011年3月30日に DDBJ リリース85.0,DAD リリース 55.0が完成しました。
詳細は,DDBJ Release Note,
DAD Release Note をご覧下さい。
FTP によるデータの取得は,FTP・WebAPI のページ より可能です。
-
DDBJ リリース 85.0
- エントリ数:132,302,771 塩基数: 124,516,775,718
- 現在公開されているリリースの情報
- エントリ数:19,723,681 総アミノ酸残基数: 5,576,482,211aa
DAD リリース 55.0
日本特許庁(JPO) と韓国特許庁(KIPO) に由来する配列データにおいて,
フラットファイルのDEFINITION 行の先頭に特許公報番号と配列番号を付加する修正を実施しました。
DEFINITION 行の修正例:
(Old format)
DEFINITION Genetic Makers Expressed in Tumors.
(New format)
DEFINITION JP 2010599999-A/1: Genetic Makers Expressed in Tumors.
修正後のデータは,以下で取得が可能です。
(塩基配列データ)
DDBJ リリース85.0 で公開しています。
塩基配列データの修正後の内容は順次,getentry,ARSA,BLAST では修正データが反映される予定です。
Patent file name: ddbjpat**.seq.gz
**: file number
(アミノ酸配列データ)
DDBJ anonymous FTP サイトで公開しています。
アミノ酸配列データは,getentry,BLAST で修正データが反映されています。
JPO ファイル: jpo_ddbj_aa.seq.gz
KIPO ファイル: kipo_ddbj_aa.seq.gz
4月2日(土)に開催を予定していました 「2011年度 国立遺伝学研究所 一般公開」 は, 震災の状況を考慮し,中止となりましたことをお知らせいたします。 何卒皆様のご理解をお願い申し上げます。
農業生物資源研究所 から登録されたアフリカイネ (Oryza glaberrima) 由来の GSS データ 437,642 エントリが公開されました。
アクセッション番号 は以下の通りです。
・FT434720-FT654719 (220,000 entries) 3月24日の新着データ
・FT654720-FT872361 (217,642 entries) 3月25日の新着データ
農業生物資源研究所 から登録されたオオムギ (Hordeum vulgare subsp. vulgare) 由来の full length cDNA 配列データ 23,614 エントリが公開されました。
アクセッション番号 は以下の通りです。
・AK353559-AK377172 (23,614 entries)
これらは3月18日分の新着データとして DDBJ より公開されております。
農業生物資源研究所 から登録されたイネ (Oryza sativa Japonica Group) 由来の GSS データ 59,716 エントリが公開されました。
アクセッション番号 は以下の通りです。
・FT872362-FT932077 (59,716 entries)
これらは2月25日分の新着データとして DDBJ より公開されております。
Q.今回投稿する雑誌の規程では,塩基配列を必ず登録するよう記載がありませんが,登録の必要があるのでしょうか。
A.
多くの雑誌では学術論文の投稿に先立って,塩基配列を国際塩基配列データベース(International Nucleotide Sequence Database; INSD)
に登録し,アクセッション番号を取得した上で,その番号を当該論文に記載することを義務付けています。
DDBJ は,EMBL-Bank とGenBank と共同でこの国際塩基配列データベースを構成するデータバンクの1つです。
論文の投稿規程に塩基配列登録の指定がない場合でも,読者の利便性を高めるという視点から,
DDBJ を含む国際塩基配列データベースへ登録して頂きますようお願いいたします。
参照:「塩基配列登録の前に」
「塩基配列の登録」
また,塩基配列データだけではなく,シークエンサからの出力データは,
DDBJ Sequence Read Archive(DRA),
DDBJ Trace Archive(DTA) へ登録して頂きますようお願いいたします。
ユーザーの皆様にDDBJ の業務内容を知って頂き,より身近に感じて頂くためにDDBJ アノテータの仕事をリレー連載コラムで紹介します。
SAKURA での登録(後編)
前編 からのつづき
5)DDBJ の注釈規範
査定のためのもう一つの指針が,DDBJ の注釈規範です。
DDBJ/EMBL-Bank/GenBank は連携しINSD を構築していますが,3極は独立して構築・運営されており各極それぞれの内部規範があります。もちろんそれぞれの内部規範は,INSDC を逸脱するものではなく,その範囲内にありますが,FT-Doc に抵触しない部分は,それぞれの内部規範に基づき各データベースが構築・運営されています。
注釈規範はSAKURA/MSS 担当のアノテーターが協議・作成・改訂してきたもので,常にアノテータ全員で共有し,DDBJ としての統一した査定となるように勤めており,一部はDDBJ HP で公開しています。
参照: DEFINITION,REFERENCE 1,REFERENCE 2
6)査定例
簡単な査定例をご紹介します。SAKURA から以下のようなエントリが登録されました。インフォマティブな内容ではありませんが,SAKURA で一次チェックを経ていますのでシンタックスエラーもありません。しかしながらこのデータには何点か修正を加える必要があります。
【1】 コンタクトパーソンへの問い合わせ
① 〜 ⑤ はFT-Doc. に,⑥ はDDBJ の注釈規範に基づく確認点で,これらについての問い合わせを私たちがコンタクトパーソンにメールで行います。
① /product
相同性検索(内部専用blast)等で確認したところ,Bacillus の16S rRNA の部分配列です。その場合はrRNA Feature に/product=”16S rRNA” を記載します。
参照: 登録の見本
② /molo_type
ゲノムDNA 上のrRNA 遺伝子の配列を決定している場合には,/mol_type は”genomic DNA” を指定します。/mol_type=”rRNA” は,rRNA を直接単離,RT-PCR などでrRNA を標的として増幅し配列決定したなどの場合に指定します。
③ 配列
相同性検索(内部専用blast)によると,配列が逆鎖側です。16S rRNA データの場合には,順鎖の配列を登録します。
参照: BLAST
④ /organism
環境サンプルでない場合,”Bacillus sp.” のように種名が未確定のorganism には,名称を一意に保つことを目的として,下位の rank (/strain, /isolate, /clone, etc) を並記します。
参照: 種が同定されていない場合
⑤ /isolation_source 等
/isolation_source(分離元情報の補足的自由記述),/country(採集地名),/collection_date(採集日)等があればsource に記載します。
⑥ 登録者
登録者がMishima,H. さん一人です。当該データについて,将来的に連絡が取れなくなることなどを避けるために,実作業者と研究指導者,最低でも2人以上の連名記載を強く推奨しています。
参照: 塩基配列データの登録に必要な情報
【2】 修正作業
回答をもとにTSUNAMI 他で登録作業をすすめます。
① “Bacillus sp. MH-2011” はtaxonomy database に未登録ですので,登録申請を行います。通常は1〜2日で登録されますが,問題があればTaxonomy database 担当からの依頼で,コンタクトーパーソンに再度メールで問い合わせを行います。
参照: Organism qualifier に記載する生物名
配列と/mol_type を修正し,登録者と,/product 等Qualifier を追記し,公開可能な内容(以下)まで修正を加えます。TSUNAMI にはFT-doc,内部注釈規範にもとづくチェック機能があり,これにより私たちは最終的に内容を確認しています。
② アクセッション番号を発行しコンタクトパーソンに通知します。
③ 即時公開データは公開作業を行い,一定期間非公開指定のデータは登録完了とします。
④ 即時公開データの公開を確認します。
ここまでが,私たちSAKURA 登録担当のアノテータのおおよその仕事です。
今回の査定例は簡単なものですが,実際には対象データは多岐に渡りますので,それぞれのデータを適切に査定するためには,何度も登録者と問い合わせ・確認作業を繰り返すことも多々あります。登録者への問い合わせは,担当アノテータが個別にメールで対応していますが,査定専用のグループメールアドレスを使い,常に情報共有を図っています。
7)登録の見本
残念ながら現状は,登録データの大多数には何らかの修正の必要があり,多くの場合,登録者への問い合わせも行っています。SAKURA の各入力画面の説明を分かり易く充実させ,皆様により簡易にご登録いただけますように,現在もSAKURA の改良を重ねております。迅速にアクセッション番号をお知らせし,データを公開する事が私たちアノテータの願いです。再度のお願いとなりますが,SAKURA の各入力画面の説明や登録の見本等を十分ご覧いただいた上で,ご登録をお願いいたします。またSAKURA についてお気づきの点などございましたら,是非お知らせ下さい。ご登録をお待ちしております。
お問い合わせ(SAKURA について)
アンケートは終了しました。

配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540 静岡県三島市谷田1111
