HOME > レポート・統計 > メルマガ
DDBJ メールマガジン
No. 53   2010年9月30日発行
apply 申込・変更    top 最新号 top    backnumber 過去の号    ddbj 発行:DDBJ
ゆで落花生
rakkasei

落花生の収穫時期を向かえています。
落花生(学名:Arachis hypogaea)は,マメ科ラッカセイ属の一年草です。 夏に黄色の花を咲かせ,花が終わると子房の先端が伸び,地中にもぐって結実します。文字通り「花が落ちて実が生まれる」ことから"落花生"という名前になったのですね。
落花生の産地では千葉県が有名ですが,栽培に適している火山灰地の静岡県でも生産が盛んです。 一般的には炒って乾燥した落花生が流通していますが,「ゆで落花生」発祥の静岡県では,なまの落花生を塩茹でして食べるのがこの時期の風物です。 たっぷりのお湯で1時間ほど茹でると,さやの中の豆が柔らかくなり,コクが出て大変甘く,一度食べると止まらない美味しさです。

DDBJ メールマガジン第53号 web 版です。 メールマガジンに関するご意見やご質問がありましたら ddbjmag@ddbj.nig.ac.jp までお願いします。

平成22年度下期DDBJオープンシステムプロジェクトの募集

日本DNAデータバンク(以下 DDBJ) では,次世代シーケンサの出現にともなう計算機需要の急激な高まりに対応し, DDBJ が所有する「解析サーバ PC クラスタ(ホスト名 an200)」を所内外の研究者に利用頂くため, 以下の要領で平成22年度下期「DDBJオープンシステムプロジェクト」を募集いたします。

この研究プロジェクトでは,研究者自身に大規模計算機環境を提供し,様々なデータ解析,シミュ レーションや,バイオ関連のプログラム開発,高速化に関する試用にお使頂く事が可能です。
研究プロジェクト期間中は最大48ノード(192コア)を無償でご利用できます。

なお,応募が多い場合は,分割利用になる可能性もございます。 また,応募状況に応じて,今後オープンシステム計算機環境の拡張を検討する予定です。

1. 研究プロジェクトの対象

本研究プロジェクトの対象となる研究は「最大48ノード(192コア)」を使用する大規模計算を 大量に行う研究を対象とします。(上記ノード内での分割提供も可能です)

2. 応募資格

申込者(代表者)は「国内の大学に所属する研究者,公共機関に所属する研究者」に限定します。
研究グループのメンバーは,情報・システム研究機構国立遺伝学研究所 DDBJ 塩基配列データベース等利用規規約 に準ずる有資格者,すなわち:

  • 国内の大学に所属する学生・研究者
  • 公共機関に所属する研究者
  • 企業に所属する研究者,技術者

でなければなりません。

3. オープンシステムプロジェクトの要件

①研究期間は平成22年10月20日〜平成23年3月31日の間とします。
  (以降についても同様の募集を予定していますが,詳細についてはあらためて公表します)
期間中は,最大48ノード専用システムを無償でご利用できます。

4. 応募締切

平成22年10月15日(金)(必着)

5. 審査方法

応募課題は,DDBJ により採否を審査し,結果の公表を行う予定です。平成22年10月18日(月)(予定)までに採否を申込者(代表者)にご連絡いたします。審査にあたり応募課題について代表者に問い合わせを行なうことがあります。また,利用環境,利用期間等について調整させて頂く場合があります。

6. 応募方法,問い合わせ先

応募は申込書類にご記入頂き電子メールに添付してお送り下さい。申込および問い合わせは, DDBJオープンシステムプロジェクト受付(下記)までお願いします。


DDBJオープンシステムプロジェクト受付〜 E-mail:opensystem@ddbj.nig.ac.jp

7. 申込に必要な項目

所定の書式にご記入頂き,電子メールにてお送り下さい。書式(pdf,MS-WORD )は以下 よりダウンロードできます。

arrow平成22年度下期DDBJオープンシステム (PDF FILE)
arrow平成22年度下期DDBJオープンシステム (Word 形式)
①申込年月日
②申込者(代表者)情報(所属,職名,電話,E-mail,連絡先住所)
③オープンシステムプロジェクト課題名
④オープンシステムプロジェクトの概要
⑤プログラム概要,必要な計算機資源,特記事項 等

なお,採択されたプロジェクトについては,DDBJ ホームページ等で申込み内容を公表させて頂く場合がありますので,ご了承願います。

8. 利用できる計算機について

オープンシステムプロジェクトで利用できる計算機の概要を以下に示します。

arrow1ノードあたりのスペック(最大48ノード)
CPU Xeon(2Core) 3.00GHz × 2
メモリ 8Gbyte
ネットワーク 1000Base-T
内蔵ディスク 147Gbyte
OS Red Hat Enterprise Linux 4.6 ES (EM64T)
HPC 開発/実行環境 富士通 Parallelnavi NQS
Sun Grid Engine V6.2 update6
arrowノード間共用ディスク領域
ディスク容量 5TB 程度 (5TB 以上の利用については応相談)
  • 計算機ハードウエア資源以外に必要となるソフトウエア類については,利用者側にてご用意(インストール)頂く事になりますのでご了承下さい。
  • Sun Grid Engine につきましてはインストール時の最新バージョンでインストールを予定しておりますので,掲載バーションが変更される可能性がありますのでご了承下さい。
  • Sun Grid Engine につきましてはフリーソフトウエアとなっており,サポート対象となりませんのでご了承下さい。

2010年9月22日    opensystem@ddbj.nig.ac.jp

SAKURA でのテンプレートの削除について

SAKURA は DDBJ が運用している WWW 経由の塩基配列データ登録システムです。塩基配列や,その生物学的な機能と特徴,参考文献,登録者の氏名や所属などの情報をを対話形式で入力し登録することが可能です。SAKURA は 1995年に公開されましたが,国際実務者会議での決定や,登録データの変化などに対応して継続的に改良され続けています。

この度,生物名入力画面の改善を行うこととなり,それに伴い以下の変更を行いますのでご注意下さい。

  実施日: 2010年10月26日(火)9:00頃
変更内容: (1) テンプレートの削除
これまで保存されているテンプレートを全て削除いたします。変更実施後はテンプレートを呼び出すことができなくなりますので,必要に応じて,テンプレートの内容をメモするなどの対応をお願いいたします。
(2) テンプレートの保存期間が「作成日より6ヶ月」に変更
新規に作成されるテンプレートについては,6ヶ月を経過したものは自動的に削除されます。
備考: (1) この変更に伴うサービスの停止はありません。
(2) SAKURA での新しい入力方法等については,変更実施後のSAKURA のヘルプページ等をご参照下さい。

ユーザの皆様にはご迷惑をお掛けいたしますが,ご理解とご協力をお願いいたします。

2010年9月30日

DDBJ リリース 83.0,DAD リリース 53.0 完成

DDBJ リリース 83.0
   エントリ数:124,079,491 総塩基数:117,728,717,442 DDBJ Release Note (Rel.83)
DAD リリース 53.0
   エントリ数:18,225,996 総アミノ酸残基数:5,103,235,346aa DAD Release Note (Rel.53)

DDBJ・DAD リリースならびに新着データの FASTA 形式変更

DDBJ が管理・収集している塩基配列データベースは,「DDBJ・*DAD リリース」として 定期的に年4回オンライン上で公開しています。 また,最新の DDBJ・DAD 定期リリースの締め日以降に公開されたデータは,「DDBJ・DAD 新着データ」として毎日公開されています。(*:DDBJ リリースデータをもとにしたアミノ酸配列データベース)

「DDBJ・DAD 定期リリース」ならびに「DDBJ・DAD 新着データ」の FASTA 形式に変更を行いました。詳細は以下の通りです。

変更のあったデータの種類 (全て anonymous FTP にて取得可能)

データの種類 変更内容 適用範囲
ddbj,ddbjnew/fasta 大文字 → 小文字 変換 DDBJ 定期リリース83 ならびに
DDBJ 定期リリース83締め日以降の新着データより
ddbj,ddbjnew/cdsdb エントリ末尾の「//」を削除
dad,dadnew/fasta DAD 定期リリース53 ならびに
DAD 定期リリース53締め日以降の新着データより

以下のサービスにも変更が生じました

データベースの種類 変更内容 適用範囲
getentry
DNA データベース
CDS アミノ酸配列 FASTA エントリ末尾の「//」を削除 DDBJ 定期リリース83 締め日以降
CDS 塩基配列 FASTA
PROTEIN データベース
アミノ酸配列 FASTA エントリ末尾の「//」を削除 DAD 定期リリース53締め日以降
塩基配列 FASTA (for DAD)
supernig
ddbj,ddbjnew/fasta大文字 → 小文字 変換 DDBJ 定期リリース83ならびに
DDBJ 定期リリース83締め日以降の
新着データより
dad/fasta エントリ末尾の「//」を削除 DAD 定期リリース53より

2010年9月15日

DAD リリースにおける FASTA ファイル不具合のお詫び

DDBJ が過去提供した DAD リリースにて FASTA ファイルに一部不具合が発生していたことが判明いたしました。詳細は以下の通りです。

対象: DAD リリース10, 18 〜 52 まで
状況:
  以下の容量を超える残基が正しく出力されていなかった
    (超過容量)
     DAD リリース10: 7,000残基超で問題が生じた
     DAD リリース18 〜 52: 30,000残基超で問題が生じた
  容量を超える残基サイズが FASTA コメント部分に正しく出力されていなかった
    (不正コメント例)
     CP000108-608|ABB27887.1|30030|Chlorobium ・・・
     →CP000108-608の残基サイズは "36805" が正しい
影響サービス: Anonymous FTP(DAD),大型計算機(supernig)
対応:DAD リリース53 では,不具合を修正したデータで公開しています

ユーザの皆様にご迷惑をお掛けいたしました事を深くお詫び申し上げます。

SAKURA,DDBJing 講習会の「統合 TV」公開

統合 TV は,ライフサイエンス統合データベースセンター(DBCLS) が発信する生命科学分野の有用なデータベース(DB)やウェブツールの活用法を動画で紹介するウェブサイトです。
この度,「SAKURA を用いた塩基配列登録の方法(基本編)」「AJACS & 第22回 DDBJing 講習会 in 東京」の解説動画が統合 TV より公開になりました。是非ご活用下さい。

togoTV-sakura  SAKURA を用いた塩基配列登録の方法(基本編)
SAKURA を用いた塩基配列の基本的な登録方法や注意点などを動画で分かりやすく解説しています。

[内容]
1. 登録者氏名とコンタクトパーソンの登録する
2. 論文に関する情報を登録する
3. 塩基配列の情報を登録する
4. 生物種の情報を登録する
5. CDS(タンパク質コード配列)の情報を登録する

SAKURA トップページ(左カラム下)からもリンクしています。


togoTV-ing  AJACS & 第22回 DDBJing 講習会 in 東京
2010年6月23-24日に行われた「AJACS & 第22回 DDBJing 講習会 in 東京」の講義を動画で公開しています。

DDBJing 講習会DDBJing 講習会資料ダウンロード のページからもリンクしています。


第23回国際実務者会議 報告

DDBJ, EBI, NCBI で構成される International Nucleotide Sequence Database Collaboration (INSDC) は,国際塩基配列データベース共同構築事業の運営・推進を図るために,国際実務者会議を年1回開催しています。

2010年は,5月19日-21日に EBI で開催され,国際塩基配列データベース (DDBJ, EMBL-Bank, GenBank, Sequence Read Archive, Trace Archive) を運営する上での実務的な問題を討論しました。当時,アイスランドの火山活動の影響で旅程が変更され,予定より短い会議となりましたが,多くの進展がありました。会議の報告は こちら です。

DDBJ での特許関連配列データの公開業務の紹介(3)

年々ユーザの関心が高まっている特許関連配列データの公開業務について,特許担当のダンディな(?)アノテータが連載コラムで紹介します。今回は,3回目になります。


第3回 DDBJ 検索サービスを使用した特許公開公報の確認方法
DDBJ アノテータ 青野 英雄
1. はじめに

今までの特許コラムでは DDBJ が公開を行っている 日本特許庁(JPO)韓国特許庁(KIPO) の塩基配列とアミノ酸配列の特許配列データの紹介を行った。今回のコラムでは,DDBJ 検索ツールを使用した特許データ検索方法,JPO データの公開フラットファイル(FF)に表示される公開番号を取得して *特許電子図書館(IPDL) で特許公開公報を検索する方法について紹介を行いたい。(*:特許電子図書館へリンクしています)

2. DDBJ 検索ツールを使用した特許データ検索

2-1)getentry
getentry では表1に示す様にアクセッション番号もしくは特許公報番号を指定することで,塩基配列データおよびアミノ酸配列データのエントリー検索が可能である。塩基配列データはアクセッション番号検索の他に,特許公報番号でも検索を行うことができる。特許公報番号の検索では JPO 以外に,KIPO,米国特許商標庁(USPTO)欧州特許庁(EPO) 由来データの検索が可能である。しかしアミノ酸配列データではアクセッション番号検索のみで,特許公報番号での検索は行うことはできない。

    表1:塩基配列/アミノ酸配列データの検索条件

    アクセッション番号 特許公報番号
塩基配列データ
アミノ酸配列データ ×

*各特許庁の特許公報番号の種類と検索に指定する入力フォーマットは,getentry の HELP を参照。

以下に特許公報番号検索,アミノ酸配列データ検索を行う際の getentry での画面指定条件の留意点を示した。
特許公報番号の検索では,図1の様に「ID指定」のプルダウンメニューから [Patent Retrieval Number] を選択して,特許公報番号を入力ボックスに記載して検索を行う必要がある。

    図1:特許公報番号検索の getentry 指定条件
    patent1

アミノ酸配列データを検索する際には,Protein データベースの Patent のラジオボタンにチェックを入れる必要がある。

    図2:アミノ酸配列データ検索の getentry 指定条件
    patent2


2-2)ARSA (All-round Retrieval of Sequence and Annotation)
ARSA では塩基配列データを対象にキーワードによる検索を行うことができるが,アミノ酸データの検索は行うことはできない。表2に,実際に検索する場合が多いと思われる入力条件例を紹介した。

    表2:ARSA 入力条件例

例1)JPO 由来データを対象に検索したい場合
Advanced Search 画面において Division に PAT を選択し,Primary Accession Number の入力ボックスに E|BD|DD|DJ|DL|DM|FU|FV|FW のアクセッション番号プレフィックスを指定することで,JPO 由来データを対象にすることができる。
JPO のアクセッション番号プレフィックスについては順次追加されているため,最新のプレフィックスを確認の上,検索を実行して頂きたい。

例2)同一公報由来の全塩基配列データを検索したい場合
Advanced Search 画面において Division に PAT を選択し,Comment,Keywords,Journal のいずれかの入力ボックスに,配列番号なしの公開番号を入力して検索すると,同一公報由来の塩基配列データを検索することができる。
入力値例:2010511691

例3) 出願人名で検索したい場合
Advanced Search 画面において Division に PAT を選択し,Journal の入力ボックスに出願人の英語名を入力して検索すると,出願人名で検索が可能である。

例4) 出願番号で検索したい場合
Advanced Search 画面において Division に PAT を選択し,Comment の入力ボックスに,出願番号を入力することで検索が可能である。
入力値例:2001563636

アミノ酸データのキーワード検索を行いたい場合は,EBI の EBI-eye search,SRS,NCBI の Protein database(GenPept) で確認が可能である。


3. 特許 FF の特許公開番号(公開番号)記載箇所
JPO の特許 FF で,公開番号は図3の黄色で示しているKEYWORDS行,JOURNAL行,COMMENT PN 行の3か所に記載される。特許公開公報を検索するためには,KEYWORDS 行,JOURNAL 行,COMMENT PN 行のいずれかの行から,公開番号を取得する必要がある。

    図3:特許 FF の公報番号記載箇所(抜粋)
    patent3

公開番号は,以下のフォーマットで記載される。公開番号の先頭の JP は,国内公報および公表公報由来データに記載され,国際公表由来のデータには WO が記載される。基本的に公開番号の後ろには ”-A” が記載され,特許公開公報由来であることを示す。また配列番号は,同一公報由来の各配列に塩基配列,アミノ酸配列の順に連番で記載される。

    表3:公開番号の記載フォーマット

KEYWORDS行/ COMMENT PN行: JP[space] 公開番号[-A/]配列番号                        
     WO[space] 公開番号[-A/]配列番号                        
JOURNAL行: JP[space] 公開番号[-A][space]配列番号                        
     WO[space] 公開番号[-A][space]配列番号                        


4. 特許公開公報を検索する方法
特許 FF から公開番号を取得した後に特許公開公報の内容を確認する方法の一つとして,IPDL での検索方法を紹介したい。IPDL の「特許・実用新案検索」の画面から,「特許・実用新案公報 DB」をクリックすると図4の画面となる。
文献種別では A,文献番号に公開番号を入力する。文献番号に入力する公開番号は,最初の4桁の数字の後ろにハイフンを入力する必要がある。文献番号照会ボタンを押すと,該当する特許公開公報を確認することができ,最大12の公開番号の検索を行うことが可能である。

    図4:IPDL の特許・実用新案公報 DB 検索画面 (IPDL より画面引用)
    patent4

検索結果は“文献番号の選択画面”,“特許公開公報の参照画面”,“特許公開公報に記載される図の参照画面”で表示される。また検索した特許公開公報の公開後の審査状況を確認するためは,特許公開公報の参照画面で,経過情報のボタンを押すことで審査状況を参照することができる。


5. 最後に
DDBJ から公開している JPO の特許 FF は,他のデータバンクから公開している特許データに比べて,出願人名や発明者名,公開日,出願番号,出願日,優先出願番号などの特許公開公報に記載されている有用な情報が,各エントリーに記載されている。JPO のエントリーは出願内容に関する基本情報を有しているため,最終の次回コラムでは JPO の特許 FF において,出願内容に関する基本情報がどの様に格納され表示されているかを紹介する予定である。

"SAKURA de Q" 第7回 (ユーザから寄せられる Q and A です)

Q.論文の投稿予定はありませんが,REFERENCE 情報のページでは,どのように入力すればよいでしょうか?

A.DDBJ では,学術論文の投稿予定の有無に関わらず,塩基配列 の登録を受け付けております。 学術論文の投稿予定がない場合,REFERENCE 情報のページでは以下の項目が入力必須です。

  • 論文の出版・公開等: [Unpublished] を選択して下さい
  • 雑誌名: [To be determined] を選択して下さい
  • 年: 仮の年を入力して下さい
  • タイトル: 仮のタイトルを英語で入力して下さい
  • 著者名: 1名以上の名前を入力して下さい

また,データ登録後に学術論文への掲載が決まった場合は,Q and A [1-3-1] 論文が公開されました を参考にして論文情報を DDBJ までご連絡下さい。

アンケートへご協力下さい

アンケートは終了しました。

ddbjmag@ddbj.nig.ac.jp
この DDBJ メールマガジンは国立遺伝学研究所内の方と,配信を希望される方に送らせて頂きます。
配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。
発行:日本 DNA データバンク(DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540  静岡県三島市谷田1111