日頃よりDDBJ をご利用頂きありがとうございます。
DDBJ では、2013年5月にDDBJ ホームページをリニューアルしました。
今後もより使いやすいホームページを目指して改善を行う予定です。
皆さまのご意見やご要望を伺い、改善に役立てたいと思いますのでアンケートへのご協力をお願いいたします。
DDBJ ホームページに関するアンケート へ
DDBJ では年に1~2回程度、「DDBJing 講習会」を開催しています。
DDBJing 講習会では、塩基配列の登録方法やDDBJ が提供しているデータベース検索・解析サービスをユーザの皆様により深く理解してご利用頂くために、実習を交えた様々な講義を行っています。
2013年7月4日、 国立遺伝学研究所にて『NGS 配列解析と DDBJ データ登録』をテーマに「第27回 DDBJing 講習会」を開催いたしました。多くの皆様にご参加頂き、DDBJ の活動へ関心をお持ち頂いていることに感謝しております。
本講習会で使用した資料は DDBJing 講習会資料ダウンロードページ より取得できますので、登録の際などにご利用ください。また、今回の講義の様子は Ustream よりご覧頂けます。
次回講習会の開催はまだ未定ですが、開催に関するお知らせはWeb Magazine やtwitter などでご案内いたします。また、ご要望がありましたら大学等へお伺いして講習会を開催することも可能ですので、お問い合わせ の「講習会」よりご連絡願います。
DDBJ では、プログラムから利用可能な Web サービス WABI (Web API for Biology) を再開しました。WABI (Web API for Biology) は、Perl, Ruby, Java などによるプログラムを利用することにより、DDBJの検索サービス を Web画面 を介せずに利用することができるサービスです。
DDBJ では、これまでも SOAP, REST によるWeb API サービスを提供していましたが、2012年3月のスーパーコンピュータのシステム切り替えに伴い、サービスの仕様が変更になったため、提供を中断しておりました。
今回の変更により検索速度、同時実行数などの性能が大幅に向上しております。
今回再開するのは BLAST です。
数百から数万の配列を検索する場合、Web画面からの入力では、multi fasta 形式でも複数回に分けて入力する必要があり、煩雑なコピー&ペーストの作業を繰り返す必要がありましたが、WABI BLAST を使用すると、このコピー&ペーストの手作業の繰返しを自動化することができます。近年、次世代シークエンサ出力データやメタゲノムなど、大容量のデータの解析が求められるようになっており、そのような場合にWABI は最適です。是非ご利用ください。WABI BLAST の詳細は、下記をご参照ください。
DDBJ では、WABIのサービスを、ClustalW や ARSAなどにも拡張し、より使いやすい形式で公開して行く予定です。
DDBJ リリース 93.0
DAD (DDBJ amino acid database) リリース 63.0
中央水産研究所から登録されたクロマグロ (Thunnus orientalis) のゲノム配列データが公開されました。
アクセッション番号は以下の通りです。getentry から検索可能です。
WGS: BADN01000001-BADN01133062 (BADN.gz) (133,062 entries)
京都大学から登録されたカタユウレイボヤ (Ciona intestinalis) の TPA CON データが更新されました。
アクセッション番号は以下の通りです。getentry から検索可能です。
TPA CON: HT000001-HT001272 (1,272 entries)
DDBJ 塩基配列登録システム について、頻繁に寄せられる質問と回答です。ご登録の際に参考にしてください。
Q.MGA:No entry name is found other than [ COMMON ], without feature [ DATATYPE/type=MGA ]. とエラーが出ました。どのように対応したらよいでしょうか?
A.アノテーションテーブルに /organism, /mol_type の入力がないのに "Confirm" をクリックしたことが原因です。必ずアノテーションを入力してから、"Confirm" をクリックするようにしてください。
"7.Annotation" のページで、source 横の "Select Qualifier" をクリックして必要なクオリファイアを選択したのち、Entry Name 横の "Edit" をクリックし、/organism 等の情報を入力してください。source 以外のアノテーションの入力についても必ず行っていただくようお願いいたします。
Q.Stop codon ‘*’ is found in the range. とエラーが表示されます。何が原因でしょうか?
A.対応方法については、DDBJホームページでは「途中に出現する終止コドンへの対応」として説明しております。
なお、CDS の指定に関しては「タンパク質コード配列; CDS feature について」で説明しておりますので是非ご覧ください。
私どもがこの質問で受ける代表的な事例について説明します。
1. 多くの場合は、CDS 領域が部分配列の場合における Location 記述法に誤りがあることが原因です。部分配列の指定については、Location の記述法 にしたがい下記例のように Location 欄に ”< >“ 記号を加えて表記してください。
例) CDS が 1..295 である場合の部分配列記述
開始コドンで始まらないとき
<1..295
終止コドンで終わらないとき
1..>295
開始コドンで始まらず、終止コドンで終わらないとき
<1..>295
2. CDS の読み枠(フレーム、/codon_start)の指定は正しいでしょうか。1, 2, 3 から適切な読み枠を選択してください。
参考:codon_start qualifier による翻訳開始の位置補正
3. genetic code (/transl_table)は正しく設定されているでしょうか。
本システムでは、生物名入力の際、taxonomy database 内に存在する生物名であれば入力補完機能を利用することで genetic code が自動入力される仕組みになっております。taxonomy database に存在しない生物名や入力補完を使用せずに生物名を入力した場合には、genetic code が自動的に入力されません。genetic code は Edit アイコンをクリックすることで現れるウインドウ内に入力欄が表示されます。genetic code は生物やオルガネラの種類に基づいて 1 - 6, 9 - 16, 21 - 24 のいずれかの整数値である必要がございます。
参考:/transl_tableについて、 genetic code一覧表
4. フレームシフトやナンセンス変異、IgG などの獲得免疫関連で多様性が生じる過程の配列内で、途中に stop codon が生じる場合がございます。
4-1. pseudogene である場合
CDS 横の "Select Qualifier" から /pseudogene を追加してください。/pseudogene には、processed、unprocessed、unitary、allelic、unknown のいずれかのタイプを指定する必要がございます。「b) pseudogene と見做される場合」の説明に基づきCDS フィーチャー配下への記載をお願いいたします。
参考:/pseudogene について、 /pseudogeneに指定するタイプの詳細について
4-2. pseudogene とは断言できない場合や、IgG などの獲得免疫関連で多様性が生じる過程での stop codon についてCDS フィーチャーではなく、misc_feature を用いる必要がございます。「a) nonsense mutation、frameshift などと推定されるが理由不明、または、IgG などの獲得免疫関連で多様性が生じる過程の場合」の説明に基づき misc_feature フィーチャー配下への記載をお願いいたします。
5. その他、CDS の末端が欠けている、ribosomal_slippage、RNA editing、例外的なアミノ酸翻訳、IS や Tn などの挿入などでも、stop codon が生じる場合がございます。途中に出現する終止コドンへの対応 の各説明に基づいてアノテーションを記載してください。
この DDBJ メールマガジンは国立遺伝学研究所内の方と,配信を希望される方に送らせて頂きます。
配信申込・中止・変更の方は,「申込・変更」ページをご利用下さい。