• getentryでENAとGenBankから特定期間に公開されたエントリーを反映できていない

DDBJ Annotated/Assembled Sequences

  • Home
  • Submission
    • 塩基配列の登録
    • Web 版塩基配列登録システム
    • Mass Submission System
    • 登録データの修正・更新
  • Search
    • getentry
    • ARSA
  • Flat file
    • Feature Table
    • Feature key の定義
    • Qualifier key の定義
    • 塩基配列について
    • Organism qualifier に記載する生物名
    • 識別子について
    • Location の記述法
    • タンパク質コード配列
    • The Genetic Codes
    • 配列の記載に用いる略号
    • 配列データ記載例
  • Data categories
    • Genome project のデータ登録
    • Pseudohaplotype
    • WGS
    • Finished level genomic sequences
    • メタゲノムアセンブリ
    • Single amplified genome
    • HTG
    • Environmental sample
    • ENV
    • TLS
    • Transcriptome Project のデータ登録
    • TSA
    • EST
    • HTC
    • Third Party Data (TPA)
  • FAQ
  • Other
    • Patent
    • MGA
  • ホーム
  • ddbj
  • Parser ユーザーマニュアル

Parser ユーザーマニュアル

Parser は、Mass Submission System (MSS) を利用して DDBJ に登録する際に必要なアノテーションファイルと塩基配列ファイルのフォーマットチェックを行うCUIツールです。

インストール

1. Parser ファイルの取得

MSS データファイル用チェックツールから Parser_V#.##.tar.gz (# はバージョンを表します)をダウンロードしてください。

2. 解凍

$ gunzip -c Parser_V#.##.tar.gz | tar xvf -

解凍後に jParser ディレクトリが作成されます。ディレクトリの中身を見ると、以下のようになっています。

$ ls -FC jParser/
jParser.sh*  jar/    license.txt resource/
jParser.sh 実行シェルスクリプト
jar/ java のクラスライブラリ格納ディレクトリ(改変不可)
license.txt 使用許諾(改変不可)
resources/ 検査条件などのリソースファイル格納ディレクトリ(改変不可)

3. 実行シェルスクリプトを編集

jParser.sh の一部をインストール場所に合わせて変更します。nano や vi などのエディタで編集して下さい。

例) /home/mass ディレクトリ配下に解凍した場合

$ cd /home/mass/jParser
$ nano jParser.sh

PARSER_DIR= に、jParser ディレクトリの場所をフルパスで指定します。

# Parser installed directory
PARSER_DIR=./
  ↓
# Parser installed directory
PARSER_DIR=/home/mass/jParser

使い方

cd jParserを設置したディレクトリ
./jParser.sh -x <filename> -s <filename> [-e <filename> -M <memory size>]

オプション詳細。ファイル名は絶対パス、相対パスのどちらでも指定可能です。

-x <アノテーションファイル名>
必須。アノテーションファイルを指定します。アノテーションファイル書式に関しては、登録ファイル形式:アノテーションファイル をご参照下さい。

-x sample.ann

-s <塩基配列ファイル名>
必須。塩基配列ファイルを指定します。 塩基配列ファイル書式に関しては、登録ファイル形式:配列ファイルをご参照下さい。

-s sample.fasta

-e <結果出力用ファイル名>
任意。実行結果をファイルに出力する場合のファイル名を指定します。このオプションを指定しない場合、画面に結果が出力されます。

-e result.txt

-M <最大メモリサイズ>
任意。コマンド実行時に許可する最大メモリサイズをmegabyteで指定します。アノテーションファイルまたは塩基配列ファイルのサイズが大きい場合に使用します。このオプションを指定しない場合は、jParser.sh スクリプト内 DEFAULT_MAX_HEAP= のメモリ量が使われます。

-M 8192m

macOS: ファイル名とフォルダ名について

アノテーションファイル、配列ファイルのファイル名またはフォルダ名にマルチバイト文字が含まれていますと一部のバージョンの macOS では正常に動作しない場合がありますので、ファイル名とフォルダ名にマルチバイト文字を混在させないようにご注意ください。

実行例

例1

$ cd /home/mass/jParser
$ ./jParser.sh -x sample1.ann -s sample1.fasta

例2

$ cd /home/mass/jParser
$ ./jParser.sh -x sample2.ann -s sample2.fasta -M 16384m -e result.txt

エラーメッセージ

アノテーションファイル、塩基配列ファイル書式にエラーがある場合は、エラーメッセージが出力されます。エラーメッセージの詳細については Validator エラーメッセージ: Parser をご覧ください。

Related pages

  • 登録ファイル形式
  • MSS データファイル用チェックツール
  • UME ユーザーマニュアル
  • transChecker ユーザーマニュアル
  • validator エラーメッセージ
  • MSS 利用申し込み