DDBJ Annotated/Assembled Sequences
Parser ユーザーマニュアル
Parser は、Mass Submission System (MSS) を利用して DDBJ に登録する際に必要なアノテーションファイルと塩基配列ファイルのフォーマットチェックを行うCUIツールです。
インストール
1. Parser ファイルの取得
MSS データファイル用チェックツールから Parser_V#.##.tar.gz (# はバージョンを表します)をダウンロードしてください。
2. 解凍
$ gunzip -c Parser_V#.##.tar.gz | tar xvf -
解凍後に jParser ディレクトリが作成されます。ディレクトリの中身を見ると、以下のようになっています。
$ ls -FC jParser/
jParser.sh* jar/ license.txt resource/
jParser.sh | 実行シェルスクリプト |
---|---|
jar/ | java のクラスライブラリ格納ディレクトリ(改変不可) |
license.txt | 使用許諾(改変不可) |
resources/ | 検査条件などのリソースファイル格納ディレクトリ(改変不可) |
3. 実行シェルスクリプトを編集
jParser.sh の一部をインストール場所に合わせて変更します。nano や vi などのエディタで編集して下さい。
例) /home/mass ディレクトリ配下に解凍した場合
$ cd /home/mass/jParser
$ nano jParser.sh
PARSER_DIR= に、jParser ディレクトリの場所をフルパスで指定します。
# Parser installed directory
PARSER_DIR=./
↓
# Parser installed directory
PARSER_DIR=/home/mass/jParser
使い方
cd jParserを設置したディレクトリ
./jParser.sh -x <filename> -s <filename> [-e <filename> -M <memory size>]
オプション詳細。ファイル名は絶対パス、相対パスのどちらでも指定可能です。
-x <アノテーションファイル名>
必須。アノテーションファイルを指定します。アノテーションファイル書式に関しては、登録ファイル形式:アノテーションファイル をご参照下さい。
-x sample.ann
-s <塩基配列ファイル名>
必須。塩基配列ファイルを指定します。 塩基配列ファイル書式に関しては、登録ファイル形式:配列ファイルをご参照下さい。
-s sample.fasta
-e <結果出力用ファイル名>
任意。実行結果をファイルに出力する場合のファイル名を指定します。このオプションを指定しない場合、画面に結果が出力されます。
-e result.txt
-M <最大メモリサイズ>
任意。コマンド実行時に許可する最大メモリサイズをmegabyteで指定します。アノテーションファイルまたは塩基配列ファイルのサイズが大きい場合に使用します。このオプションを指定しない場合は、jParser.sh スクリプト内 DEFAULT_MAX_HEAP= のメモリ量が使われます。
-M 8192m
macOS: ファイル名とフォルダ名について
アノテーションファイル、配列ファイルのファイル名またはフォルダ名にマルチバイト文字が含まれていますと一部のバージョンの macOS では正常に動作しない場合がありますので、ファイル名とフォルダ名にマルチバイト文字を混在させないようにご注意ください。
実行例
例1
$ cd /home/mass/jParser
$ ./jParser.sh -x sample1.ann -s sample1.fasta
例2
$ cd /home/mass/jParser
$ ./jParser.sh -x sample2.ann -s sample2.fasta -M 16384m -e result.txt
エラーメッセージ
アノテーションファイル、塩基配列ファイル書式にエラーがある場合は、エラーメッセージが出力されます。エラーメッセージの詳細については Validator エラーメッセージ: Parser をご覧ください。