DDBJ Annotated/Assembled Sequences

  • Home
  • Submission
    • 塩基配列の登録
    • Web 版塩基配列登録システム
    • Mass Submission System
    • 登録データの修正・更新
  • Search
    • getentry
    • ARSA
  • Flat file
    • Feature key の定義
    • Qualifier key の定義
    • 塩基配列について
    • Organism qualifier に記載する生物名
    • 識別子について
    • Location の記述法
    • タンパク質コード配列
    • The Genetic Codes
    • 配列の記載に用いる略号
    • 登録の見本
  • Data categories
    • Genome project のデータ登録
    • Pseudohaplotype
    • WGS
    • Finished level genomic sequences
    • メタゲノムアセンブリ
    • Single amplified genome
    • CON
    • GSS
    • HTG
    • Environmental sequence の登録
    • ENV
    • TLS
    • Transcriptome Project のデータ登録
    • TSA
    • EST
    • HTC
    • Third Party Data (TPA)
  • FAQ
  • Other
    • Patent
    • MGA
  • ホーム
  • ddbj
  • Parser ユーザーマニュアル

Parser ユーザーマニュアル

Parser は、Mass Submission System (MSS) を利用して DDBJ に登録する際に必要な 配列ファイル と アノテーションファイル のフォーマットチェックを行うCUIツールです。

インストール

1. Parser.tar.gz を取得

MSS データファイル用チェックツールからダウンロードしてください。

2. tar.gz ファイルを gunzip コマンドで解凍

$ gunzip Parser.tar.gz

3. tar ファイルを tar コマンドで展開

$ tar xvf Parser.tar

4. 生成されたディレクトリを確認

下記の要領でディレクトリの中身を見ると、以下のようになっています。

$ cd jParser
$ ls -FC
jParser.sh*  jar/    license.txt resource/


jParser.sh 実行シェルスクリプト
jar/ java のクラスライブラリ格納ディレクトリ(改変不可)
license.txt 使用許諾(改変不可)
resources/ 検査条件などのリソースファイル格納ディレクトリ(改変不可)

5. ファイルの編集

jParser.sh を実行する前にファイルの中身を、インストールしたコンピュータの環境にあわせるために変更する必要があります。
viなどのエディタで編集して下さい。

#!/bin/sh

# Parser installed directory
PARSER_DIR=./

# Set maximum Java heap size
HEAP_SIZE=128m

# Parser's resource files(qual.list, ... *.list) path
# Don't change.
RESOURCE_FILE_PATH=$PARSER_DIR/resource

# Parser's main class
# Don't change.
PARSER=tsunami.util.excel.ExcelParser

# Execution Command
# Don't change.
java -Xmx$HEAP_SIZE -classpath $PARSER_DIR/jar/jParser.jar 
-DPARSER_RESOURCE_PATH=$RESOURCE_FILE_PATH $PARSER -Cclean $@

RETVAL=$?

exit $RETVAL
#EOF
[PARSER_DIR 変数]
jParser ディレクトリのある場所をフルパスで入力して下さい。
例) PARSER_DIR=/home/mass/jParser
[HEAP_SIZE 変数]
jParser が使用できる最大メモリ量を指定してください。
例) HEAP_SIZE=128m

6. PATH を指定する

PATH に jParser.sh が設置してあるディレクトリを指定して下さい。

実行

任意のディレクトリで下記の通りに、コマンドを実行して下さい。

$ jParser.sh[space]-x[アノテーションファイル名][space]-s[塩基配列ファイル名]

例

$ jParser.sh -xsample.ann -ssample.fasta

ファイル名は絶対パス・相対パスのどちらでも指定可能です。

macOS: ファイル名とフォルダ名について
配列ファイル、アノテーションファイルのファイル名またはフォルダ名にマルチバイト文字が含まれていますと一部のバージョンの macOS では正常に動作しない場合がありますので、ファイル名とフォルダ名にマルチバイト文字を混在させないようにご注意ください。

-x[アノテーションファイル名]
このオプションは必須です。指定されていない場合、本ツールは終了します。 アノテーションファイルは、登録データの登録者、REFERENCE、Feature/Qualifierの情報等を記述したタブ区切りテキストファイルです。 書式の詳細に関しては、登録ファイル形式:アノテーションファイル をご参照下さい。
-s[塩基配列ファイル名]
このオプションは必須です。指定されていない場合、本ツールは終了します。 塩基配列ファイルは、全登録データの配列をFASTA形式で記述したテキストファイルです。 書式の詳細に関しては、登録ファイル形式:配列ファイルをご参照下さい。

Parser は、エラーが発生している場合は、エラーメッセージを出力します。
エラーメッセージの意味は Parser エラーメッセージ をご覧ください。

Related pages

  • 登録ファイル形式
  • MSS データファイル用チェックツール
  • UME ユーザーマニュアル
  • transChecker ユーザーマニュアル
  • validator エラーメッセージ
  • MSS 利用申し込み