Japanese Genotype-phenotype Archive

  • Home
  • Browse researches at NBDC
    • DDBJ Search
  • Submission
    • How to submit
    • How to access data
    • Groups
    • Updates in 2020
    • Example submission
    • XML Schema
  • FAQ
  • ホーム
  • jga
  • 登録手順

登録手順

NBDC 提供申請から JGA データアップロードまでの手順

提供申請は NBDC 申請システムに D-way アカウントでログインしてから申請します。
提供申請では提供申請グループの作成が必要です。
提供申請の承認後、D-way アカウントで JGA サーバにアクセスし、メタデータとデータファイルを JGA サーバに sftp もしくは WinSCP でアップロードします。

  • D-way アカウント作成・情報追加とデータ転送用公開鍵の登録
  • 提供申請の承認
  • メタデータ作成
  • データファイルのアップロード
    • sftp でのアップロード
    • WinSCP でのアップロード

D-way アカウント作成・情報追加とデータ転送用公開鍵の登録

提供申請および JGA データアップロードのためには D-way アカウントが必要です。アカウントが無い場合は申請前に D-way アカウントを取得してください。

D-way アカウント作成後、NBDC データ申請システムで利用できるようになるまで10分程度の時間がかかります。

JGA サーバへデータをアップロードするためには、データ転送用の公開鍵・秘密鍵ペアを作成し、公開鍵を D-way アカウントに登録します。

申請情報を自動入力させるため、アカウントに所属情報や日本語氏名を追加します。
NBDC 申請システムにログインし、右上のメニューから「ユーザ情報更新」を選択します。

ユーザ情報更新
ユーザ情報更新

アカウント情報を入力するため「Edit」をクリックします。

Edit でアカウント情報の編集を開始
Edit でアカウント情報の編集を開始

所属情報や日本語氏名を入力します。

アカウント情報を入力
アカウント情報を入力

「Save」で登録します。

Save で保存
Save で保存

提供申請グループ

申請前に提供申請グループを作成します。例の提供申請グループ (subgrp1) では申請及び登録を担当する研究員 (account_b) がオーナー、研究代表者 (account_c) がメンバーとなっています。
実際には NBDC 申請システムで申請したアカウントが自動的に申請者になります。登録者が PI と申請者以外にも居る場合は必ず全員をメンバーに含めてください。

データ提供申請グループ
データ提供申請グループ

提供申請を開始し、作成した提供申請グループを選択します。

提供申請の開始
提供申請の開始
データ提供申請グループの選択
データ提供申請グループの選択

詳細な手順は NBDC のデータ提供ページもご覧ください。

提供申請の承認

提供申請が NBDC で承認されると、JGA の Submission ID (例 JSUB000353) が発行され、JGA サーバに対応するアップロード用ディレクトリが作成されます。

提供申請の承認
提供申請の承認
提供申請と JGA submission ID
提供申請と JGA submission ID

JGA サーバ (jga-gw.ddbj.nig.ac.jp) へデータをアップロードするためには、データ転送用の公開鍵・秘密鍵ペアを作成し、公開鍵を D-way アカウントに登録します。
JGA サーバ上の /controlled-access/submission/jga/ の下に Submission ID と同名のディレクトリが作成されるので、ここにメタデータとデータファイルを sftp もしくは WinSCP でアップロードします。 この例であればディレクトリは /controlled-access/submission/jga/JSUB000353/ になります。

メタデータ作成

エクセルファイルへの記入

メタデータ記入用エクセルファイルをダウンロードし、内容を英語で記入します。メタデータの説明はこちらのページをご覧ください。

JGA メタデータ記入用エクセル

last updated: 2022-04-27

JGA にアップロードするファイル名には空白を含めないでください。

データは JGA Submission 単位で公開されます。公開時期の異なるデータセットは別の Submission に分けてください。

エクセルの記入例

メタデータエクセルの記入例

エクセルを sftp でアップロード

JGA ファイルサーバ (jga-gw.ddbj.nig.ac.jp) 上の /controlled-access/submission/jga/ の下に JGA Submission ID と同名のディレクトリが作成されるので、 sftp の P オプションでポート番号 443 を指定してログインし、対象ディレクトリに移動しエクセルをアップロードします。 sftp では公開鍵・秘密鍵認証を利用しており、D-way アカウントに登録したデータ転送用公開鍵とペアの秘密鍵を指定します。

# アカウント名: account_b
# JGA Submission ID: JSUB000353
# データ転送用秘密鍵のファイルパス: ~/.ssh/id_rsa

$ sftp -i ~/.ssh/id_rsa -P 443 account_b@jga-gw.ddbj.nig.ac.jp
$ cd controlled-access/submission/jga/JSUB000353
$ put JSUB000353_metadata.xlsx 

データファイルのアップロード

データファイル形式

JGA 登録システムではファイルの拡張子でアーカイブ・圧縮形式を判定し、ファイルを処理しています。

  • 拡張子 zip、tar、tar.gz、tgz、tar.bz2、tbz2、gz、bz2 のファイルは標準的な方法でアーカイブ・圧縮されているファイルと判定され、展開・解凍処理されます。拡張子とアーカイブ・圧縮形式が一致していないファイルや、これら以外の形式でアーカイブ・圧縮されたファイルはエラーになります。
  • bam ファイルは圧縮しないでください。
  • gz や bzip 圧縮したファイルをさらに tar でアーカイブせず、tar.gz 等でアーカイブしたファイルを圧縮してください。

登録するデータ

Data オブジェクトに fastq や bam ファイルなどの個人レベルの次世代シークエンスデータを登録します。Analysis にアレイデータ,変異解析,質問票などの次世代シークエンス以外のデータや各種ドキュメントを登録します。

データの再利用性,再現性のためには論文での主張の基になっている解析データが登録されることが重要です。できるだけ VCF などの解析データを Analysis に登録してください。

データファイルの sftp アップロード

データファイルを sftp で登録用ディレクトリにアップロードします。

# アカウント名: account_b
# JGA Submission ID: JSUB000353
# データ転送用秘密鍵のファイルパス: ~/.ssh/id_rsa

$ sftp -i ~/.ssh/id_rsa -P 443 account_b@jga-gw.ddbj.nig.ac.jp
$ cd controlled-access/submission/jga/JSUB000353
$ put wgs1.fastq

拡張子 fastq の全てのファイルをアップロード。

$ mput *.fastq

WinSCP でのアップロード

WinSCP (https://winscp.net/eng/download.php) をダウンロードし、Windows PC にインストールします。

以下のように設定します。

  • 転送プロトコル: SFTP
  • ホスト名: jga-gw.ddbj.nig.ac.jp
  • ポート番号: 443
  • ユーザ名: D-way アカウント ID
  • パスワード: 空欄のまま
WinSCP 接続情報の入力
WinSCP 接続情報の入力
WinSCP データ転送用秘密鍵を指定
WinSCP データ転送用秘密鍵を指定

初回接続時には警告メッセージが表示されますが、「はい」を選択してください (次回から表示されません)。次の画面では、鍵を作成した際に指定したパスフレーズを入力します。

WinSCP ファイルの転送
WinSCP ファイルの転送

ログインに成功すると、左側のウィンドウにユーザの PC のフォルダ、右側のウィンドウに JGA サーバの登録者専用ディレクトリが表示されるので 左側ウィンドウでファイルを選択し右側ウィンドウへドラッグ&ドロップし、サーバへファイルを転送します。

メタデータとデータの登録

JGA キュレータがメタデータとデータファイルを査定します。完成したエクセルからキュレータが XML を生成し、JGA に登録します。

メタデータとデータファイルが検証処理を通過するとアクセッション番号が発行されます。