• getentryでENAとGenBankから特定期間に公開されたエントリーを反映できていない

AMED Genome group sharing Database

  • Home
  • Browse researches at NBDC
  • Submission
    • How to submit
    • Example submission
    • How to download
    • XML Schema
  • GA4GH Beacon
  • ホーム
  • agd
  • 登録手順

登録手順

データ提供申請

データ申請システムから提供申請します。 申請時に提供申請グループを作成します。提供申請が DBCLS で承認された後、AGD サーバにデータアップロード用ディレクトリが作成されます。

申請には DDBJ アカウントが必要です。アカウントが無い場合は申請前に DDBJ アカウントを取得してください。

DDBJ アカウント作成後、データ申請システムで利用できるようになるまで10分程度の時間がかかります。

申請システムで自動入力させるため、アカウントに所属情報や日本語氏名を登録します。申請システムにログインし、右上のメニューから「ユーザ情報更新」を選択します。

ユーザ情報更新
ユーザ情報更新

アカウント情報を入力するため「Edit」をクリックします。

Edit でアカウント情報の編集を開始
Edit でアカウント情報の編集を開始

所属情報や日本語氏名を入力します。

アカウント情報を入力
アカウント情報を入力

「Save」で登録します。

Save で保存
Save で保存

以下では AGD データの登録手順を説明します。

提供申請グループ

申請前に提供申請グループを作成します。例の提供申請グループ (subgrp1) では申請及び登録を担当する研究員 (account_b) がオーナー、研究代表者 (account_c) がメンバーとなっています。 実際には申請システムで申請したアカウントが自動的に申請者になります。登録者が PI と申請者以外にも居る場合は必ず全員をメンバーに含めてください。登録に関する連絡はメンバーアカウントに対して送られます。

データ提供申請グループ
データ提供申請グループ

提供申請を開始し、作成した提供申請グループを選択します。

提供申請の開始
提供申請の開始
データ提供申請グループの選択
データ提供申請グループの選択

提供申請の承認

提供申請が DBCLS で承認されると、AGD の Submission ID (例 ASUB000353) が発行され、AGD サーバに対応するアップロード用ディレクトリが作成されます。

提供申請の承認
提供申請の承認
提供申請と AGD submission ID
提供申請と AGD submission ID

AGD ファイルサーバ (jga-gw.ddbj.nig.ac.jp) 上の /group-access/submission/agd/ の下に Submission ID と同名のディレクトリが作成されるので、ここにメタデータをデータファイルを sftp でアップロードします。この例であればディレクトリは /group-access/submission/agd/ASUB000353/ になります。

エクセルでのメタデータ作成

エクセルファイルへの記入

メタデータ記入用エクセルファイルを下記よりダウンロードし、内容を英語で記入してください。メタデータの説明はこちらのページをご覧ください。

AGD メタデータ記入用エクセル

JGA と AGD はデータモデルが同一であるため、メタデータ記入用エクセルは共通です。ファイル名は JGA_metadata.xlsx となっておりますが、AGD のメタデータを記入し、AGD 用 submission ディレクトリにアップロードしてください。

AGD にアップロードするファイル名には空白を含めないでください。

データは AGD Submission 単位で公開されます。公開時期の異なるデータセットは別の Submission に分けてください。

エクセルをアップロード

AGD にファイルを sftp でアップロードするためには DDBJ アカウントに公開鍵を登録する必要があります。AGD サーバに ssh ログインすることはできません。

AGD ファイルサーバ (jga-gw.ddbj.nig.ac.jp) 上の /group-access/submission/agd/ の下に AGD Submission ID と同名のディレクトリが作成されるので、 sftp の P オプションでポート番号 443 を指定してログインし、対象ディレクトリに移動しエクセルをアップロードします。 sftp では公開鍵・秘密鍵認証を利用しており、DDBJ アカウントに登録した秘密鍵を指定します。

例

  • アカウント名: account_b
  • AGD Submission ID: ASUB000353
$ sftp -i private-key-for-auth -P 443 account_b@jga-gw.ddbj.nig.ac.jp
$ cd /group-access/submission/agd/ASUB000353
$ put ASUB000353_metadata.xlsx

-i: 認証用秘密鍵を指定 -P: 接続先ポート番号 443 を指定

WinSCP によるアップロード

WinSCP (http://winsftp.net/eng/download.php) をダウンロードし、Windows PC にインストールします。

以下のように設定します。

転送プロトコル: SFTP

  • ホスト名: jga-gw.ddbj.nig.ac.jp
  • ポート番号: 443
  • ユーザ名: DDBJ アカウント ID
  • パスワード: 空欄のまま
WinSCP 接続情報の入力
WinSCP 接続情報の入力
WinSCP 認証用秘密鍵を指定
WinSCP 認証用秘密鍵を指定

初回接続時には警告メッセージが表示されますが、「はい」を選択してください (次回から表示されません)。次の画面では、鍵を作成した際に指定したパスフレーズを入力します。

WinSCP ファイルの転送
WinSCP ファイルの転送

ログインに成功すると、左側のウィンドウにユーザの PC のフォルダ、右側のウィンドウに AGD サーバの登録者専用ディレクトリが表示されるので 左側ウィンドウでファイルを選択し右側ウィンドウへドラッグ&ドロップし、サーバへファイルを転送します。

データファイルのアップロード

データファイル形式

AGD 登録システムではファイルの拡張子でアーカイブ・圧縮形式を判定し、ファイルを処理しています。

  • 拡張子 zip、tar、tar.gz、tgz、tar.bz2、tbz2、gz、bz2 のファイルは標準的な方法でアーカイブ・圧縮されているファイルと判定され、展開・解凍処理されます。拡張子とアーカイブ・圧縮形式が一致していないファイルや、これら以外の形式でアーカイブ・圧縮されたファイルはエラーになります。
  • bam ファイルは圧縮しないでください。
  • gz や bzip 圧縮したファイルをさらに tar でアーカイブせず、tar.gz 等でアーカイブしたファイルを圧縮してください。

登録するデータ

Data オブジェクトに fastq や bam ファイルなどの個人レベルの次世代シークエンスデータを登録します。Analysis にアレイデータ,変異解析,質問票などの次世代シークエンス以外のデータや各種ドキュメントを登録します。

データの再利用性,再現性のためには論文での主張の基になっている解析データが登録されることが重要です。できるだけ VCF などの解析データを Analysis に登録してください。

データファイルのアップロード

データファイルを sftp で登録用ディレクトリにアップロードします。

例

  • アカウント名: account_b
  • AGD Submission ID: ASUB000353
$ sftp -i private-key-for-auth -P 443 account_b@jga-gw.ddbj.nig.ac.jp
$ cd /group-access/submission/agd/ASUB000353
$ put wgs1.fastq

-i: 認証用秘密鍵を指定 -P: 接続先ポート番号 443 を指定

拡張子 fastq の全てのファイルをアップロード。

$ put *.fastq

メタデータとデータの登録

AGD キュレータがメタデータとデータファイルを査定します。完成したエクセルからキュレータが XML を生成し、AGD に登録します。

メタデータとデータファイルが検証処理を通過するとアクセッション番号が発行されます。