AMED Genome group sharing Database
登録手順
データ提供申請
データ申請システムから提供申請します。 申請時に提供申請グループを作成します。提供申請が DBCLS で承認された後、AGD サーバにデータアップロード用ディレクトリが作成されます。
申請には D-way アカウントが必要です。アカウントが無い場合は申請前に D-way アカウントを取得してください。
D-way アカウント作成後、データ申請システムで利用できるようになるまで10分程度の時間がかかります。
申請システムで自動入力させるため、アカウントに所属情報や日本語氏名を登録します。申請システムにログインし、右上のメニューから「ユーザ情報更新」を選択します。
アカウント情報を入力するため「Edit」をクリックします。
所属情報や日本語氏名を入力します。
「Save」で登録します。
以下では AGD データの登録手順を説明します。
提供申請グループ
申請前に提供申請グループを作成します。例の提供申請グループ (subgrp1) では申請及び登録を担当する研究員 (account_b) がオーナー、研究代表者 (account_c) がメンバーとなっています。 実際には申請システムで申請したアカウントが自動的に申請者になります。登録者が PI と申請者以外にも居る場合は必ず全員をメンバーに含めてください。登録に関する連絡はメンバーアカウントに対して送られます。
提供申請を開始し、作成した提供申請グループを選択します。
提供申請の承認
提供申請が DBCLS で承認されると、AGD の Submission ID (例 ASUB000353) が発行され、AGD サーバに対応するアップロード用ディレクトリが作成されます。
AGD ファイルサーバ (jga-gw.ddbj.nig.ac.jp) 上の /group-access/submission/agd/ の下に Submission ID と同名のディレクトリが作成されるので、ここにメタデータをデータファイルを sftp でアップロードします。この例であればディレクトリは /group-access/submission/agd/ASUB000353/ になります。
エクセルでのメタデータ作成
エクセルファイルへの記入
メタデータ記入用エクセルファイルを下記よりダウンロードし、内容を英語で記入してください。メタデータの説明はこちらのページをご覧ください。
JGA と AGD はデータモデルが同一であるため、メタデータ記入用エクセルは共通です。ファイル名は JGA_metadata.xlsx となっておりますが、AGD のメタデータを記入し、AGD 用 submission ディレクトリにアップロードしてください。
AGD にアップロードするファイル名には空白を含めないでください。
データは AGD Submission 単位で公開されます。公開時期の異なるデータセットは別の Submission に分けてください。
エクセルをアップロード
AGD にファイルを sftp でアップロードするためには D-way アカウントに公開鍵を登録する必要があります。AGD サーバに ssh ログインすることはできません。
AGD ファイルサーバ (jga-gw.ddbj.nig.ac.jp) 上の /group-access/submission/agd/ の下に AGD Submission ID と同名のディレクトリが作成されるので、 sftp の P オプションでポート番号 443 を指定してログインし、対象ディレクトリに移動しエクセルをアップロードします。 sftp では公開鍵・秘密鍵認証を利用しており、D-way アカウントに登録した秘密鍵を指定します。
例
- アカウント名: account_b
- AGD Submission ID: ASUB000353
$ sftp -i private-key-for-auth -P 443 account_b@jga-gw.ddbj.nig.ac.jp
$ cd /group-access/submission/agd/ASUB000353
$ put ASUB000353_metadata.xlsx
-i: 認証用秘密鍵を指定 -P: 接続先ポート番号 443 を指定
WinSCP によるアップロード
WinSCP (http://winsftp.net/eng/download.php) をダウンロードし、Windows PC にインストールします。
以下のように設定します。
転送プロトコル: SFTP
- ホスト名: jga-gw.ddbj.nig.ac.jp
- ポート番号: 443
- ユーザ名: D-way アカウント ID
- パスワード: 空欄のまま
初回接続時には警告メッセージが表示されますが、「はい」を選択してください (次回から表示されません)。次の画面では、鍵を作成した際に指定したパスフレーズを入力します。
ログインに成功すると、左側のウィンドウにユーザの PC のフォルダ、右側のウィンドウに AGD サーバの登録者専用ディレクトリが表示されるので 左側ウィンドウでファイルを選択し右側ウィンドウへドラッグ&ドロップし、サーバへファイルを転送します。
データファイルのアップロード
データファイル形式
AGD 登録システムではファイルの拡張子でアーカイブ・圧縮形式を判定し、ファイルを処理しています。
- 拡張子 zip、tar、tar.gz、tgz、tar.bz2、tbz2、gz、bz2 のファイルは標準的な方法でアーカイブ・圧縮されているファイルと判定され、展開・解凍処理されます。拡張子とアーカイブ・圧縮形式が一致していないファイルや、これら以外の形式でアーカイブ・圧縮されたファイルはエラーになります。
- bam ファイルは圧縮しないでください。
- gz や bzip 圧縮したファイルをさらに tar でアーカイブせず、tar.gz 等でアーカイブしたファイルを圧縮してください。
登録するデータ
Data オブジェクトに fastq や bam ファイルなどの個人レベルの次世代シークエンスデータを登録します。Analysis にアレイデータ,変異解析,質問票などの次世代シークエンス以外のデータや各種ドキュメントを登録します。
データの再利用性,再現性のためには論文での主張の基になっている解析データが登録されることが重要です。できるだけ VCF などの解析データを Analysis に登録してください。
データファイルのアップロード
データファイルを sftp で登録用ディレクトリにアップロードします。
例
- アカウント名: account_b
- AGD Submission ID: ASUB000353
$ sftp -i private-key-for-auth -P 443 account_b@jga-gw.ddbj.nig.ac.jp
$ cd /group-access/submission/agd/ASUB000353
$ put wgs1.fastq
-i: 認証用秘密鍵を指定 -P: 接続先ポート番号 443 を指定
拡張子 fastq の全てのファイルをアップロード。
$ mput *.fastq
メタデータとデータの登録
AGD キュレータがメタデータとデータファイルを査定します。完成したエクセルからキュレータが XML を生成し、AGD に登録します。
メタデータとデータファイルが検証処理を通過するとアクセッション番号が発行されます。