MetaboBank

  • Home
  • Submission
    • Metadata
    • Data File
    • Validation
  • FAQ
  • Search
  • Download
  • Contact
  • ホーム
  • metabobank
  • メタデータ

メタデータ

MAGE-TAB

MicroArray Gene Expression Tabular (MAGE-TAB) は機能ゲノミクスデータを構造化・標準化された方法で記述するために開発された形式で、ArrayExpress と GEA で使用されています。 MAGE-TAB はプロテオミクス分野でも使われ始めており、オミックス分野における国際標準になりつつあります。
MAGE-TAB は研究全体を記述する IDF、および、サンプルとデータファイルの関係性を記述する SDRF から構成されています。 IDF と SDRF はプロトコールで、メタデータとデータファイルは SDRF を介してリンクします。

IDF,SDRF, 生・解析済みデータファイル・MAF の関係
IDF,SDRF, 生・解析済みデータファイル・MAF の関係

メタデータエクセル

実験種別に対応したメタデータエクセルをダウンロードし、内容を記入します。異なる種別のデータは Study を分けて登録します。

  • Mass spectrometry, chromatography
    • Liquid chromatography-mass spectrometry (LC-MS, download)
    • Liquid chromatography, diode array detector-mass spectrometry (LC-DAD-MS, download)
    • Gas chromatography-mass spectrometry (GC-MS, download)
    • Two dimensional gas chromatography-mass spectrometry (GCGC-MS, download)
    • Gas chromatography, flame ionization detector-mass spectrometry (GC-FID-MS, download)
    • Capillary electrophoresis-mass spectrometry (CE-MS, download)
  • Mass spectrometry, direct injection
    • Direct infusion-mass spectrometry (DI-MS, download)
    • Flow injection analysis-mass spectrometry (FIA-MS, download)
    • Matrix-assisted laser desorption-ionisation mass spectrometry (MALDI-MS, download)
  • Mass spectrometry imaging (MSI, download)
  • Nuclear magnetic resonance spectroscopy (NMR, download)

IDF

IDF (Investigation Description Format) は研究概要、実験デザイン、プロトコール、文献情報や登録者情報といった研究全体を記述するファイルです。

IDF の例

IDF 項目

MAGE-TAB Version
MAGE-TAB バージョン。1.1 で固定。MetaboBank で記入。
Comment[MetaboBank accession]
Metabobank アクセッション番号 (例 MTBKS1)。MetaboBank で記入。
Study Title
研究全体のタイトル。
Study Description
フリーテキストで記載した study の概要説明。この研究で実施した内容が分かるように記載します。この項目では ASCII、ギリシャ文字とシンボル [° μ ± ≠ ≒ < > ← ↑ ↓ → ↔ Å] を使った表現が許容されています。
Experimental Design
該当する実験デザインを記入。デザインは controlled terms から選択します。
Experimental Factor Name
実験で解析した experimental factor。Experimental factor は研究で調べている「変数 (パラメータ)」のことです。 実際の変数の値は SDRF の “Factor value[<factor name>]” カラムに記載します。例えば、異なる温度 (熱ストレス) が培養細胞に与える影響を解析している研究では “temperature” が変数となり、その数値は SDRF の Factor Value[temperature] に単位を示す “Unit” カラムと共に記載します。
Experimental Factor Type
experimental factor のタイプ。MetaboBank で記入。
Person Last Name
登録者の last name。登録者の last name を各カラムに記入します。 登録者は登録内容を編集する権利を持ちます。MetaboBank は登録内容に関する問い合わせを登録者に送ります。また、データ公開後のユーザからの問い合わせも登録者に送られます。 貢献者は Comment[Contributor] に記載することができます。
Person First Name
登録者の first name。登録者の first name を各カラムに記入します。
Person Mid Initials
登録者の middle name。登録者の middle name を各カラムに記入します。
Person Email
登録者のメールアドレス。登録者のメールアドレスを各カラムに記入します。メールアドレスは公開されません。
Person Affiliation
登録者の所属組織。登録者の所属組織を各カラムに記入します。
Person Roles
登録者の役割。MetaboBank では “submitter” role に限定しています。MetaboBank で記入。
PubMed ID
この登録に関係する文献の PubMed ID がある場合、その ID (複数可) を記入します。
Publication DOI
この登録に関係する文献の Digital Object Identifier (DOI) がある場合、その DOI (複数可) を記入します。 PubMed ID と DOI の両方がある場合、PubMed ID を記入します。
Public Release Date
初回公開日。MetaboBank で記入。
Term Source Name
IDF と SDRF で使っている用語のソース (オントロジーやデータベース)。”Term Sources” は IDF で定義し、IDF と SDRF 全体で参照します。 ソースは対応する全ての “Term Source REF” 項目で参照されます。
Term Source File
Term Source を示すファイル名や URL。
Term Source Version
IDF と SDRF で使われている Term Source のバージョン。
SDRF File
IDF ファイルに付随する SDRF ファイル名。MetaboBank で記入。
Comment[Study type]
該当する study type (例 targeted metabolite profiling、lipid profiling)。Study type は controlled terms から選びます。
Comment[Experiment type]
該当する experiment type (例 liquid chromatography-mass spectrometry、capillary electrophoresis-mass spectrometry)。 Experiment type は controlled terms から選びます。一つ以上の type を記入できます。Submission type に対応する規定値を MetaboBank で追加します。
Comment[Submission type]
登録種別 (例 LC-MS、GC-MS)。controlled terms を使います。MetaboBank で記入します。
Comment[BioProject]
関連する BioProject アクセッション番号 (例 PRJDB1)。
Comment[Related study]
関連する MetaboBank (MB) もしくは他のデータベースのアクセッション番号。”DB:ID” 形式でタブで区切られたフィールドに番号を記入します。 例 MB:MTBKS202<tab>MB:MTBKS203<tab>Metabolonote:SE112
Comment[Contributor]
貢献者の名前。テクニカルスタッフなどの貢献者は登録者であるかどうかに関わらず Comment[Contributor] に記載できます。 貢献者は登録者ではない場合、登録者としての権利を持ちません。 例 Mishima Naoko, Fuji San, Shizuoka Ken
Comment[Submission Date]
登録日。MetaboBank で記入。
Comment[Last Update Date]
最終更新日。MetaboBank で記入。

IDF Protocols

プロトコールは再現性を確保するために重要であり、研究で実施した手順の詳細を提供する必要があります。

Protocol Name
使用したプロトコールの名前。プロトコールの種別毎に一つのプロトコールしかない場合、type をそのまま name に使います。種別毎に複数のプロトコールがある場合は name に 1、2、… を付けて区別します (例 Data transformation 1、Data transformation 2)。
Protocol Type
プロトコールの種別。Submission type 毎に必要なプロトコール種別は異なります。
Protocol type Description Submission type
Sample collection サンプルの由来、加えた処理、日時、採取と保存方法を記載。 All types
Extraction サンプルの抽出や調整方法。測定のコントロール群サンプル、プールしたサンプル、standard、quality control や solvent blank、も含めます。 MSI 以外
Chromatography 製造元、移動相、濃度勾配、設定や温度、フローレートや注入量などの機器とカラムの詳細。 LC-MS,LC-DAD-MS,GC-MS,GCGC-MS,GC-FID-MS
Mass spectrometry 製造元、イオン源、イオンモード (positive/negative)、m/z レンジ、温度、電圧、フローレート、スキャンレートなどの機器の詳細。 NMR 以外
Data processing 生データの解析方法やソフトウェア。 All types
Metabolite identification 代謝物の同定やアノテーションに使用した手法、参照データベースやソフトウェアの詳細。 All types
Capillary Electrophoresis 製造元、移動相、濃度勾配や設定などの機器とカラムの詳細。 CE-MS
Direct infusion direct infusion の手法の詳細。 DI-MS
Flow injection analysis flow injection analysis 手法の詳細。 FIA-MS
Preparation サンプルマウント、保存、tissue modification、sectioning やマトリックスなどのサンプル調整の詳細。 MSI
Histology 染色などの組織学的な詳細。 MSI
NMR sample チューブタイプ、溶媒、サンプル pH や温度などの NMR サンプルの詳細。 NMR
NMR spectroscopy プローブや磁場強度などの NMR 機器の詳細。 NMR
NMR assay NMR 測定に関する詳細。 NMR
Protocol Description
プロトコールのフリーテキストでの記載。テキストはタブで区切られた一つのフィールドに記載します。この項目では ASCII、ギリシャ文字とシンボル [° μ ± ≠ ≒ < > ← ↑ ↓ → ↔ Å] を使った表現が許容されています。
Protocol Parameters
セミコロンで区切ったプロトコールパラメータ名のリスト。Submission type 毎に必要となるパラメータは異なります。 詳細は SDRF Protocol Parameters を参照。
Protocol Hardware
プロトコールでサンプル捕捉に使用した機器。複数の機器を使った場合はセミコロン (;) で区切って列挙します。
Protocol Software
プロトコールで使用したソフトウェア。

SDRF

SDRF (Sample and Data Relationship Format) はサンプル属性およびサンプル、測定機器、データファイル間の関係性を記述するファイルです。 SDRF はオミックス実験の自然な流れを再現した表であり、 大元のサンプルから始まり、間にプロトコールを挟みながら最後はサンプルから得られたデータファイルで終わります。

SDRF の構造
SDRF の構造

SDRF の例

SDRF カラム

Source Name
サンプルソースのユニークな ID。基本的に BioSample の sample name を使います。
Characteristics
サンプル属性。サンプル記述に用いた BioSample 属性 (例 organism や strain) を使います。sample_title、description と BioSample アクセッション番号は Source Name の Comment カラムに記載します。サンプルの特徴に関する属性以外の bioproject_id や locus_tag_prefix といったデータ管理用の属性は SDRF から除外されます。
Protocol REF
IDF で定義したプロトコールを protocol name で参照するカラム。このカラムが参照プロトコールに関する情報を記載するセクションの始まりになります。Protocol name はこのカラムの全ての行に記載されている必要があります。
Sample Name
サンプルのユニークな ID。基本的に BioSample の sample name を使います。
Extract Name
抽出したマテリアルのユニークな ID。
Labeled Extract Name
同位体で標識した抽出物の ID。標識していないサンプルでは任意。値が無い場合は空欄にします。FAQ: サンプルを安定同位体で標識した場合の記載方法は?を参照。
Label
測定機器で検出できるように安定同位体などで試料を標識した場合、標識化合物を記入します。値が無い場合は空欄にします。FAQ: サンプルを安定同位体で標識した場合の記載方法は?を参照。
Assay Name
アッセイに対するユニークな ID。テクニカルレプリケートは同じ sample name、technical replicate Comment を持った異なる assay name の行として表現されます。
Comment[technical_replicate]
1、2、3 などのテクニカルレプリケートを区別する値を記載。
Raw Data File
生データファイルを記載するカラム。データがオープンソース形式のファイル (例 mzML や nmrML) に変換されている場合、それらのファイルもこのカラムに記載します。
ファイルの指定方法は何通りかあります。

各サンプルの各々のファイル名を一つのカラムに記入。  

Raw Data File Comment[Raw Data File md5]
sample1.RAW.gz …
sample2.RAW.gz …

各サンプルの各々の tar/zip アーカイブしたファイル名を一つのカラムに記入。  

Raw Data File Comment[Raw Data File md5]
sample1.RAW.tar.gz …
sample1.RAW.tar.gz …

各サンプルのファイルを含むサブディレクトリ名を一つのカラムに記入。  

Raw Data File Comment[Raw Data File md5]
sample1/ …
sample2/ …

各サンプルに対応する二つのファイル名を二つのカラムにそれぞれ記入。

Raw Data File Comment[Raw Data File md5] Raw Data File Comment[Raw Data File md5]
sample1.RAW.gz … sample1.mzML …
sample2.RAW.gz … sample2.mzML …
Comment[Raw Data File md5]
生データファイルの MD5 ハッシュ値 を記入。
Processed Data File
解析済みデータファイルを記載。解析済みデータファイルは生データを処理したファイルからサマリーテーブルまで広い意味を持っています。
ファイルの指定方法は何通りかあります。

各サンプルの各々のファイル名を一つのカラムに記入。  

Processed Data File Comment[Processed Data File md5]
sample1.tsv …
sample2.tsv …

各サンプルの各々の tar/zip アーカイブしたファイル名を一つのカラムに記入。  

Processed Data File Comment[Processed Data File md5]
sample1.tsv.tar.gz …
sample1.tsv.tar.gz …

各サンプルのファイルを含むサブディレクトリ名を一つのカラムに記入。  

Processed Data File Comment[Processed Data File md5]
sample1/ …
sample2/ …

各サンプルに対応する二つのファイル名を二つのカラムにそれぞれ記入。

Processed Data File Comment[Processed Data File md5] Processed Data File Comment[Processed Data File md5]
sample1.tsv … sample1.xlsx …
sample2.tsv … sample2.xlsx …
Comment[Processed Data File md5]
解析済みデータファイルの MD5 ハッシュ値を記入。
Metabolite Assignment File
この研究で解析した代謝物に関する情報を記載した TSV ファイル。データベースのアクセッション番号、代謝物のスペクトル、サンプル中の濃度などはこのファイル形式で登録します。 詳細は Metabolite assignment file を参照。
Comment[Metabolite Assignment File md5]
metabolite assignment file の MD5 ハッシュ値 を記入。
Comment[maf_value_unit]
metabolite assignment file 中の値の単位 (例 peak area や pico mole)。
Factor Value[]
研究で調べている「変数 (パラメータ)」例えば、異なる温度 (熱ストレス) が培養細胞に与える影響を解析している研究では “temperature” が変数となり、その数値は単位を示す “Unit” カラムと共に記載します。
Factor Value[temperature] Unit[temperature]
37 degree_C
40 degree_C
Unit[<unit category>]
前にあるカラムに記載された値の「単位」を示すカラムで、Characteristics、Factor Value や Parameter Value に続けて使用します。カラム名に単位の種類を含めます。例 Unit[temperature]
Image Data File
イメージング実験で得られたデータファイル。オープンソース形式の imzML と ibd ファイルの登録を推奨します。組織切片の画像ファイル (png、jpg) も登録します。
Comment[Image Data File md5]
image data file の MD5 ハッシュ値 を記入。
Acquisition Parameter Data File
acquisition parameter data を含むファイル。Bruker では生データファイルの中で ‘acqus.txt’ と呼ばれているファイルが該当します。例 acqus1.txt
Comment[Acquisition Parameter Data File md5]
acquisition parameter data file の MD5 ハッシュ値 を記入。
Free Induction Decay Data File
free induction decay data file を記載。
Comment[Free Induction Decay Data File md5]
free induction decay data file の MD5 ハッシュ値 を記入。

SDRF Protocol Parameters

IDF で記載されたプロトコールを補完するプロトコールパラメータ。 必須・推奨パラメータは Submission と Protocol type によって異なります。

Protocol parameter Submission type Protocol type
Post extraction Other than MSI,NMR Extraction
Derivatization Other than MSI,NMR Extraction
Chromatography instrument LC-MS,LC-DAD-MS,GC-MS,GCGC-MS,GC-FID-MS Chromatography
Autosampler model LC-MS,LC-DAD-MS,GC-MS,GCGC-MS,GC-FID-MS Chromatography
Column model LC-MS,LC-DAD-MS,GC-MS,GC-FID-MS Chromatography
Column type LC-MS,LC-DAD-MS,GC-MS,GC-FID-MS Chromatography
Guard column LC-MS,LC-DAD-MS,GC-MS,GCGC-MS,GC-FID-MS Chromatography
Column model 1 GCGC-MS Chromatography
Column type 1 GCGC-MS Chromatography
Column model 2 GCGC-MS Chromatography
Column type 2 GCGC-MS Chromatography
Detector_Ch LC-DAD-MS,GC-FID-MS Chromatography
Signal range LC-DAD-MS Chromatography
Resolution LC-DAD-MS Chromatography
Temperature GC-FID-MS Chromatography
Scan polarity All MS types Mass spectrometry
Scan m/z range All MS types Mass spectrometry
Instrument All MS types Mass spectrometry
Ion source All MS types Mass spectrometry
Mass analyzer All MS types Mass spectrometry
CE instrument CE-MS Capillary Electrophoresis
Autosampler model CE-MS Capillary Electrophoresis
Column model CE-MS Capillary Electrophoresis
Column type CE-MS Capillary Electrophoresis
DI instrument DI-MS Direct infusion
FIA instrument FIA-MS Flow injection analysis
Instrument manufacturer MSI Mass spectrometry
Solvent MSI Mass spectrometry
Target material MSI Mass spectrometry
Spatial resolution MSI Mass spectrometry
Pixel size x MSI Mass spectrometry
Pixel size y MSI Mass spectrometry
Max count of pixel x MSI Mass spectrometry
Max count of pixel y MSI Mass spectrometry
Max dimension x MSI Mass spectrometry
Max dimension y MSI Mass spectrometry
Inlet type MSI Mass spectrometry
Detector MSI Mass spectrometry
Detector mode MSI Mass spectrometry
Resolving power MSI Mass spectrometry
Resolving power m/z MSI Mass spectrometry
Native spectrum identifier format MSI Mass spectrometry
Data file content MSI Mass spectrometry
Spectrum representation MSI Mass spectrometry
Raw data file format MSI Mass spectrometry
Instrument software MSI Mass spectrometry
Instrument software version MSI Mass spectrometry
Line scan direction MSI Mass spectrometry
Line scan sequence MSI Mass spectrometry
Scan pattern MSI Mass spectrometry
Scan type MSI Mass spectrometry
Number of scans MSI Mass spectrometry
Sample mounting MSI Preparation
Sample preservation MSI Preparation
Tissue modification MSI Preparation
Sectioning instrument MSI Preparation
Section thickness MSI Preparation
Matrix MSI Preparation
Matrix application MSI Preparation
Stain MSI Histology
Data processing software MSI Data processing
Data processing software version MSI Data processing
Extraction method NMR Extraction
NMR tube type NMR NMR sample
Solvent NMR NMR sample
Sample pH NMR NMR sample
Temperature NMR NMR sample
Instrument NMR NMR spectroscopy
NMR probe NMR NMR spectroscopy
Number of transients NMR NMR spectroscopy
Pulse sequence name NMR NMR spectroscopy
Magnetic field strength NMR NMR spectroscopy
Parameter Value[Post extraction]
サンプルが測定機器に注入される前にどのように溶媒に抽出されたかを記載します。例 400 µL water
Parameter Value[Derivatization]
サンプルが注入前に化学修飾が施されている場合、その修飾について記載します。例 sylilation.
Parameter Value[Chromatography instrument]
実験のクロマトグラフィー部分で使用した機器の名前、製造元、説明書に記載されているモデル番号、ユーザマニュアルやウェブサイト。例 Shimadzu Nexera UHPLC system
Parameter Value[Autosampler model]
オートサンプラーの製造元とモデル番号。
Parameter Value[Column model]
使用したカラムの製造元、モデル番号や dimension。例 HSS T3 C18 (1.8 μm, 1.0 x 100 mm; Waters)
Parameter Value[Column type]
使用したカラムの種類やフェーズ。例 reverse phase
Parameter Value[Guard column]
使用したガードカラムの種類。
Parameter Value[Column model 1]
一次元目の GCGC カラムのモデル。
Parameter Value[Column type 1]
一次元目の GCGC カラムの種類。
Parameter Value[Column model 2]
二次元目の GCGC カラムのモデル。
Parameter Value[Column type 2]
二次元目の GCGC カラムの種類。
Parameter Value[Detector]
TBD.
Parameter Value[Signal range]
TBD.
Parameter Value[Resolution]
TBD.
Parameter Value[Temperature]
TBD.
Parameter Value[Scan polarity]
acquisition mode を極性、negative、positive もしくは alternating で示す。
Parameter Value[Scan m/z range]
実験の m/z レンジ。例 100-1000
Parameter Value[Instrument]
LC-MS 実験で使用した分光器/検出器の製造元、モデル番号、説明書やウェブサイト。例 Bruker micrOTOF-Q II
Parameter Value[Ion source]
機器のイオン源。例 ESI
Parameter Value[Mass analyzer]
実験で生成されたマスフラグメントの 解析器/検出器。例 Triple quadrupole
Parameter Value[CE instrument]
キャピラリ電気泳動機器の名前、製造元やモデル。
Parameter Value[Autosampler model]
キャピラリ電気泳動に使用したオートサンプラーの製造元とモデル。
Parameter Value[Column model]
使用したキャピラリカラムの製造元とモデル番号。
Parameter Value[Column type]
使用したキャピラリカラムの種類。
Parameter Value[DI instrument]
direct infusion 機器の名前。
Parameter Value[FIA instrument]
flow injection analysis 機器の名前。
Parameter Value[Instrument manufacturer]
マススペクトロメトリーイメージング機器の製造元。
Parameter Value[Solvent]
TBD.
Parameter Value[Target material]
TBD.
Parameter Value[Spatial resolution]
TBD.
Parameter Value[Pixel size x]
TBD.
Parameter Value[Pixel size y]
TBD.
Parameter Value[Max count of pixel x]
TBD.
Parameter Value[Max count of pixel y]
TBD.
Parameter Value[Max dimension x]
TBD.
Parameter Value[Max dimension y]
TBD.
Parameter Value[Inlet type]
TBD.
Parameter Value[Detector]
TBD.
Parameter Value[Detector mode]
TBD.
Parameter Value[Resolving power]
TBD.
Parameter Value[Resolving power m/z]
TBD.
Parameter Value[Native spectrum identifier format]
TBD.
Parameter Value[Data file content]
TBD.
Parameter Value[Spectrum representation]
TBD.
Parameter Value[Raw data file format]
TBD.
Parameter Value[Instrument software]
TBD.
Parameter Value[Instrument software version]
TBD.
Parameter Value[Line scan direction]
TBD.
Parameter Value[Line scan sequence]
TBD.
Parameter Value[Scan pattern]
TBD.
Parameter Value[Scan type]
TBD.
Parameter Value[Number of scans]
TBD.
Parameter Value[Sample mounting]
TBD.
Parameter Value[Sample preservation]
TBD.
Parameter Value[Tissue modification]
TBD.
Parameter Value[Sectioning instrument]
TBD.
Parameter Value[Section thickness]
TBD.
Parameter Value[Matrix]
TBD.
Parameter Value[Matrix application]
TBD.
Parameter Value[Stain]
TBD.
Parameter Value[Data processing software]
TBD.
Parameter Value[Data processing software version]
TBD.
Parameter Value[Extraction method]
出発材料からサンプルを抽出した方法。例 Methanol
Parameter Value[NMR tube type]
チューブのサイズと種類。例 standard 5 mm glass NMR tube (Wilmad, LabGlass, USA)
Parameter Value[Solvent]
NMR サンプル調整に使用した溶媒。例 D2O
Parameter Value[Sample pH]
サンプル pH 値。例 7
Parameter Value[Temperature]
サンプルの温度。単位は unit に記載。
Parameter Value[Instrument]
NMR 測定で使用した機器の名前、モデル番号と共鳴周波数。例 Varian Unity Inova 500 MHz spectrometer
Parameter Value[NMR probe]
NMR プローブの名前と種類。この情報は ‘Acquisition Parameter Data File’ に記載されています。Bruker 生データファイルでは ‘acqus.txt’ 中の ‘$PROBHD=’ と書かれた項目に記載されています。例 5 mm CPTCI 1H-13C/15N/D Z-GRD
Parameter Value[Number of transients]
得られたスキャンの数。この情報は ‘Acquisition Parameter Data File’ に記載されています。Bruker 生データファイルでは ‘acqus.txt’ 中の ‘$NS=’ と書かれた項目に記載されています。例 128
Parameter Value[Pulse sequence name]
パルスシークエンスプログラムの名前と短い説明。この情報は ‘Acquisition Parameter Data File’ に記載されています。Bruker 生データファイルでは ‘acqus.txt’ 中の ‘$PULPROG=’ と書かれた項目に記載されています。例 1D 1H with presaturation (presat)
Parameter Value[Magnetic field strength]
テスラ (T) で記載した磁場強度。例 11.7