BioSample
BioSample 概要
BioSample の目的
BioSample はデータベースに登録する実験データを得るために使われた生物学的な試料やサンプルに対するレコードです。
以下の図は BioSample がどのように他の DDBJ のデータベースとリンクしているかを示しています。 この例は、データと二つの BioSample、三つの BioProject、一つの Umbrella BioProject から構成されています。ユーザは BioProject または BioSample データベースを検索し、目的のレコードを取得、そこからのリンクをたどることによって DDBJ/DRA/GEA/MetaboBank に登録されている関連する実験データを得ることができます。
サンプル
データベースに登録されるサンプルが多様であること、また、サンプルの適切な記載方法が研究内容により異なることから BioSample の定義は柔軟なものになっています。 BioSample の典型的な例としては細胞株、組織の生検、生物個体や環境サンプルなどが挙げられます。
BioSample はサンプルに関する以下のような情報を含みます。
- 生物種
- 採取された生物試料、例: 器官、組織、セルタイプ
- 表現型 - 疾患や個人の医学的な情報など
ヒトに関する情報とそれへのアクセスは適用される全ての倫理的な要請を満たしている必要があります。
DDBJ BioSample データベースはアクセスを制限する仕組みを持っていないため、プライバシーに抵触する可能性のあるヒト由来サンプルを登録することはできません。そのようなサンプルはアクセス制限の仕組みを備えた JGA に登録してください。
サンプルの粒度
一般的に、生物学的な試料に対して BioSample を作成し、そこから抽出された核酸、代謝物などの抽出物は DRA、GEA や MetaboBank のメタデータで表します。
- biological replicate はサンプルを分けて biological_replicate 属性で区別します。例 “biological_replicate = 1” と “biological_replicate = 2” 例 DRA の構成
- technical replicate はサンプルを分けず、DRA Experiment/GEA SDRF/MetaboBank SDRF で分けます。
- 植物の葉から調整した RNA、代謝物サンプルは葉に対応する BioSample を一つ作成し、抽出物は GEA や MetaboBank メタデータで表現します。
- 同じサンプルから調整した paired-end library をシークエンスした場合、forward と reverse で BioSample を分けずに一つの DRA Run に両ペアードファイルを含めます。DRA の構成
- 同じサンプルを異なる機種でシークエンスした場合、異なる Instrument model を持つ複数の DRA Experiment を一つの BioSample にリンクします。
- ユニークなサンプル源に対し、別々の BioSample を登録します。例えば、羽から調整した RNA と肢から調整した RNA は、両者が別々にシークエンスされている場合、別個の BioSample になります。
- ゲノムアセンブリ用サンプルはゲノム配列にのみ必要な locus tag prefix などがあるため、RNA や代謝物サンプルとは別にします。
登録例
- 海水中のある採取地点から得られた 23,000 本のユニークな 16S 増幅配列 - 1 BioSample(1サンプルが採取され、16S の多様性が解析された)
- 同じ薬物で処理された三匹の「同一」なトランスジェニックマウス - 3 BioSamples(biological replicate は BioSample で区別)
- 遺伝子発現レベルの経時的な変化を解析するため、ウイルスに感染させた CHO 細胞を 0、2、4、8 時間後にサンプリング - 4 BioSamples(4 タイムポイント)
- 発現している遺伝子の差異を組織毎に調べるため、オスのアリクイ一個体から採取した脳、心臓、肺、精巣、肝臓 - 5 BioSamples(5つの異なる組織)
ゲノムアセンブル用サンプル
ゲノムアセンブリに使用したサンプルについては、ゲノムアセンブル用サンプルをご覧ください。
ヒトサンプル
ヒトに由来するサンプルについては、Human Sampleをご覧ください。
サンプルの属性
BioSample レコードを構成する主要部分は「サンプル属性」です。属性にはセルタイプ、採取地や表現型などの情報を記載することができ、対象となるサンプルを定義します。BioSample の属性は構造化された「属性名:値」 (name:value) の組として表現されます。例) tissue:liver
BioSample は属性名にコントロールされた語句 (“辞書”) を使うことをサポートしており、サンプル種別に応じた属性セットをパッケージとして提供しています。
サンプルパッケージ
BioSample ではサンプルや配列種別に応じた必須・任意属性から構成されるパッケージを提供し、サンプル記載の充実化と属性名の標準化を促しています。
パッケージはサンプルの適切な記述を促すための仕組みであり、サンプル情報の解釈のためには実際に使用される属性の方が重要です。そのため過去に登録したサンプルとパッケージが合っていなくても、使用されている属性が適切であれば、パッケージを無理に変更する必要はありません。
生物名
BioSample の organism に記載する生物名については「生物名について」をご覧ください。
関連するお知らせ: 生物の株情報を管理する方法が変更になります
薬剤感受性表
BioSample レコードに薬剤感受性表(アンチバイオグラム、Antibiogram)を含めることができます(登録例: SAMN07958491)。登録を希望する場合は BioSample チームに連絡してください。
薬剤感受性表の登録ガイドラインは NCBI BioSample の各ページを参照してください。