DDBJ Annotated/Assembled Sequences
Organism qualifier に記載する生物名
配列データ登録に際し、配列の由来となる「生物名」として /organism qualifier には、taxonomy database において、
- “scientific name” とされている (svnonym, equivalent name ほかではない)
- 種 (species)、もしくは、それ以下 (subspecies, variety, strain, etc.) のランクで
名称を記載する必要があります。
taxonomy database
DDBJ では、生物名 (/organism qualifier の値) を共同で構築している
taxonomy database で管理しています。
塩基配列データベース構築には由来生物名の管理は必須であり、生物名の表記を統一する必要があります。
そのため、生物名の参照先として この taxonomy database を使用しております。
Taxonomy database は、生物名の表記を統一することに主眼をおいて構築されており、生物種の命名、および、分類学上の権威となるものではありません。
採用されている生物名とその lineage は、登録者の分類学的な主張、および、分類学的に普及している内容とは異なる場合があります。
詳細に関しましては、
taxonomy database の説明をご一読ください。
DDBJ では、taxonomy database を検索するためのシステム
TXSearch を公開しております。
塩基配列データベースにデータを登録する際、生物分類名を確認するためなどにご利用ください。
生物名記載のクイックガイド
生物名が taxonomy database に存在する場合
種 (species)、もしくは、それ以下 (subspecies, variety, strain, etc.) のランクであることを確認し、 “scientific name” とされている (svnonym, equivalent name ほかではない) 名称を記載してください。
taxonomy database の記載状況に対して異論がある場合は、こちらをご参照ください。
生物名が taxonomy database に存在しないときの対応
検索の際は、「生物名」にスペルミスがないように、十分、ご確認ください。
- 未同定・同定不能
- taxonomy database に存在しない有効な学名
- 配列が登録されたことがないと推定される種
- taxonomy database の記載状況に対して異論がある場合 # comb. nov. の場合を含む
- 人工的に構築した配列
生物名記載の概要
「生物名」は、通常、種の学名ですが、種が同定されていない場合(人工的に構築した配列なども含む)、仮称を用いることもあります。
このため、無理に既存の生物名を選択しないでください。
既存の生物名を選択して良いケースは、あくまで、配列の由来となる「生物名」の同定に問題がない状態であり、かつ、その「生物名」が taxonomy database に登録済である場合です。
一般に生物学的な種の分類・同定は総合的な視点からなされるべきです。
マーカー遺伝子の塩基配列が類似していることは、分類の一助ではありますが、種同定とは別であり、絶対的な分類・同定のための指標とはなりません。
培養条件、採集地、生育のための条件、形態、生化学的性質なども含めた総合的な判断の結果で、生物名を判断されているのでしたら問題はありません。
登録された配列データの記載内容については登録者の責任になります。
- 未同定種・未記載種 (新種候補) は仮称で記載します。
- ある遺伝子の配列が同一であること と サンプルが同種に由来すること は別の事象です。
- マーカー遺伝子の塩基配列の類似度は、分類の絶対的指標では ありません。
- 現在の原核生物分類のスタンダードは全ゲノム配列によるANI (Average Nucleotide Identity) or dDDH (digital DNA-DNA hybridization) です。
taxonomy database に登録されていない「生物名」の場合は、塩基配列の登録の際に、その由来生物名を DDBJ から taxonomy database に登録申請いたします。
このとき taxonomy database に登録された「生物名」は塩基配列が公開された際に、公開されます。
DDBJ から当該塩基配列データが公開されるまでは、taxonomy database においても、「生物名」は公開されません。
必要に応じて、塩基配列データの公開、生物名の更新をご依頼ください。
更新依頼は、登録データの修正・更新をご参照ください。
原則として、「生物名」には taxonomy database における “scientific name” 以外は記載できませんが、 taxonomy database の記載状況に対して異論がある場合、こちらをご参照ください。
生物名入力におけるカテゴリー (Category) について
DDBJ が運用している WWW 経由の塩基配列登録システムでは登録の際に、生物名入力において Category を選択します。
下図に Category を判断するためのフローチャートを示します。
a. 人工的に構築した配列
Category は “Artificially constructed or synthesized sequence” となりますので、メニューから選択してください。
4. 人工的に構築した配列 を ご参照の上、生物名 (scientific name) を記載してください。
b. ウイルス
画面上で生物名検索を行います。結果一覧から該当するウイルス名を選択します。選択した生物名が scientific name 入力ボックスに反映されます。
/isolate (または /strain、
/serotype、
/collection_date (採取した年月日)、
/geo_loc_name (採取した地名)、
/host などを各 qualifier に記載してください。
下記、生物名記載の各論より、ウイルスについて ご参照ください。
病原性ウイルスの場合には Category で “Pathogenic virus” を選択してください。
c. 三名法などで記載する場合
Category は “Valid subspecies or variety not registered in taxonomy database” となりますので、メニューから選択してください。
下記、生物名記載の各論より、三名法について ご参照の上、scientific name 入力ボックスには subspecies、variety または、それに準ずる strain などを含めて生物名を記載してください。
d. taxonomy database に既存
画面上で生物名検索を行います。結果一覧から該当する生物名を選択します。
Category を選択する必要はありません。
e. 環境サンプル
Category は “Obtained by direct molecular isolation from environmental sample” になります。メニューから選択してください。
下記、生物名記載の各論より、3. 環境サンプル を ご参照の上、生物名を scientific name 入力ボックスに記載してください。
/isolation_source、
/isolate (または /clonen、
/collection_date (採取した年月日)、
/geo_loc_name (採取した地名)、
/host などを各 qualifier に記載してください。
f. 種同定不能な場合の仮称、または、提唱準備中の新種
種同定をしない場合、Category は “Species is not identified” となりますので、メニューから選択してください。
提唱準備中の新種の場合、Category は “Proposing the name for the novel species” となりますので、メニューから選択してください。
下記、生物名記載の各論より、2. 種が同定されていない場合 を ご参照の上、生物名を scientific name 入力ボックスに記載してください。
g. 登録済で非公開 (検索不可) の場合
Category は “The name is valid but not registered in taxonomy database” となりますので、メニューから選択してください。
同じ生物からのサンプルに由来する別データを登録する際は、以前のご登録と共通の学名、もしくは、仮称を入力してください。
h. taxonomy database に未登録で、学名が確立している場合
Category は “The name is valid but not registered in taxonomy database” となりますので、メニューから選択してください。
下記、生物名記載の各論より、1. 種が同定されている場合 をご参照の上、生物名を scientific name 入力ボックスに記載してください。
配列が登録されたことがないと推定される種 もご参照ください。
生物名記載の各論
一部、特殊な例外もありますが、DDBJ への登録の際における「生物名」記載についての考え方を以下に挙げています。
塩基配列データの登録に際して taxonomy database への登録申請が必要な際は、各参考情報 もお知らせください。
1. 種が同定されている場合
「生物名」の登録は属・種の名称を用いた二名法による種の学名 (以下、種名)を原則としております。
種名は、動物、植物、細菌、ウイルスの各国際命名規約に従って記載されるべきです。
例
Homo sapiens
三名法
三名法、または、それに準じた strain などの分類単位で organism を記載する必要がある場合、亜種 subspecies 、変種 variety 、serotype 、strain などを生物名に含めます。
例
Pan troglodytes troglodytes
Zea mays subsp. mays
Oryza sativa Japonica Group
Brassica oleracea var. alboglabra
Escherichia coli K-12
また、このとき /sub_species, /variety, /serotype, /strain の該当 qualifier をあわせて source feature に記載します。
/organism="Pan troglodytes troglodytes"
/sub_species="troglodytes"
微生物ゲノム
以前は 微生物などで全ゲノム規模の配列を登録する場合、strain などを organism
に含めて記載していましたが、現在は学名のみの記載を原則としています。
strain 名は /strain qualifier に記載してください。
/organism="Candida albicans"
/strain="WO-1"
ウイルス
ウイルスは the International Committee on Taxonomy of Viruses に従った種名を基本としています。
識別子について のウイルスに関するセクションをご参照ください。
2017年以前は、登録頻度の高い病原性ウイルスの場合、strain、serotype を生物名に含めて記載する運用を続けていましたが、この運用は新規登録分には適用されません。
例
Influenza A virus
下記の例のように /collection_date (採取した年月日), /geo_loc_name (採取した地名), /host, /isolate (or /strain), /serotype などの該当 qualifier をあわせて source feature に記載します。
/collection_date="2007-11-01"
/geo_loc_name="Japan:Tokyo"
/host="Gallus gallus"
/isolate="A/chicken/Tokyo/2007"
/mol_type="viral cRNA"
/organism="Influenza A virus"
/serotype="H7N7"
雑種
雑種の場合、適宜、以下のように記載します。
例
Rosa alba x Rosa corymbifera
Malus x domestica
Lilium hybrid division I
taxonomy database で見つからない有効な学名
配列が登録されたことがないと推定される種
スペルミスではないことを十分にご確認の上、そのまま登録してください。
genus などの上位ランクも含めて taxonomy database に存在しない場合、lineage についてお知らせください。
可能であれば、種を報告した文献の情報をお知らせください。
ただし、既に登録されている「生物名」でも、配列データが公開されていない段階では taxonomy database においても検索できません。
注) 塩基配列登録システムからの登録の際は、生物名入力におけるカテゴリー (Category) について の
g. 登録済で非公開 (検索不可) の場合をご参照ください。
登録時に以下の参考情報を可能な範囲でお知らせください。
taxonomy database 登録申請のための参考情報
taxonomy database の記載状況に対して異論がある場合
taxonomy database の間違いなどを発見された場合は、ご連絡ください。
学名のスペルミスなどに関しましては修正します。
いわゆる combinatio nova を含め、再分類に関連して提唱する準備段階の場合、その主張が論文を公表して認められるまで、
taxonomy database 上で名称の修正を実施することはできません。
そのため、現状の taxonomy database に準拠した学名を用います。
論文公表後に必要な名称変更を依頼してください。その際に学名について taxonomy database 上での扱いを再検討することになります。
taxonomy database における scientific name, synonym あるいは、lineage などの扱いに異論がある場合、taxonomy database の管理者に修正の検討を依頼することができます。
可能な限り、異論の根拠となる文献をご提示ください。
専門的な内容になると思われますので、単に URL あるいは、文献を示すのみではなく、どうあるべきかについて英文にてコメントを記載してください。
ただし、lineage 解釈などの問題は、データの一意性を担保するため、諸説の1つを採用する方針であり、ご希望に添えないこともあり得ます。
詳細に関しましては、taxonomy database の説明をご一読ください。
登録時に以下の参考情報を可能な範囲でお知らせください。
taxonomy database 登録申請のための参考情報
2. 種が同定されていない場合
2-1. 種を同定しない場合
種同定を伴わない研究の場合、判明している範囲の lineage、多くの場合、属名を用いて、
“<genus name> sp.” などとして記載します。
属より上位ランクの場合、判明している範囲の lineage に細菌ならば “bacterium”、
古細菌ならば、 “archaeon” を付加した名前を記載します。
書式
- <genus name> sp. # 原核生物
- <family (or upper) name> bacterium
- <family (or upper) name> archaeon
例
Acetobacter sp.
Acetobacteraceae bacterium
Methanomicrobiales archaeon
真核生物の場合、判明している範囲の lineage が属レベルでも、属より上位でも “sp.” を付加した名前 を記載します。
書式
- <genus (or upper) name> sp. # 真核生物
例
Aspergillaceae sp.
登録の際には「生物名」とともに 識別子、多くの場合、 /strain, /isolate など該当する qualifier とあわせて source feature に記載します。
/organism="Acetobacter sp."
/strain="ITDI2.1"
真核生物 (カビ、酵母相当の単細胞真菌以外) の場合、あるいは、単細胞の微生物でも全ゲノム規模の配列に該当する場合、
判明している範囲の lineage (多くの場合 属名) を用いて、”<genus name> sp.”などとした上で、
識別子 (多くの場合、strain の名称) を「生物名」に含めて記載しています。
「生物名」に含めている場合でも、識別子を /strain など該当する qualifier に記載してください。
/organism="Euglena sp. CR123"
/strain="CR123"
通常、多細胞生物は “<genus name> sp.” とのみの記載では登録できません。
識別子 (多くの場合、isolate の名称) を「生物名」に含めて記載しています。
「生物名」に含めている場合でも、識別子を /isolate など該当する qualifier に記載してください。
/organism="Oscinella sp. AB_575"
/isolate="AB_575"
仮称を割り当てた生物に由来する別データを登録する際は、共通の仮称とともに登録してください。
2-2. 新種提唱の場合
ウイルスの場合、The International Code of Virus Classification and Nomenclature (ICVCN) に従った命名であれば、 そのまま記載して登録することが可能です。
ウイルス以外は valid publication 前の段階で「正式な学名と混同するような名称」を記載することはできません。
新学名提唱のための準備段階の場合、不明と類似の扱いで学名が確定するまではデータとの対応関係を一意に保つため、
仮称を設定することを原則としています。
学名提唱中のため種名が未確定の場合、「生物名」の一意性を保つために、判明している範囲の lineage、多くの場合、 属名を用いて、”<genus name> sp.”などとした上で、 識別子 (多くの場合、strain 名など) を並記した仮称を割り当てて taxonomy database に登録します。
原核生物の場合、 strain 毎を基本に仮称を割り当てます。
書式
- <genus name> sp. <strain name> # 原核生物
- <family (or upper) name> bacterium <strain name>
- <family (or upper) name> archaeon <strain name>
例
Acetobacter sp. ITDI2.1
Acetobacteraceae bacterium ITDI2.1
真核生物の場合、種の候補単位 (OTU) 毎を基本に仮称を割り当てますが、状況に応じて、strain または isolate 毎としても構いません。
書式
- <genus (or upper) name> sp. <OTU ID> # 真核生物
例
Oscinella sp. 1-AB-2020
この運用により、例えば、異なる生物が同じものと混同されるなどの混乱を避けることができます。
そのため、学名が確定するまでの間、その仮称を割り当てた生物に由来する別データを登録する際は、共通の仮称とともに登録してください。
あくまで当該生物由来サンプルと登録データに関する措置であり、登録者が執筆中の論文他において、どのような名称を用いるか、ということとは別の問題です。
このような taxonomy database に登録された一時的な仮称は、正しい学名が確認できた段階で、その学名に更新変更します。
種を報告する論文が公開された際に、論文情報更新、生物名修正、データ公開を依頼するご連絡をお願いいたします。
更新依頼は、登録データの修正・更新をご参照ください。
登録の際には、「生物名」に含めた下位の rank、strain など該当する qualifier をあわせて source feature に記載します。
/organism="Acetobacter sp. ITDI2.1"
/strain="ITDI2.1"
登録時に以下の参考情報を可能な範囲でお知らせください。
taxonomy database 登録申請のための参考情報
3. 環境サンプル
環境サンプル (environmental sample) とは、PCR、あるいは、その他の方法で直接、分子を単離した環境上のサンプルに由来する配列です。
よく混同されますが、環境サンプルとは「野生型」という意味ではありません。
環境サンプルの定義については環境サンプルの説明もご参照ください。
環境サンプル由来の混合培養系も、環境サンプルと扱います。
3-1 環境プロファイル
環境サンプルの場合、原則、判明している範囲での lineage に “uncultured” を冠して「生物名」を記載します。
環境プロファイルのような場合、一律に “uncultured bacterium” とするか、
配列ベースで判明している範囲の lineage を操作的に下記の書式で記載します。
書式
- uncultured bacterium # 原核生物
- uncultured <genus name> sp. # 原核生物
- uncultured <family (or upper) name> bacterium # 原核生物
- uncultured <genus (or upper) name> # 真核生物
例
uncultured bacterium
uncultured Acetobacter sp.
uncultured alpha proteobacterium
uncultured Bacillaceae bacterium
uncultured Aspergillus
uncultured Aspergillaceae
環境サンプルの場合、必須な
/environmental_sample qualifier、および、
/isolation_source qualifier などでサンプリングの過程・状態などをあわせて source feature に記載します。
/collection_date (採取した年月日) と
/geo_loc_name (採取した地名)、
/host (宿主) の記載も重要です。
識別子 として、/isolate または /clone qualifier を記載します。
/clone="4-11"
/collection_date="2007"
/environmental_sample
/geo_loc_name="Japan: Shizuoka"
/isolation_source="PCR-derived sequence from sediment"
/mol_type="genomic DNA"
/organism="uncultured Acetobacter sp."
taxonomy database (TXSearch) から検索不能な場合、登録時に以下の参考情報を可能な範囲でお知らせください。
taxonomy database 登録申請のための参考情報
3-2 メタゲノムアセンブリ
Metagenome-Assembled Genome (MAG) の場合、単一生物分類群がツールにより割り当てられ得るため、
種、もしくは、それ以下のランクの生物名(例 Agrobacterium tumefaciens)を記載します。
種同定を伴わない MAG の場合、判明している範囲の lineage、多くの場合、属名を用いて、”<genus name> sp.” などとして記載します。
属より上位ランクの場合、判明している範囲の lineage に細菌ならば “bacterium”、
古細菌ならば、 “archaeon” を付加した名前を記載します。
真核生物の場合、判明している範囲の lineage が属レベルでも、属より上位でも “sp.” を付加した名前 を記載します。
書式
- <genus name> sp. # 原核生物
- <family (or upper) name> bacterium # 細菌
- <family (or upper) name> archaeon # 古細菌
- <genus (or upper) name> sp. # 真核生物
例
Agrobacterium sp.
Rhizobiaceae bacterium
Methanomicrobiales archaeon
Aspergillaceae sp.
MAG 相当の場合、 /environmental_sample qualifier、 /isolation_source qualifier、および、 識別子 としての /isolate qualifier に加えて、 /metagenome_source qualifier に、 metagenome taxonomy nodes にある操作的な名称から 適宜、選択して、例えば soil metagenome などのサンプル分離源を反映したメタゲノム名を記載してください。 NCBI のサイトにメタゲノム名の使い分けについて解説されています。
taxonomy database 登録申請のための参考情報
4. 人工的に構築した配列
一般的には、”synthetic construct”、または、”eukaryotic synthetic construct” とのみ一律に記載します。
vector などの名称を、そのまま記載することも可能です。
特定遺伝子の配列のみを登録する場合、”synthetic construct” などを一律に記載してください。
vector 類の全長相当を登録する場合、何らかの命名をしてください。
その際は天然由来の場合と明確に区別するため、 plasmid という単語は用いないでください。
例
Cloning vector pAP3neo
Expression vector pAMP
taxonomy database (TXSearch) から検索不能な場合、登録時に以下の参考情報を可能な範囲でお知らせください。
taxonomy database 登録申請のための参考情報
taxonomy database 登録申請のための参考情報
配列データ登録の際に、その由来となる「生物名」が taxonomy database の存在していない場合、DDBJ を通じて taxonomy database に登録します。
推定可能な範囲の lineage
推定可能な範囲での taxonomic lineage をお知らせください。
種を記載した論文
すでに種名が発表されている場合、記載文献を英語でお知らせください。
提唱中の新種学名
提唱する新種の名称に関しては、別途、taxonomy database でも管理しますので、お知らせください。
提唱する新種の名称が文献に公表された際、あるいは、名称が変更になった場合、DDBJ アップデートまでご連絡ください。
以前に登録した配列のアクセッション番号
由来生物名が同一である塩基配列データを INSDC (DDBJ/ENA/GenBank または BioSample) に登録済みでしたら、アクセッション番号とともに、その旨をお知らせください。