DDBJ/EMBL/GenBank国際塩基配列データベースでは,1999年3月からデータベース中の特定の配列を示すためのIDである配列のバージョン番号(Nucleotide Sequence IDとProt ein ID)を導入しました。 この導入にともないDDBJではリリース39よりこれまでフラットファイルに記述されていたNIDとPIDを削除しました。
PIDが削除されたので,DAD (DDBJ Amino Acid Database) のフォーマットも一部変更し,これまでPIDを記述していた欄に以下のようにprotein_idを記述することになりました。
変更前 |
LOCUS AB000714 220 aa PRT HUM 27-OCT-1997DEFINITION Homo sapiens RVP1 protein.ACCESSION AB000714-1PID d1023862(以下略)</code> |
変更後 |
LOCUS AB000714 220 aa PRT HUM 27-OCT-1997DEFINITION Homo sapiens RVP1 protein.ACCESSION AB000714-1PID BAA22986.1(以下略)</code> |
*Protein IDは「CDSに振る ID+バージョン番号」で構成され,DNAデータベースフ~ラットファイルのCDS featureに "/protein_id" qualifierとして記述されています。 このバージョン番号は配列の変更があった場合にのみ更新されます。