DDBJ が管理・収集している塩基配列データベースは年4回定期リリースとして anonymous FTP サイトで公開しています。 これまでフラットファイル形式・FASTA 形式・DDBJ-XML 形式・CDS 配列の4種類の形式で提供していましたが,DDBJ リリース62(2005年6月)より INSD-XML 形式での提供も開始しました。 INSD-XML 形式での提供は,2005年5月より毎日公開される新着データでは行なわれていましたが,今後は定期リリースも同形式でご利用いただくことができます。
INSD-XML は DDBJ, EMBL ならびに GenBank によって構成されている国際塩基配列データベース共同体 (INSDC) が共通に使用する DTD (Data Type Definition) です。 現在の DTD については,INSDC でいかなるエントリについても問題が起きないことや,相互に XML ドキュメントを読み書きできることをテストして成熟させていく予定です。 したがって,DTD 自身が随時変更される可能性があります。 また,DTD から XML ドキュメントに展開する部分についても随時変更される可能性があります。 DTD のバージョンはファイル中に記載されています。
公開ディレクトリ: ftp://ftp.ddbj.nig.ac.jp/ddbj_database/ddbj/xml/insd/
INSD-XML 用の DTD: 同じディレクトリにある INSD_INSDSeq.dtd です。
getentry での利用: 検索時に DNA データベースを指定して INSD-XML を選択すると,結果を INSD-XML 形式で表示します。
DDBJ-XML は,プログラムによる処理を容易にするとともに,これまで広く利用されてきたフラットファイル形式を意識して,人間にとっても読みやすいドキュメントが生成されることを目指して設計されました。
INSD-XML は,フラットファイルとの親和性よりも,Features/qualifiers の構造を意識して設計されました。
どうぞご利用下さい。
過去のおしらせ
INSD-XML 公開のおしらせ (2005.05.23)
XML 形式でのリリース公開開始 (2001.07.25)
XML を導入 (2001.05.11)