DDBJ では2001年より anonymous FTP と getentry で XML 形式 (DDBJ-XML)(*)でもデータを提供してきましたが,2005年4月29日より INSD-XML 形式でのデータも試験的に(**) 提供を開始しました。 INSD-XML は DDBJ, EMBL ならびに GenBank によって構成されている国際塩基配列データベース (INSD) が共通に使用する DTD (Data Type Definition) です。
(*) DDBJ-XML は,プログラムによる処理を容易にするとともに,これまで広く利用されてきたフラットファイル形式を意識して,人間にとっても読みやすいドキュメントが生成されることを目指して設計されました。
INSD-XML は,フラットファイルとの親和性よりも,Features/qualifiers の構造を意識して設計されました。
(**)現在の DTD については,今後1年間をかけて,国際塩基配列データベース3極でいかなるエントリーについても問題が起きないことや,相互に XML ドキュメントを読み書きできることをテストして成熟させていく予定です。 したがって,DTD 自身が随時変更される可能性があります。 また,DTD から XML ドキュメントに展開する部分についても随時変更される可能性があります。
・FTP サイトでの利用
anonymous FTP 公開ディレクトリとファイル名は次のような構成になっています。 現在 anonymous FTP で公開しているデータは,毎日公開される新着データのみですが,次回の DDBJ リリース62 (2005/06) より定期リリースも公開する予定です。
公開ディレクトリ:ftp.ddbj.nig.ac.jp/database/ddbjnew/xml/insd/
公開ファイル名:DDBJNEWr##.XXX.insd_xml.gz (e.g. DDBJNEWr61.062.insd_xml.gz)
## リリース番号, XXX シリアル番号
・リリース番号・シリアル番号は毎日公開される anonymous FTP データと同様です。
・TPA, CON も1ファイルにまとめて公開いたします。
・INSD-XML 用の DTD は同じディレクトリにある INSD_INSDSeq.dtd です。
・getentry での利用
getentry では検索時に DNA データベースを指定して INSD-XML を選択すると,結果を INSD-XML 形式で表示します。
どうぞご利用下さい。