国際塩基配列データベース(INSD)では,超大量の転写物配列に対応するために
登録・公開についての検討を進めています。その一環として,ゲノム配列のアノテーションに有意義な情報を提供する超大量の配列群を受け入れるためのカテゴリーMGA(Mass sequence for Genome Annotation),を創設しました。MGAは既に存在している超大量のゲノム断片配列を格納している WGS(Whole Genome Shotgun)と同様にDivisionではなく,カテゴリーに分類されます。
INSDの定めるMGAの定義は以下となっております

Definition of MGA
MGA is defined as those sequences which are produced in large quantity in view of genome annotation.
本日2005年1月24日よりMGAカテゴリーに属するデータを公開いたします。
配列データは独立行政法人理化学研究所の林崎良英博士をリーダーとする研究グループから登録されたエントリーです。このデータはCAGE(Cap Analysis Genome Expression)法によって作出されたMus musculus 由来の転写物(cDNA)領域5'末端、約20bpの長さの配列で,エントリー数は383,264となっています。

URL:ftp://ddbj.nig.ac.jp/database/mga/

また,FTP を利用したリリースデータ取得のページからもリンクが張ってあります。
公開される配列は生命情報・DDBJ研究センターで運営されています国際共同遺伝子発現データベース,CIBEX;Center for Information Biology gene EXpression database,(http://cibex.nig.ac.jp/index.jsp)にて公開されているデータとも連携しています。

なお,このデータ公開については,2005年1月17日付けの日本経済新聞にも記事が掲載されました。