FEATURES/Location/Qualifiers で記述できないその他の情報やコメントなどが記載されています。
例えば、登録者の所属が複数ある場合、REFERENCE 1 で記載されていない方を記載することがあります。

COMMENT     Human cDNA sequencing project.


Structured COMMENT

Structured COMMENT は feature/qualifier で未定義なデータセットを一群の登録で共有することを目的とした記載法です。
Structured COMMENTを利用して、登録者とデータ利用者のコミュニティでフラットファイルを介してデータセットを公開・共有することが可能になります。
データセットを [項目名] と [項目の値] の組で構造化された COMMENT 行に記載します。
genome project (WGS を含む), transcriptome project (TSA を含む) など一部の配列データ登録に際し、記載を義務付けられている structured COMMENT が存在します。

COMMENT     ##Genome-Assembly-Data-START##
            Finishing Goal           :: Finished
            Current Finishing Status :: High Quality Draft
            Assembly Method          :: Newbler v. 2.3
            Genome Coverage          :: 30x
            Sequencing Technology    :: 454 GS Junior; Illumina GA II
##Genome-Assembly-Data-START## -- Genome-Assembly-Data という名称で定義される structured COMMENT の記載開始行。
##Genome-Assembly-Data-END## -- Genome-Assembly-Data という名称で定義される structured COMMENT の記載終了行。

この例はゲノムプロジェクトで記載を義務付けている Genome-Assembly-Data という補足情報のデータセットです。
上記の2行の間にある記述内容は “ :: ” で区切られ、補足情報の項目とその値の組になっています。

Finishing Goal           :: Finished -- ゲノムプロジェクトが最終的に目指している到達レベルが、Finished であることを示します。
Current Finishing Status :: High Quality Draft -- ゲノムプロジェクトの現在の到達レベルが、High Quality Draft であることを示します。
Assembly Method           :: Newbler v. 2.3 -- 配列をアセンブルする際に用いたソフトウェアが Newbler で、そのバージョンが 2.3 であったことを示します。
Genome Coverage          :: 30x -- 実際に読んだ延べ配列長がそのゲノム配列の長さの約30倍に相当することを示しています。
Sequencing Technology    :: 454 GS Junior; Illumina GA II -- 配列決定に用いたシークエンサーが 454 GS Junior と Illumina GA II であることを示しています。


MGA データの生成手法

MGA データには、登録配列が生成されるまでの過程(シーケンス用サンプルの調製法、生の配列データから登録配列への処理方法など)が記載されています。

COMMENT     The CAGE (cap analysis gene expression) is based on preparation
            and sequencing of concatamers of DNA tags deriving from the
            initial 20/21 nucleotides from 5' end mRNAs.
            Full-length cDNAs were at first selected with the Cap-Trapper
            method. Then, a specific linker (Linker1, some linker contain 5 bp
            sequences that have 15 variations for each rna sample) containing
            the ClassIIs restriction enzyme site MmeI was then ligated to the
            single-strand cDNA and then the second strand of cDNA synthesized.
            The resulting double-stranded cDNA was cleaved by the restriction
            enzyme MmeI and a second linker (Linker2) was ligated to the 2 bp
            overhang at the MmeI cleaved site, to produce a 5' 20/21 tag
            having two linkers at both sides. The ligation products were
            separated from unmodified DNA with magnetic beads. The 5' end cDNA
            tags were released from the beads, and the DNA fragments were
            amplified in a PCR step by using the two linker-specific primers
            (Primer1 (uni-PCR), Primer2 (MmeI-PCR)). The desired 32-37 bp tags
            were purified and ligated to form concatamers, and then the
            concatamer were fractionated and ligated to the plasmid ZErO-2.
            The ligations were finally electroporated into DH10b cells
            (Invitrogen) and obtained plasmids were sequenced with forward
            CAGE libraries were sequenced with forward primers essentially as
            described with minor modifications to use zeocin for selection of
            recombinants. We used in-house developed algorithms for the
            extraction of tags and for masking the vectors. CAGE tags were
            extracted with the following parameters: vector masking, minimum
            12 bp recognition allowed; linker (13 bp) masking: maximum
            mismatch, 2 bp allowed; XmaJI site maximum mismatch, 2 bp allowed;
            tag length, 17-24 bp.
            Linker1: "Upper oligonucleotide GN6":
            biotin-agagagagacctcgagtaactataacggtcctaaggtagcgacctagg (5 bp)
            tccgacGNNNNN and "Upper oligonucleotide N6":