2008年から DDBJ/EMBL-Bank/GenBank 国際塩基配列データベース (INSDC) では、アセンブルされた cDNA 配列データを、Transcriptome Shotgun Assembly (TSA) division に受け付けています。
以前、INSDC は EST アセンブルによって得られた配列データの登録を受け付けていませんでした。しかし、新しい塩基配列決定技術の普及に伴い、INSDC に EST アセンブルに相当する配列データの登録依頼が急増しました。このような配列データは、正しくアセンブルされておらず自然界に存在していないケースをも含んでいる可能性がありますが、近年、その需要も高まってきました。そこで、DDBJ/EMBL-Bank/GenBank は EST アセンブルに相当する配列データを専用に格納する TSA division を新設し、登録を受け付けることを決定しました。
TSA を登録するためには、その登録に先立ってアセンブリの元となる1次転写産物 (primary transcripts) の配列データ(プライマリーエントリ)が DDBJ/EMBL-Bank/GenBank の EST division、DDBJ Trace Archive、DDBJ Read Archive の何れかに登録されている必要があります。
プライマリーエントリが TSA 登録者と異なる登録者に帰属する配列データである場合は、TPA として扱います。
TSA 登録には、大量登録システム (MSS) をご利用ください。
プライマリーエントリとは、DDBJ/EMBL-Bank/GenBank、Trace Archive、Sequence Read Archive の何れかから取得可能なデータであり、当該エントリの登録者が実験的に配列決定を行った mRNA 配列データです。
TSA 登録の時点では、プライマリーエントリが非公開でも問題ありませんが、TSA の公開時には、プライマリーエントリ取得・閲覧可能な状態である必要があります。
[1] 'n' で示される塩基は 5% より少ないこと
[2] 連続した 'n' で示される区間が 5 塩基以下であること
LOCUS FS000000 800 bp mRNA linear TSA 15-OCT-2008 DEFINITION TSA: Homo sapiens GAPD gene for glyceraldehyde-3-phosphate dehydrogenase, complete cds. ACCESSION FS000000 VERSION FS000000.1 DBLINK BioProject:PRJDA43210 KEYWORDS TSA; Transcriptome Shotgun Assembly. SOURCE Homo sapiens (human) ORGANISM Homo sapiens Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini; Catarrhini; Hominidae; Homo. REFERENCE 1 (bases 1 to 800) AUTHORS Mishima,H. and Shizuoka,T. TITLE Direct Submission JOURNAL Submitted (30-SEP-2008) to the DDBJ/EMBL/GenBank databases. Contact:Hanako Mishima National Institute of Genetics, DNA Data Bank of Japan; Yata 1111, Mishima, Shizuoka 411-8540, Japan REFERENCE 2 AUTHORS Mishima,H., Shizuoka,T. and Fuji,I. TITLE Glyceraldehyde-3-phosphate dehydrogenase of human JOURNAL TSA Biol 12, 61-70 (2008) COMMENT PRIMARY TSA_SPAN PRIMARY_IDENTIFIER PRIMARY_SPAN COMP 1-599 ZZ000004.1 2-598 1-669 ZZ000005.1 11-679 2-596 ZZ000006.1 1-595 2-575 ZZ000007.1 1-574 5-676 ZZ000008.1 1-672 6-725 ZZ000009.1 1-720 59-369 ZZ000010.1 13-322 605-800 ZZ000011.1 1-196 c FEATURES Location/Qualifiers source 1..800 /db_xref="taxon:9606" /mol_type="transcribed RNA" /organism="Homo sapiens" CDS 73..669 /codon_start=1 /gene="GAPD" /product="glyceraldehyde-3-phosphate dehydrogenase" /protein_id="BAA00000.1" /transl_table=1 /translation="MWYQSLVIIEKLNLEANIGKLINTKDNINIRCRLSHTEEHSWHS -- The rest of amino acid sequence is omitted -- " BASE COUNT 199 a 203 c 198 g 200 t ORIGIN 1 attaatataa gctaaatatg tttttcaata tatattgata atagaatatc aacaatttgg : -- The rest of nucleotide sequence is omitted -- : //