2月15日号の Nature誌(409巻,860-921頁)に, ヒトゲノム草稿配列に関する論文が, ヒトゲノム配列決定国際合同チームによって発表されました。この国際合同チームは,米,英,日,仏,独,中各国の公的研究機関が参画しており, 日本からは,理化学研究所ゲノム科学総合研究センターのゲノム構造情報研究グループ (榊佳之プロジェクトディレクター) と慶応義塾大学医学部分子生物学科清水信義教授のグループが参加しています。 また,論文の末尾には,塩基配列データベースを国際協調を通じて構築, 運営している GenBank, EMBL, DDBJ も特記されています。

このヒトゲノム草稿配列については,昨年6月に, ホワイトハウスで配列決定終了の宣言がされましたが, その後読み取り精度の向上とゲノム配列の生物学的解析が進められました。 その結果が,昨日発表されたこのNatureの論文と,本日発表される,Celera社による Scienceの論文 (291巻,5507号,1304-1351頁)に結実しました。 Nature論文の冒頭にも書かれているように, メンデルの遺伝法則が再発見されてから100年ほどたって, 人類は自分たち自身の遺伝情報を, これ以上詳しくは記述できない,基底レベルまで知り得たことになります。 この成果は,21世紀の生物学の出発点としても, 大きな意義を持つことになると思われます。

論文発表にさきだって, 2月12日にヒトゲノム配列決定国際合同チームは世界同時に報道発表を行ないました。 日本でも都内で記者会見が行われましたが, 理化学研究所ゲノム科学総合研究センターの和田昭允所長, 同榊佳之プロジェクトディレクター,同藤山秋佐夫チームリーダー, 慶応義塾大学医学部の清水信義教授,同蓑島伸生助教授のほかに, DDBJを代表して,国立遺伝学研究所生命情報研究センターの菅原秀明教授が出席しました。 なお,藤山秋佐夫先生は,国立遺伝学研究所人類遺伝研究部門に所属されています。

  • ヒトゲノムは,領域によって遺伝子やトランスポゾンの数,GC含量, CpG高頻度領域,組み換え率が大きく異なっている。 これらのゲノム構造は,遺伝子の機能について重要な鍵を与えてくれる。 たとえば,Hox遺伝子クラスターは,もっとも繰り返し配列の少ない領域であり, おそらく非常に複雑な遺伝子発現制御をしているためだろう。
  • タンパク質の情報をになう遺伝子数は3~4万個であり, 線虫やショウジョウバエの遺伝子数の2倍程度に過ぎない。 しかし,DNAを転写してmRNAにする過程で, 同一のDNAから複数種類のmRNAを生成すること (alternative splicing)により,タンパク質の種類はもっと多い。
  • ヒトゲノムの持つタンパク質配列の情報は, 無脊椎動物よりもずっと複雑である。 これは,脊椎動物独自のタンパク質ドメインが約7%ほど存在することにもよるが, それよりも,既存ドメインを組み合わせてより豊富な種類にしているためである。
  • ヒトゲノム中の数百個の遺伝子は, 脊椎動物の進化のあいだにバクテリアから水平移動によって飛び込んできたものである。
  • ヒトゲノム配列の約半分は転移可能因子(transposable element) で占められているが,ヒト科の進化の過程で,これらの因子の活動は大きく減じている。 DNAトランスポゾンやLTRはほとんど完全に不活性化したようである。
  • 突然変異率は男性では女性の約2倍高い。
  • 組み換え率は染色体の末端付近領域で高い傾向にあり,染色体1本につき, 減数分裂ごとに少なくとも1回の交叉が生じると考えられる。
  • 140万個以上のSNP(単一塩基多型)が同定された。

ヒトゲノム配列決定国際合同チームが決定した全ゲノム配列は DDBJ, GenBank および EMBL の公的データベースから公開されています。 DDBJの場合は、HTG divisionならびにHUM divisionのエントリーとしてと, ヒトゲノム情報工房のWebページからも公開しています。 後者の場合, 各染色体ごとにすべての配列がまとめられているファイルをダウンロードすることができます。

ヒトゲノム配列決定国際合同チームが発表した塩基配列と, Celera社の決定した塩基配列では,差異があります。 たとえば,国際合同チームは少数の長いコンティグでゲノム配列をカバーしていますが, Celera社は多数の短いコンティグでゲノム配列をカバーしています。 また,解析結果にも差異がありますが,これは、解析対象とした材料が異なること (個人差),塩基配列決定の手順が異なること, データ解析方法が異なることなどによるものと思われます。
しかし,Celera社のデータは公的データベースでは公開されていません。 Celera社のサーバーから利用制限付で公表されています。 この状況に対して,学術論文が保証しなければならない再現性を損なうことと, 生物に関わる研究にとってきわめて重要なデータベースの分断化を引き起こしかねないということから, 日本学術会議を含めて,国内外で抗議の声があがっています。

このような政治的な問題はあるにせよ, ヒトゲノム全体の塩基配列があと2~3年で完全に決定されるということは, 生物学だけでなく,現代の人類文明が到達した偉大な成果となるでしょう。 私たち日本DNAデータバンク(DDBJ)は,この国際的大事業において, データベース構築という重要な部分をになう義務を負っており, 今後も努力を続けてゆく所存です。 皆様のご協力を今後もよろしくお願いいたします。