お知らせとお詫び

5月28日13:00- に予定されていました ジャネット ソーントン(Janet Thornton) の講演は、航空機トラブルにより本人が来日できなくなったため、キャンセルとなりました。
そのため、5月28日の午後のプログラムの時間に変更がある可能性があります。どうぞご了承下さい。
2017年国立遺伝学研究所国際シンポジウム DDBJ 30 周年記念 「ゲノムでわかる生命・環境・進化」
要旨集 pdf ダウンロード

参加登録された方には、当日受付でお配りいたします。
プログラム
Program
5月27日(土) / May 27th(Sat) 講演言語:日本語 / 英語
All-in-one 合同講習会(2017) /
All-in-one Database Tutorial 2017 (in Japanese)

All-in-one 合同講習会2017 のプログラムと申し込みのページ

All-in-one 合同講習会とは?

国内の生命科学データベースを構築・運営する4つの主要機関が合同で行う講習会です。今回は、高校生や一般の方向けに、スマホやタブレットで誰でも見られるデータベースの紹介やデータベースの国際的なネットワークについてわかりやすくお話しします。

4つのデータベース
バイオサイエンスデータベースセンター(NBDC)
NBDC(National Bioscience Database Center)は、日本の生命科学データベースのリーダーとして、データベースをまとめて使いやすくしている機関です。
ライフサイエンス統合データベースセンター(DBCLS)
DBCLS(Database Center for Life Science)は、データベースをより便利に使いやすくするために、ビデオや日本語のマニュアルなどの教材作成や講習会の開催などを行っています。
日本蛋白質構造データバンク(PDBj)
PDBj(Protein Data Bank Japan)は、タンパク質の立体構造データベースPDBを米国、欧州と共同運営する世界三拠点の一つです。
日本 DNA データバンク(DDBJ)
DDBJ(DNA Data Bank of Japan) は、DNA配列データベースを米国、欧州と共同運営する世界三拠点の一つです。
(第1部) データべースは世界をつなぐ
13:00 - 13:10
  • 開会のあいさつ
  • Opening
開会のあいさつ
桂 勲(国立遺伝学研究所 所長)
Isao Katsura (Director-General, National Institute of Genetics)
13:10 - 13:40
  • 講演
  • Lecture
EBI 講義
Guy Cochrane
(European Bioinformatics Institute / 欧州バイオインフォマティクス研究所)
13:40 - 13:50
休憩
break
 
 
13:50 - 14:20
  • 講演
  • Lecture
Genbank 講義
Ilene Mizrachi
(National Center for Biotechnology Information / 米国 国立生物工学情報センター)
14:20 - 14:40
休憩
break
 
 
(第2部) 私たちも見て触れる日本のデータベース
14:40 - 15:05
  • 講演
  • Lecture
誰でも使える最先端の研究成果/今日からあなたも生命科学者
箕輪 真理(バイオサイエンスデータベースセンター)
Mari Minowa(National Bioscience Database Center)
ライフサイエンス(生命科学)は文字通り、生命や生活に大きく関わる学問なので、幅広い分野の中には『微生物』から『ヒト』まで、また『医』や『食』、『環境』など様々な研究対象があるうえ、解析技術の進展によるビッグ・データの波がここにも押し寄せていて、必要な情報を見つけ出すのが非常に困難になっています。バイオサイエンスデータベースセンター(NBDC)は生命科学のデータベースを集め、使いやすくするためのセンターです。集められたデータベースは、日本で実施された研究プロジェクトを中心に、最先端の研究成果として生み出されたものですので、次の新たな研究に必要な情報が詰まっていることはもちろんですが、普段の暮らしや学習に役立つ(かもしれない!?)情報もあります。講義では、NBDCから公開しているデータベースの使い方をご紹介して、生命科学研究の入口へご案内します。
15:05 - 15:30
  • 講演
  • Lecture
今日から使える便利な生命科学系公共データベース in DBCLS
小野 浩雅(ライフサイエンス統合データベースセンター)
Hiromasa Ono(Databas Center for Life Science)
ライフサイエンス分野では、1990年代後半から、急速に進展したゲノムプロジェクトやオミクスプロジェクトにより大量のデータが産み出されるようになり、その結果、世界中で数千をこえる多様なデータベースが研究成果として公開されています。データベースをうまく使いこなすことが研究の進展に不可欠になっていますが、「必要なデータベースが見つからない」「使い方がよくわからない」「データを組み合わせてより高度な解析ができない」など不便を訴える意見も多く、データベースを効率よく利用するための環境整備は充分ではありません。ライフサイエンス統合データベースセンター(DBCLS)では、データベースを日々利用する生命科学系研究者にその価値を届けるため、ウェブサービスやコンテンツの充実を図っています。本講演では、DBCLSが提供する、誰でも使える便利な生命科学系のデータベースやウェブツールを紹介します。
15:30 - 15:50
休憩
break
 
 
15:50 - 16:15
  • 講演
  • Lecture
「生命の素子」のカタチのデータベース: 蛋白質構造データバンク
鈴木 博文(大阪大学蛋白質研究所)
Hirohumi Suzuki(Institute for Protein Research Osaka Univercity)
タンパク質がどんなカタチをしているか見たことがありますか?多様な生き物の多様な活動には、それぞれ必要なたくさんのタンパク質の役割があり、その役割ごとに多様なカタチのタンパク質があります。この講習では「タンパク質構造データバンク」を利用して、専門家でない方でも楽しめるようなサービスの使い方を中心に、タンパク質の立体構造を眺めながら生命の神秘に触れてみる方法について解説します。
16:15 - 16:40
  • 講演
  • Lecture
自宅でできるゲノム研究:DDBJ/GenBank/ENA
有田 正規(国立遺伝学研究所)
Masanori Arita(National Institute of Genetics)
多くの生命科学データや解析ツールは無償で公開されています。インターネットさえあれば、ゲノムや遺伝子の情報を入手するだけでなく、解析結果を論文にするぐらいの情報が目の前に広がっています。これは努力無しにできることではありません。世界中の生命科学者が協力してきた成果として、無償のデータベースが実現されています。ここではその重要性を示すとともに、ゲノムや配列データベースの検索から近縁関係の推定まで、分子進化学の基本となる概念やツールを紹介します。

5月28日(日) / May 28th(Sun) 講演言語:日本語 / 英語(通訳あり)
講演会 ・ ポスター発表 / Lectures ・ Poster Session

10:00 - 11:00
  • 講演
  • Lecture
  • 通訳あり
ヒト胃腸と海洋のマイクロバイオーム解析
ペーア ボルク / Peer Bork
ヨーロッパ分子生物学研究所 グループリーダー
Group Leader of EMBL, Heidelberg, Germany

11:00 - 12:00
  • 講演
  • Lecture
生物学の統合的理論としての進化
長谷川 眞理子 / Mariko Hasegawa
国立大学法人 総合研究大学院大学 学長
President, National University SOKENDAI

12:00 - 13:00
休憩
lunch break
 
 

13:00 - 14:00
  • 講演
  • Lecture
  • 通訳あり
医学研究におけるビッグ・データ
ジャネット ソーントン / Janet Thornton
前ヨーロッパ生命情報学研究所所長
Former director of EMBL-EBI, Hinxton, UK

14:00 - 15:00
  • 講演
  • Lecture
ヒトゲノム計画: その歴史とインパクト
榊 佳之 / Yoshiyuki Sakaki
東京大学 名誉教授 / 学校法人静岡雙葉学園 理事長
Emeritus Professor, The University of Tokyo
The President, Shizuoka Futaba Senior/Junior High School
15:00 - 15:15
ライトニングトーク
Lightning Talks
 
 
15:15 - 16:30
ポスター
Poster session
 
 
16:30 - 16:45
表彰
Commendation
ポスター講評
Poster review
桂 勲 / Isao Katsura
国立遺伝学研究所 所長
Director-General, National Institute of Genetics

16:45 - 17:45
  • 講演
  • Lecture
我が国における生命科学分野のデータベース開発:現状と課題
高木 利久 / Toshihisa Takagi
東京大学 教授/国立遺伝学研究所 DDBJセンター センター長
Professor,The University of Tokyo/Director of DDBJ Center, National Institute of Genetics

5月29日(月) / May 29th(Mon) 講演言語:英語
Oral Sessions (English only)

Session1: Systems Biology and Informatics (9:30 - 10:30)

9:30 - 10:10
  • Invited lecture
Diagnosing un-occurred diseases by dynamic network biomarkers
-- detecting the tipping points of biological processes by omics data
Luonan Chen
Excutive Director, Key Laboratory of Systems Biology, Shanghai Institutes for Biological Sciences, China
10:10 - 10:30
  • Oral presentation
"Folding transition” in the sequence subspace around a protein family
Akira Kinjo (Institute for Protein Research, Osaka University)
10:30 - 10:50
Break
 
 

Session2: Transdisciplinary and Omics (10:50 - 12:10)

10:50- 11:30
  • Invited lecture
No end in sight for gene function discovery: How long will it take to understand the human genome and what can be learned from the GAA1/GPAA1 function discovery story?
Frank Eisenhaber
Executive Director, Bioinformatics Institute,A*Star Singapore
11:30 - 11:50
  • Oral presentation
  •  
Classification of alkaloid compounds based on subring skeleton (SRS)
Ryohei Eguchi (Graduate School of Information Science, Nara Institute of Science and Technology)
11:50 - 12:10
  • Oral presentation
LC-HRMS metabolomics method with high specificity for metabolite identification using all ion fragmentation (AIF)
Romanas Chaleckis (Gunma University Initiative for Advanced Research)
12:10 - 13:30
Lunch break
 
 

Session3: Biology and Database (13:30 - 14:40)

13:30 - 14:00
  • Invited lecture
From database to database integration
Susumu Goto
Professor, DBCLS
14:00 - 14:20
  • Oral presentation
  •  
Single-cell enhancer RNA analysis in mouse embryonic stem cells
Haruka Ozaki (Advanced Center for Computing and Communication, RIKEN)
14:20 - 14:40
  • Oral presentation
  •  
gEVE, genome-scale endogenous viral element database, and its applications
So Nakagawa (Micro / Nano Technology Center, Tokai University)
14:40 - 15:00
Break
 
 

Session4: Genetics and Genomics (15:00 - 16:10)

15:00 - 15:30
  • Invited lecture
Toward creating future medicine based on genome information
Tadashi Imanishi
Professor, Tokai University School of Medicine
15:30 - 15:50
  • Oral presentation
  •  
Global deceleration of gene evolution following recent genome hybridizations in fungi
Wataru Iwasaki (Graduate School of Science, The University of Tokyo)
15:50 - 16:10
  • Oral presentation
  •  
A new protocol for constructing the ortholog table in microbial genome database for comparative analysis (MBGD)
Ikuo Uchiyama (National Institute for Basic Biology)
講演者の紹介と講演要旨

ペーア ボルク(Peer Bork)
ヨーロッパ分子生物学研究所 グループリーダー
ヨーロッパ分子生物学研究所のグループリーダーで、分子生物学・遺伝学分野においてヨーロッパで最も引用される研究者として知られる。 Nature誌のメンター賞(2008) や Felix Burda賞 (2016)など、数々の功績を持つ。
ヒト胃腸と海洋のマイクロバイオーム解析
ヒトの胃腸マイクロバイオームはメタゲノム解析(Qin et al., Nature 2010)でわかる。1千種以上が重要機能に関与し、30以上もの疾患とも関連する。ここでは大腸がんを例に、進行度マーカーとなる微生物種に基づいた診断の見通しや、そうした複雑データを解釈する際の問題点を解説する。例えば薬を飲むと、胃腸の微生物叢はおおかた変化し(例 Forslund et al., Nature 2015)、病気関連のシグナルがぼやけてしまう。糞便微生物叢の移植といった異なる変化要因を理解するためにも、一塩基変異(SNV; Schloissnig et al. 2013)を用いた個体群情報の解析が必要である(Li et al., Science 2016)。SNV解析は、ホスト種の運命を追跡したり、糞便中の病原性菌や共生菌を同定するのにも役立つ。
ヒトの病原菌の多くは環境由来である。そのために微生物の多様性を地球レベルで解析し、地理的分布や役割の解明も必要になる。そうした地球レベルアプローチの好例がTARA海洋プロジェクトである。ここでは、主要な海洋から集められた35000サンプルのプランクトンを用いて、地球規模の微生物多様性を調査している(Bork et al., Science 2015 とその参考文献)。

長谷川 真理子(Mariko Hasegawa)
国立大学法人 総合研究大学院大学 学長
行動生態学を専門とする進化生物学者。 野生のチンパンジー、イギリスのダマジカ、野生ヒツジ、スリランカのクジャクなどの研究を行ってきた。最近は人間の進化と適応の研究を行なっている。
生物学の統合的理論としての進化
生命現象には、遺伝子のレベルから、細胞、器官、個体、個体群、群集と階層性がある。それらの知識をすべて結びつけて、生命現象を総合的に理解する枠組みが進化である。一方、1973年のノーベル医学・生理学賞受賞者の一人であるニコ・ティンバーゲンが述べたように、生物の形質が「なぜ」あるのかという問いに対しては、1)その形質はどのような仕組みで存在しているのか(至近要因)、2)どんな機能を持っているから存在しているのか(究極要因)、3)どのようにして発達してきたのか(発達要因)、4)どのような祖先形質から進化してきたのか(系統進化要因)という、4つの異なる研究アプローチがある。これらはそれぞれ別に研究して独立に答えることができるが、4つを統合して意味のある答えにするのも、進化の考えである。
 進化とは、生物の持つ形質が、世代を経るとともに変化していくことである。もっとも狭い意味では、集団中の遺伝子頻度が世代を越えて変化していくことであるが、細胞、器官、個体のレベルに見られる形質が世代を越えて変化していれば、それは進化の結果であると考えられる。遺伝子レベルでの進化が解明されていないからと言って、進化を考えることができないわけではない。それどころか、さまざまな表現型形質が進化する条件について広く調査し、考えることによって、新たな疑問や課題が発見されることは多い。
 淘汰が起こるレベルについて、かつては、「種の保存のため」など、集団レベルでの利益を当然の前提とする議論が多かった。それは、1970年代に「群淘汰の誤り」として批判され、ドーキンスを初めとする遺伝子淘汰の理論へと転換した。以後の研究から、遺伝子どうし、雄と雌、個体と集団など、さまざまな進化的葛藤が存在することがわかってきた。また、人間が生み出す技術や考えが世代を経てどのように変遷していくのかを、生物進化の考えをもとに考察する、文化進化の考えも発展してきている。

ジャネット ソーントン (Janet Thornton)
ヨーロッパ生命情報学研究所 前所長
ヨーロッパの情報生物学を統合するELIXIRプロジェクトに大きく貢献した。ロンドン大学でクリスティン・オレンゴと開始したタンパク質立体構造のCATH分類は有名。バイオインフォマティクスにおける顕著な貢献により、2012年に大英帝国の騎士勲章を受賞。
医学研究におけるビッグ・データ
この半世紀に、生物学の分子レベルでの理解が飛躍的に進んだ。特に研究室レベルのゲノミクス、トランスクリプトミクスは「ビッグ・データ」を目の当たりにしている。そのデータ解析は、実験上の難しさとは異なる初めての試練であり、その知識を医療に活かすのは更に難しい。
 この講演では、生物学におけるデータという概念が如何に変容したか、世界中に分子生物学のコア・データを提供するヨーロッパ生命情報学研究所(EBI)における自らの経験をもとに紹介する。医学データの概念は今も変化しつづけている。しかし分子データと症状データとの「摺り合わせ」がうまくいくならば、未来における診断や治療の見通しは非常に明るい。イギリス政府がNHSを通して支援する10万ゲノムプロジェクトは、こうした技術を医療に応用する起爆剤である。
 ここでは基礎科学が如何に医療に役立つか、2つの事例を紹介したい。一つは「希少疾患」で、タンパク質の立体構造が子供の成長阻害に関わる変異型の発見や理解に役立った例を示す。もう一つは、遺伝子発現量データが老化に関わる薬を発見するのに役立った例である。
 最終的には、地球全体で健康を増進するため、わわわれの知識を分け隔てなく共有せねばならない。これには生物医学データ用の多大な計算機資源と、計算機科学者、生物学者、データ科学者や臨床医の密な協力が必要である。EMBL-EBIは既に、世界中の機関と協働して生物データ用の計算機環境を作り上げている。欧州内では、生物情報学のデータ、ツール、資源やノウハウまで共有するELIXIRコンソーシアムも作り上げた。医学データはこれよりも遥かに巨大で多様なインフラを必要とする。今はその端緒についたばかりである。

榊 佳之 (Yoshiyuki Sakaki)
東京大学 名誉教授 / 学校法人静岡雙葉学園 理事長
日本のヒトゲノム計画を主導し、東京大学教授、理化学研究所ゲノム科学総合研究センター長、豊橋技術科学大学長、等を歴任した。スミソニアン賞(米国)、教育・学術功労章シュヴァリエ(フランス)、紫綬褒章、中日文化賞、文化功労者、瑞宝重光章、など多数。
ヒトゲノム計画: その歴史とインパクト
ワトソンとクリックによるDNA二重らせん構造の発見は遺伝情報がDNAを構成する4種の塩基(文字)による暗号(文)として書き込まれていることを明らかにし、分子生物学の誕生につながり、30億塩基からなるヒトの全遺伝情報(ゲノム)の全解読へとつながった。ヒトゲノム全解読を目指したヒトゲノム計画は、しかし、分子生物学の単なる延長や拡大ではなかった。そこには生物学や医学に変革をもたらす様々な革新的な試み・挑戦があった。中でも特記すべきは以下の3つの挑戦である。第1は、医学・生物学に工学的センスを導入したDNA配列決定自動化装置(DNAシーケンサー)の開発への挑戦である。そこでは日本の研究者が先導的役割を果たした。第2は医学・生物学に「オープン イノベーション」の考え方を導入したことである。ヒトゲノム配列決定を進める国際チームは医学やヒト生物学研究の発展のための共通基盤を構築することを目指し、生産されたシーケンスデータを直ちに無条件、無償で公開するという「バミューダ原則」に合意、実施した。第3は生物情報を解析するバイオインフォマティクス(生物情報科学)という学問分野を確立したことである。生物情報科学は高性能DNAシーケンサーと高速大型計算機の発達を背景に、大量データを基に生命現象を解明する「データ主導生物学」へと展開した。そこではDNAデータベースが不可欠の役割を担っている。
ヒトゲノム計画が生み出したヒトゲノム全配列はヒト生物学、医学のゴールド・スタンダードとなり、新しい時代をもたらした。超高速DNAシーケンサーの驚異的な進歩を背景とした大規模集団のゲノム配列解析を通して極めて多数の疾患に関連する多様な遺伝子タイプが発見され、個別化医療というゲノム情報に基づく新しい医療の流れを生み出した。また、様々な民族のゲノム情報は人類進化への理解を一段と深いものとした。この他「エピゲノム」などゲノム研究の最近の進歩について考察する。

高木 利久 (Toshihisa Takagi)
東京大学 教授/国立遺伝学研究所 DDBJセンター センター長
データベース開発やテキストからの知識抽出が専門。九州大学、東京大学ヒトゲノム解析センター等を経て、現在東京大学理学系研究科生物科学専攻教授。他、様々な役職を兼務。
 
我が国における生命科学分野のデータベース開発:現状と課題
DDBJ(DNA Data Bank of Japan)が誕生してから今年でちょうど30年になる。DDBJはINSDC (International Nucleotide Sequence Database Collaboration)の一員として国際塩基配列データベースを協同で構築・運営することを主な目的として設立された。この30年の間には、ヒトゲノム配列の決定などの生命科学に大きな変革をもたらすような出来事がいくつもあったが、データベースやバイオインフォマティクスの重要性・必要性が飛躍的に高まった時代であったとも言えよう。高性能のゲノム配列決定装置が続々と開発され、膨大な数の生物のゲノム配列が日々決定され、さらには、ゲノム以外にも遺伝子発現、タンパク質、代謝物、などのオミックスと呼ばれるデータも安価にかつ網羅的に収集できるようになった。データだけではなく知識も爆発的に増えた。これらのビッグデータをデータベースの形で共有、統合するとともに、人工知能技術などを用いて解析するデータ駆動型アプローチが生命科学の主流となってきた。この30年でデータベースなしでは生命科学が進められないまでになってきたのである。さらに、データベースを通したデータの共有は、近年世界的な潮流となっているオープンサイエンスの観点からも大変重要なものである。
講演では、まず、我が国における生命科学分野のデータベース構築の歴史を概観するとともに、その現状と課題をDDBJの取り組みを中心に紹介する。その中でオープンサイエンスについても少し紹介する。データベースには、それを格納したり解析したりするためのスーパーコンピュータの整備とデータベース構築と解析を担う人材の育成が不可欠である。講演では、これらの現状と課題にも触れることにする。

ルオナン チェン (Luonan Chen)
中国科学院上海生命科学研究院
数理モデルの視点から、非線形科学、システム生物学、脳科学まで幅広い分野で活躍する。日本での研究歴も長い親日家。中国の計算システム生物学会の会長も務める。
 
「Diagnosing Un-occurred Diseases by Dynamic Network Biomarkers
-- Detecting the tipping points of biological processes by omics data」
Considerable evidence suggests that during the progression of complex diseases, the deteriorations are not necessarily smooth but are abrupt, and may cause a critical transition from one state to another at a tipping point. Here, we develop a model-free method to detect early-warning signals of such critical transitions (or un-occurred diseases), even with only a small number of samples. Specifically, we theoretically derive an index based on a dynamical network biomarker (DNB) that serves as a general early-warning signal indicating an imminent sudden deterioration before the critical transition occurs. Based on theoretical analyses, we show that predicting a sudden transition from small samples is achievable provided that there are a large number of measurements for each sample, e.g., high-throughput data. We employ gene expression data of three diseases to demonstrate the effectiveness of our method. The relevance of DNBs with the diseases was also validated by related experimental data (e.g., liver cancer, lung injury, influenza, type-2 diabetes) and functional analysis. DNB can also be used for the analysis of nonlinear biological processes, e.g., cell differentiation process.

フランク アイゼンハーバー (Frank Eisenhaber)
シンガポール生命情報学研究所
ヒストンメチル化に関わるSETドメインなど、数々のドメイン機能を明らかにした業績で知られる。ウイーン分子病理学研究所等を経て、現在はシンガポールのバイオインフォマティクスを指揮する。
「No end in sight for gene function discovery: How long will it take to understand the human genome and what can be learned from theGAA1/GPAA1 function discovery story?」
Despite dramatic technical progress in genome and transcriptome sequencing, the ability to link changes in human sequences with phenotypic outcomes is severely limited. After the enthusiastic era of first full genome sequencing that started with a few bacteria and yeast in the middle of the nineties and culminated in the first human genome draft, the expectations with regards to cures of not yet treatable diseases or to new biotechnologies have not been fulfilled even nearly to the extent as the original hype might have promised.
Whereas the impact is dramatic in cases where biomolecular mechanisms are known, little progress even over several decades in the future should be expected where this is not the case. Except for few cases of clear statistical links between certain genomic aberrations and phenotypic properties, genotypes can be linked to phenotypes only via the explanation level of biomolecular mechanisms the knowledge of which is currently fragmentary at best. It is most urgent to discover or augment function description for > 10000 non- or poorly characterized human genes. The key to understanding biomolecular sequences is via function prediction from protein sequences. The plethora of methods for structure and function prediction from protein sequence integrated in BII's ANNOTATOR environment is reviewed. A new software GUI, the human protein mutation viewer, is useful for mapping mutations onto sequence architectural features and for delineating possible mechanistic implications. Examples of function discovery for GPI lipid anchor biosynthesis pathway's transamidase subunit genes pig-T and Gpaa1 as well as some others are presented.

五斗 進 (Susumu Goto)
ライフサイエンス統合データベースセンター 教授
前京都大学化学研究所バイオインフォマティクスセンター 准教授。長年にわたり、KEGGデータベースの主要メンバーとしてたずさわる。
From Database to Database Integration
In the big data era for life science, it is crucial for researchers to be able to access up-to-date and easy-to-use databases. Over 1,500 databases are catalogued in the online Nucleic Acids Research (NAR) database issue web site, and it is still not an easy task to find an appropriate database for each researcher in terms of both freshness and usefulness. While developing and maintaining each useful database is of course very important, integration of the databases is also indispensable for easier understanding and interpreting of the experimental results.

Databases are classified using several criteria such as data types and source information used in the category list of NAR web site. Another classification can be archival data repositories such as DDBJ and knowledgebases such as KEGG. KEGG can be considered as an integrated database as well by curating information from several data sources using its own ontology, which provides unique biological contents in an integrated and uniform way. It also serves as a backend data source for several bioinformatics analysis tools including functional annotation system for omics data.

To further integrate databases for more useful applications, technologies to support interoperability of databases distributed in the internet will be necessary. Semantic web is one such technology exploited by National Bioscience Database Center, JST and Database Center for Life Science, ROIS. Most data are represented in resource description framework (RDF) format with properly designed ontologies to follow FAIR principle to make data findable, accessible, interoperable and reusable. DBCLS has been developing technologies to integrate databases using RDF, more broadly the linked open data concept, and harnessing the community to provide, integrate and utilize the biological data in an integrated way. I have recently moved to DBCLS from KEGG group, so I would like to talk about the two approaches and discuss their differences.

今西 規 (Tadashi Imanishi)
東海大学医学部 教授
ヒト遺伝子の統合データベース構築を通して疾患や進化などの高次生命現象の解明の研究を行っている。経済産業省のライフサイエンス統合データベース事業で中心的役割を果たした。
Toward creating future medicine based on genome information
As a consequence of rapidly advanced DNA sequencing technology, genome information is being used widely in various areas of biomedical research. On the other hand, the application of genome information to practical medical services is still in its infancy. We are thus engaged in the research and development of genome sequencing and bioinformatics, with the aim of creating future medicine through clinical applications of genome information.
Firstly, we developed a computational system for predicting disease risks based on personal genome information. By collecting information of single nucleotide polymorphisms from literatures of genome-wide association studies, we compiled a database of genetic risk factors of various diseases, and released it as VaDE (http://bmi-tokai.jp/VaDE/). Then, using the VaDE database as a reference, we developed a computational tool for calculating the risks of various diseases from personal genome information. This enabled us to calculate the personal risks (odds ratios) of various diseases systematically. Though we still need to objectively evaluate its prediction accuracy, the system could specify an apparent high-risk group for some of the diseases. We suppose that the system will provide an indispensable technology to realize a scheme of preventive medicine in the future.
Secondly, we developed a genome analyzing system for the rapid diagnosis of infectious diseases. Using a portable, single-molecule DNA sequencer and high-spec laptop computers, we could set up a system that can in principle identify bacterial species in about one hour from a DNA sample of bacterial infection. This technology will replace the current methods of diagnosis for bacterial infections in the near future.
By utilizing genome information databases as a key technology, we will continue to develop the medical services of the future.
ページの先頭へ戻る