IT Cutting Edge ─世界を変えるテクノロジの最前線

第1回 不治の病から慢性疾患へ ─"1グラム2ペタバイト"のデータが変えるガン治療の未来

この記事を読むのに必要な時間:およそ 3 分

ゲノム解析データが抱える4つの課題

ゲノム解析は確実に身近なものになりつつありますが,その大きな要因として,解析(シーケンス)に要するコストの大幅な下落があります。30億塩基対にもおよぶヒトゲノムの全塩基配列を解析したヒトゲノムプロジェクトが終了したのは2003年ですが,当時は人間ひとり分のゲノムを解析するのに30億ドル近くの費用がかかりました。ところが現在ではわずか1000ドルで事足ります。

デソーザ氏は「ムーアの法則なんてバカバカしくなるほどのコストダウンがこの世界では起こっている」としていますが,相対的にシーケンスされるゲノムの数は爆発的に増えており,2011年の段階でバイオ企業によるゲノム解析数は3万を超えるとのこと。

ゲノム解析にかかるコストは12年で激減し,解析件数は増大した。ムーアの法則(左のグラフの点線)と比較するといかに劇的なコストダウンが実現したかがわかる

ゲノム解析にかかるコストは12年で激減し,解析件数は増大した。ムーアの法則(左のグラフの点線)と比較するといかに劇的なコストダウンが実現したかがわかる

そしてデータ解析の機会が増えれば増えるほど,Illuminaのような企業にとって大きな課題となってくるのが,解析したデータの扱いです。デソーザ氏はゲノム解析データにおける4つの課題として以下を挙げています。

データの量が多すぎる

言うまでもなくゲノムデータの量は膨大です。デソーザ氏は「1グラムのDNAに格納できるデータ量は2ペタバイト。これはNetflixの全データ量とほぼ同じ」と語っていますが,この膨大なデータをどこに保存し,どう管理していくのかはもっとも頭の痛い問題だといえます。Illuminaがどのようにゲノム解析データを管理しているのかについては今回のセッションでは語られませんでしたが,最近では同社のようなバイオ系企業の多くがパブリッククラウドにデータを移行する事例が増えています。

データが構造化されていない

ひとくちにゲノム解析データといっても,データのタイプはさまざまです。テキストもあれば画像もあり,また,解析に使った試料やシーケンサによってもデータ形式が異なります。またデータを採取する医師,解析するアナリストによってもデータのアウトプット形式は変わってきます。構造化されていないデータであるがゆえに,解析をいかに高い精度でもって効率化させることができるかが,Illuminaのような企業の差別化ポイントになります。

データがサイロ化しやすい

ゲノム解析データはセンシティブなデータであるため,非常にサイロ化しやすいデータでもあります。医療機関,医師/研究者,Illuminaのような解析サービスプロバイダといった単位で保存/運用され,データの共有や統合は非常に困難です。またEMR(電子カルテ)や外部のデータベース,パブリックサービスとの連携もむずかしく,解析データから適切な治療法を導きにくいことも少なくありません。

データがつねにセキュアであることを求められる

ゲノム解析データは究極のプライバシーともいわれます。自分のゲノム解析を依頼する人は,そのデータがどこにも流出することなく,たとえ2次利用される場合も匿名化や暗号化されていることを望むはずです。しかしDNAのマッチングは意外と容易に行えるため,たとえ匿名化されたゲノム解析データでも個人を特定するのはそれほど難しくないとも指摘されています。なお,米国にはHIPAA(Health Insurance Portability and Accountability Act, 医療保険の相互運用性と説明責任に関する法律)という医療関係者が必ず守らなければならない法律があり,患者データの取り扱いが厳密に規定されています。一方で「HIPAAによる規制は過剰で,データ共有を妨げ,医療の発展を阻害する」と批判する動きもあります。

この4つの課題のうち,もっとも注目度が高く,そしてもっとも解決が難しいものが最後のセキュリティとプライバシーだといえます。冒頭で紹介したワートマン博士のような個別化医療を発展させ,一般化していくためには,ここで挙げられた4つの課題をすべてクリアした,社会で共有できるゲノム解析データ基盤が必要になります。そしてデータ基盤にデータを集約していくには,より多くの人々に自身のゲノムデータを提供することに同意してもらわなければなりません。

ゲノム解析データをめぐる課題でもっとも難易度が高いのがセキュリティとプライバシーの問題。この課題の落としどころを見つけない限り,共有基盤の構築は難しいが「実現にこぎつけることはできる」とデソーザ氏。期待しましょう!

ゲノム解析データをめぐる課題でもっとも難易度が高いのがセキュリティとプライバシーの問題。この課題の落としどころを見つけない限り,共有基盤の構築は難しいが「実現にこぎつけることはできる」とデソーザ氏。期待しましょう!

デソーザ氏は「現状では,ゲノム解析データの共有は非常に限られた条件下でのみ行われている。今後,共有基盤を拡充していくには,一にも二にも提供者との間で合意を徹底すること。データの匿名化や暗号化に関する疑問に答え,データの利用に関する説明責任を果たす,そしてこのデータベースがいかに医学を発展させるかを理解してもらう」と強調しますが,逆に言えばこのプロセスで手を抜かないことが,信頼される医療データ基盤の構築につながるといえるでしょう。

ゲノム解析技術は世界を変える!

セッションの最後,デソーザ氏はゲノム解析技術の発展によって「あと数年以内で起こること」として,以下の6つを挙げています。

  1. シーケンス(ゲノム解析)がより多くの命をダイレクトに救う(もうすでに起こっている)
  2. 腫瘍のサンプルは定期的に解析されるようになり,治療のスタンダードとなる(1~5年後)
  3. 国家が国民のシーケンスを行うようになる(1~3年後)
  4. シーケンスの際に患者の電子カルテにアクセスできるようになる(2~5年後)
  5. 子供は生まれたときから定期的にシーケンスされる(3~7年後)
  6. ガンはただの慢性疾患として扱われるようになる(5~10年後)

ガンがただの慢性疾患になる ─これがもし実現したら,人類の未来は本当に大きく変わると言っても過言ではないでしょう。ゲノム解析をはじめとする分子医学の発展は,これまで不可能とされていたことを可能にし,医療の常識を大きく塗り替えてきました。先に挙げた4つの課題をクリアしたゲノム解析データ基盤が登場すれば,デソーザ氏の予測がすべて当たることも夢ではないかもしれません。


お気づきの方もいるかもしれませんが,デソーザ氏は昨年11月までSymantecのプロダクト&サービス部門のプレジデントを務めていました。MIT卒業後,IBMのワトソン研究所でキャリアをスタートしたデソーザ氏は,その後,いくつかのベンチャーを立ち上げたり,MicrosoftやSymantecのようなな大企業のエグゼクティブとして活躍したりと,米国のIT業界ではかなりの有名人です。

そのデソーザ氏をSymantecから引き抜いたIlluminaの姿勢に,この会社がゲノム解析データ基盤の構築に本気で取り組んでいることがよくわかります。ゲノム解析データのようにセンシティブなデータを扱う企業だからこそ,セキュリティを含むあらゆるIT技術に精通し,豊富な人脈をもつデソーザ氏をトップに迎えたのです。ITを理解している人を経営陣に加え,ビジネスを伸ばし,社会にも貢献していく。米国にはこのようにITがビジネスを変えるという経営を地で行っている企業が少なくありません。そうした土壌が新しいイノベーションを次々と生み出す源泉になっていることを,現地で取材すると肌で実感します。

著者プロフィール

五味明子(ごみあきこ)

IT系の出版社で編集者としてキャリアを積んだ後,2011年からフリーランスライターに。フィールドワークはオープンソースやクラウドコンピューティング,データアナリティクスなどエンタープライズITが中心。海外カンファレンス取材多め。Blog 「G3 Enterprise」やTwitter(@g3akk),Facebookで日々IT情報を発信中。

北海道札幌市出身/東京都立大学経済学部卒。

バックナンバー

IT Cutting Edge ─世界を変えるテクノロジの最前線

バックナンバー一覧