logo

医療データ科学とは?

生物、とりわけ、人は複雑系の最たるものといえます。疾患を含め様々な生命現象には実に多くの因子が関与しており、その背後にあるメカニズムは一般に極めて複雑です。そこに関与している因子には遺伝的なものもあれば生活習慣や生活環境に由来するものなど様々です。このことは生命現象が人によって大きく異なることを意味します。

“複雑なメカニズム”と“大きな個体差”―これらは人での生命現象の予測をとても難しくし、大きな不確実性をもたらします。しかし、たとえそうであっても、実際に生命現象のデータを収集し、解析することで、現象の背後に存在するある種の法則性を帰納的に推論し、不確実な現象を予測することが可能になります。そのための理論と方法論の体系を提供するのが医療データ科学です。より具体的には、医学研究の対象者への倫理的な配慮や研究資源上の制約を踏まえた上で、以上の科学的推論が可能となるように、いかに医学研究をデザインしてデータを収集し、いかにデータを解析すればよいか ―デザインとデータ解析― そのための理論・方法論を提供します。

臨床での様々な不確実性を前提とした臨床研究はもちろん、基礎研究においても、それが無視できない不確実性を伴うものであれば医療データ科学は貢献できます。疾患を問わず様々なタイプの医学研究に“横断的に”関与することができ、その多くで本質的な貢献ができる可能性を秘めていることが医療データ科学がもつ大きな魅力です。

医療データ科学を構成するもの

医療データ科学では、まず基盤としての数学、統計学あるいは情報学に関する一定の専門性が必要です。これを拠り所として、医学研究のデザインとデータ解析に関する様々な統計・機械学習の方法が導かれます。もちろん、これらの方法は実際に医学・医療の問題に適用されてはじめて意味をもちます。これは医学の研究者との共同作業です(医療データ科学の実践)。その一方で、実践を通してのフィードバックから、より有効な統計・機械学習の方法や実践の仕方を探求することを忘れてはなりません(医療データ科学の研究)。

その成果は、医療データ科学のより高度な実践へと活かされることになり、更なる医学への貢献につながります。また、そこから新たな医療データ科学の研究が生まれ、積み重なっていくことで、統計・機械学習の方法論と実践の体系としての医療データ科学が発展していきます。このように、医療データ科学は、方法論の研究と実践のサイクルを回し、積み上げていくことで成立するものです。

医学・医療における複雑な問題をどう捉え、データ科学の視点からどう解決するのか? これを考えることが医療データ科学の醍醐味であり、問題解決のための“センス”も重要となります。