医療データ科学の方法論研究
私たちの研究室での研究テーマは、人を対象とした医学研究のデザインとデータ解析全般です。
現在進行中の方法論研究のテーマ(一部)
- 自己対照研究や要因研究における治療効果の異質性解析
- 臨床試験の適応的デザインと治療効果の推定
- データ駆動イベント後の選択的推論
- 医薬品の用量探索における能動学習、適応的実験計画の応用
- 転移学習を用いた外部コントロールの活用
- 脳画像データの階層・潜在構造モデリング
- 類似研究セットを用いたベイズ流情報借用メタアナリシス
- AI医療を含めた個別化医療の信頼性、臨床的有用性の評価
以下、これまでの主な研究をまとめます。

臨床試験のデザインとデータ解析に関する研究
治療法開発の開発早期に行われる探索的臨床試験から検証的試験(ランダム化試験)までを包括的に研究対象とし、試験デザインとデータ解析に関する様々な統計的課題について研究しています。近年は個別化医療の開発や機械学習の導入に関するテーマを重点的に行っています。
近年の主な業績
- Seno K, Igeta M, Matsui K, Dimon T, Matsui S. Statistical and machine learning methods for phase I dose-finding design. In Handbook of Statistics in Clinical Oncology, 4th Edition. (eds. J. Crowley, A. Hoering, M. Othus), CRC Press, in press, 2025.
- Matsui S, Igeta M. Phase II and III clinical trial designs for precision medicine. In Handbook of Statistics in Clinical Oncology, 4th Edition. (eds. J. Crowley, A. Hoering, M. Othus), CRC Press, in press, 2025.
- Emoto R, Igeta M, Matsui K, Ishii K, Takamura T, Matsui S. Evaluating treatment-effect modifiers using data from randomized two-sequence, two-period crossover clinical trials: Application to a diabetes study. Journal of the Royal Statistical Society, Series C., in press, 2025.
- Toyoizumi K, Matsui S. Bias correction based on weighted likelihood for conditional estimation of subgroup effects in randomized clinical trials. Statistics in Medicine 2022; 41: 5276-5289.
- Igeta M, Matsui S. Blinded sample size re-estimation for comparing over-dispersed count data incorporating follow-up lengths. Statistics in Medicine 2022; 41: 5622-5644.
- Nonaka T, Igeta M, Matsui S. Statistical testing strategies for assessing treatment efficacy and marker accuracy in phase III trials. Pharmaceutical Statistics 2019; 18: 459-475.
- Matsui S, Crowley J. Biomarker-stratified phase III clinical trials: enhancement with a subgroup-focused sequential design. Clinical Cancer Research 2018; 24: 994-1001.
- Igeta M, Takahashi K, Matsui S. Power and sample size calculation incorporating misspecifications of the variance function in comparative clinical trials with over-dispersed count data. Biometrics 2018; 74: 1459-1467.
- Choai Y, Matsui S. Estimation of treatment effects in all-comers randomized clinical trials with a predictive marker. Biometrics 2015; 71: 25-32.
- Matsui S, Simon R, Qu P, Shaughnessy JD Jr, Barlogie B, Crowley J. Developing and validating continuous genomic signatures in randomized clinical trials for predictive medicine. Clin Cancer Res. 2012; 18: 6065-6073.
能動学習と転移学習によるスモールデータサイエンス
深層学習に代表される現在の機械学習 (≒人工知能) の方法論の多くは、大規模な教師データによるモデルの事前学習が可能であることを前提に作られているといえるでしょう。しかし、医学や材料科学などの多くの領域では、大規模なデータの取得に莫大なコストが必要となることが少なくありません。少ない教師データ数でも効率的な学習を可能とするためには、学習に特に寄与する可能性の高いデータに優先的にラベル付けする方法の開発が重要となります。一方、別の側面として、複数のリソースから類似したデータを取得できる場合が多々あり(例えば、複数の病院で同一疾患の患者のデータを取得するなど)、適切にデータを統合することでモデルの学習が効率的になると期待されます。機械学習の文脈では、前者は能動学習、後者は転移学習と呼ばれ、ホットな研究トピックとなっています。このような背景のもと、スモールデータの効率的な利活用を目指して能動学習および転移学習の方法論開発の研究を行っています。
近年の主な業績
- Matsui, K., Kumagai, W., and Kanamori, T. Parallel distributed block coordinate descent methods based on pairwise comparison oracle. Journal of Global Optimization 2017; 69(1): 1-21.
- Matsui, K., Kanamori, K., Kumagai, W., Nishikimi M. and Matsui, S. A Transfer Learning Method for Multi-Center Prognostic Prediction Analysis. 3rd International workshop on biomedical informatics with optimization and machine learning in conjunction with 27th international joint conference on artificial intelligence (IJCAI 2018), Stockholm, Sweden, 13-19, July.
- Matsui, K., Kumagai, W., Kanamori, K., Nishikimi M., and Kanamori, T. Variable Selection for Nonparametric Learning with Power Series Kernels. Neural Computation 2019; 31:8, 1718-1750.
- Matsui, K., Kusakawa, S., Ando, K., Kutsukake, K., Ujihara T., and Takeuchi, I. Bayesian Active Learning for Structured Output Design, arXiv:1911.03671 (preprint).
- Seno, K., Matsui, K., Iwazaki, S., Inatsu, Y., Takeno, S., Matsui, S. (2025). Dose-finding design based on level set estimation in phase I cancer clinical trials, arXiv:2504.09157 (preprint).
- Yahagi, Y., Obuchi, K., Kosaka, F., Matsui, K. (2025). Transfer learning from first-principles calculations to experiments with chemistry-informed domain transformation. Machine Learning: Science and Technology, 6, 025026.
- 今村秀明, 松井孝太 (2023). ベイズ最適化-適応的実験計画の基礎と実践-. 近代科学社.
- 松井孝太, 熊谷亘 (2024). 転移学習. 講談社.
オミクスや脳画像のデータを用いた疾患関連解析
複雑な構造をもつオミクスデータや脳画像データから診断に役立つ情報を抽出するためのデータ解析の方法について研究しています。近年、特に重点的に行っている研究は、脳全体の関連構造の統計モデリングによる疾患関連部位の検出と関連サイズの推定法に関する研究です。ボルツマンマシンを応用した関連性の深層構造の推定などにも取り組んでいます。
近年の主な業績
- Morisawa J, Otani T, Nishino J, Emoto R, Takahashi K, Matsui S. Semi-parametric empirical Bayes factor for genome-wide association studies. European Journal of Human Genetics 2021; 29: 800-807.
- Emoto R, Kawaguchi A, Takahashi K, Matsui S. Effect-size estimation using semiparametric hierarchical mixture models in disease-association studies with neuroimaging data. Computational and Mathematical Methods in Medicine. 2020; Article ID: 7482403.
- Emoto, R., Kawaguchi, A., Otani, T., & Matsui, S. (2019). A Model-Based Framework for Voxel and Region Level Inferences in Neuroimaging Disease-Association Studies. In 16th International Conference on Information Technology-New Generations (ITNG 2019), pp. 367-372, Springer.
- Kawabata T, Emoto R, Nishino J, Takahashi K, Matsui S. Two-stage analysis for selecting fixed numbers of features in omics association studies. Statistics in Medicine 2019; 38: 2956-2971.
- Matsui S, Noma H. Estimation and selection in high-dimensional genomic studies for developing molecular diagnostics. Biostatistics 2011; 12: 223-233.
- Matsui S, Zeng S, Yamanaka T, Shaughnessy JD. Sample size calculations based on ranking and selection in microarray experiments. Biometrics 2008; 64: 217-226.
