ニュース
28 Mar 2024
米国の成人における口腔がん関連死亡率の予測および機械学習アプローチを用いた口腔がん関連死亡率の予測因子の同定を目的とした研究が、2024年3月13~16日に米国ルイジアナ州ニューオーリンズで開催された第53回American Association for Dental, Oral, and Craniofacial Research年次総会および第48回Canadian Association for Dental Research年次総会と併催された第102回International Association for Dental Research(IADR)総会で発表された。
抄録「Predicting Oral Cancer-Related Mortality among Adults Using Machine Learning Approach」は、2024年3月14日から開催された「Artificial Intelligence and Machine Learning Applications in Health」オーラルセッションで発表された。
Kornberg School of Dentistry at Temple University(米国ペンシルベニア州フィラデルフィア)のAavishi Arora氏による研究では、SEERデータベース(1975~2022年)から被験者8,176人のデータを抽出した。
一連の38の人口統計学的因子、臨床病理学的因子、および生活様式因子を、「口腔がんで死亡」および「生存/その他の原因で死亡」としてコード化したアウトカム変数である口腔がん関連死亡率(OCRM)とともに抽出した。
データは、R言語による機械学習(ML)モデルのレシピパッケージ用いて前処理され、MLモデルのエクストリーム勾配ブースティング(XGBOOST)を使用して、データの過剰適合または不足を防ぐために、5分割交差検証の下で口腔がんの予後予測を行った。
モデルの性能は、Brierスコア、曲線下面積(AUC)、特異度、感度、精度を用いて評価した。
MLモデルは、R言語によるMachineShopパッケージを使用して実行された。
被験者の63%は男性で、主に非ヒスパニック系白人(71%)であった。
7, 444人は生存または他の原因で死亡し、732人はがんで死亡した。
MLモデル(XGBoost)の予測性能は、Brier Score 0.0677、精度91%、κ統計量13%、ROC AUC 84%、感度99%、特異度1%未満であった。
評価された38の変数のうち、17の変数がOCRMの最も重要な予測因子であることが分かった。
OCRMの最も重要な予測因子(降順)は、がん病期群、年齢、T因子、リンパ節手術、がん部位、腫瘍の稀少性、N因子、配偶者の有無、放射線照射、収入、悪性度、リンパ節の大きさ、手術の放射線照射順序、人種、組織型、多発原発がんの配列番号、腫瘍が発生した対臓器の側であった。
したがって、機械学習モデルは、National Cancer Registryから得られた臨床病理学的変数を用いた口腔がん死亡率の予測に有効であった。
(2024年3月20日公開)