公共卫生学术热点追踪
Lancet Digit Health:新生儿疾病预训练语言模型的开发与验证:一项回顾性、多中心预后研究
新生儿疾病的早期识别和监测对于及时干预至关重要,可预防并发症、优化资源利用并为家庭提供支持。尽管基于表格数据和生物标志物的传统工具有其价值,但在评估新生儿疾病风险方面存在局限性。
2025年12月的《The Lancet. Digital health》刊载了一项本研究,该研究团队开发了NeonatalBERT,一个可从临床记录中评估新生儿疾病风险的预训练大型语言模型(Large Language Model, LLM)。该项预后研究使用了来自美国两家四级护理学术医疗中心的回顾性数据:斯坦福医疗保健中心的主要队列和贝斯以色列女执事医疗中心的外部队列。NeonatalBERT首先在主要队列的临床记录上进行预训练,随后分别对两个队列进行微调。该研究还将NeonatalBERT与其他现有LLM(如BioBERT和Bio-ClinicalBERT)以及使用表格特征的传统机器学习和逻辑回归模型进行了性能比较。针对主要队列,NeonatalBERT在19种新生儿疾病(呼吸窘迫综合征、支气管肺发育不良、肺出血、肺动脉高压、肺不张、吸入综合征、脑室内出血、脑室周围白质软化、新生儿癫痫发作、其他中枢神经系统疾病、动脉导管未闭、心血管不稳定、脓毒症、念珠菌病、贫血、黄疸、坏死性小肠结肠炎、早产儿视网膜病变和死亡)上进行了评估,针对外部队列则评估了10种疾病(呼吸窘迫综合征、支气管肺发育不良、肺出血、脑室内出血、动脉导管未闭、脓毒症、黄疸、坏死性小肠结肠炎、早产儿视网膜病变和死亡)。每种结局均评估了受试者工作特征曲线下面积、精确率-召回率曲线下面积(AUPRC)和F1评分。
主要队列共纳入32321名新生儿,其中主要训练集27411名(平均胎龄38.64周[SD 2.30];女性13056名[47.6%],男性14355名[52.4%]),主要测试集4910名(平均胎龄38.64周[2.13];女性2336名[47.6%],男性2574名[52.4%])。外部队列纳入7061名新生儿,其中外部训练集5653名(早产儿1567名[27.7%],足月儿4086名[72.3%];女性2614名[46.2%],男性3039名[53.8%]),外部测试集1408名(早产儿383名[27.2%],足月儿1025名[72.8%];女性624名[44.3%],男性784名[55.7%])。在主要队列中,19种结局的平均AUPRC为:NeonatalBERT 0.291(95% CI 0.268–0.314),Bio-ClinicalBERT 0.238(0.217–0.259),BioBERT 0.217(0.197–0.236),使用表格数据的传统模型0.194(0.177–0.211)。在外部队列中,NeonatalBERT的平均AUPRC为0.360(0.328–0.393),优于其他模型的0.224–0.333范围。
基于两个大规模美国数据集的验证结果表明,NeonatalBERT能够从新生儿的非结构化临床记录中有效评估新生儿疾病风险。该研究的良好结果显示了NeonatalBERT在改善新生儿护理和优化医院运营方面的潜力。
原文出处:Xie F, Chung P, Reiss JD, Tjoa E, De Francesco D, Phongpreecha T, Haberkorn W, Chakraborty D, Chang AL, James T, Kim Y, Mataraso S, Espinosa C, Yang L, Shu CH, Xue L, Berson E, Mohammadi N, Shome S, Reincke SM, Ghanem M, Maric I, Gaudilliere B, Angst MS, Sylvester K, Shaw GM, Prince LS, Stevenson DK, Aghaeepour N. Development and validation of a pre-trained language model for neonatal morbidities: a retrospective, multicentre, prognostic study. Lancet Digit Health. 2025 Dec;7(12):100926. doi: 10.1016/j.landig.2025.100926. Epub 2025 Dec 18. PMID: 41419365; PMCID: PMC12748047.
链接:https://pubmed.ncbi.nlm.nih.gov/41419365/
