?й??
首 页
学术资源
学科服务
服务项目
联系我们
今天是:

公共卫生学术热点追踪

Lancet Digit Health:精神卫生领域人工智能应用的证据与责任

来源:信息中心2026-05-14

随着人工智能(Artiffcial Intelligence, AI)在医学领域的快速发展和应用,其正不断融入临床和行政管理工作流程中。生成式AI工具,如精神健康聊天机器人,可以直接为那些不愿意或无法与临床医生接触的人群提供支持。然而,这些生成式AI工具也带来了特殊的风险。不可预测的输出、带有偏见的回应以及对妄想信念的强化可能对精神障碍患者造成伤害。今年的报告突显了罕见但令人担忧的案例,其中与AI聊天机器人的互动似乎强化了妄想思维,甚至引发了精神病发作,特别是在本身就易感的用户中。在精神卫生领域应用AI的过程中,关键问题仍然是:在证据匮乏且风险不断显现的背景下,我们如何在前行中确保数字精神健康工具的安全性与真正有效性,使其惠及最需要的人群?

202511月的《The Lancet Digital Health》中,一项针对无需医师监督的独立智能手机精神健康应用程序的最新荟萃分析指出,现有研究质量不高且存在显著异质性。对抑郁和焦虑的总体合并效应仅为小至中等程度,并且在校正发表偏倚后效果进一步减弱。另一项综述认为,现有证据尚不足以支持将AI聊天机器人作为独立干预手段使用;尽管这些工具前景可观,但因缺乏严格的临床验证,要实现安全、有效的临床整合,仍需更为严格的研发与评估规范。综合来看,尽管AI精神健康聊天机器人在扩大精神健康支持可及性方面前景可观,但当前证据基础仍不足以支持其广泛或单独的临床应用。这些持续存在的证据与安全性缺口,呼吁监管机构、研究人员与制造商加强协作,确保数字精神健康领域的创新服务于最需要帮助的人群。

为了响应这一呼吁,监管机构正在采取行动。2025 11 6 日,美国食品药品监督管理局(FDA)数字健康咨询委员会(DHAC)明确,对搭载生成式人工智能的数字精神卫生设备实施基于风险、覆盖产品全生命周期的监管框架。该框架将监管工作贯穿设备从初始研发、上市前评估,到上市后监测乃至最终退市的所有阶段,旨在确保不断发展的技术在整个使用周期内始终兼具安全性与有效性。

这一框架的核心支柱之一是由科研界生成高质量的上市前研究证据。只有具备稳健性、可推广性与代表性,并采用经验证方案、具有临床意义终点指标以及有效对照组的研究,方可作为临床应用价值的证据。未来研究应证明其相较于积极干预或常规治疗具有优效性或非劣效性,而非仅依赖等待名单对照(即未接受治疗的比较组)。近期荟萃分析指出,这种做法有助于避免效应量的高估与夸大。研究还应包含充分的随访期,以评估持续的临床获益。对于无效或阴性结果,应予以发表,以防止误导性声明和发表偏倚。即使在早期阶段,性能指标亦不应仅限于技术基准,而应纳入现实世界中的安全性与可推广性考量。

另一重要支柱是开发者在确保产品安全性和有效性方面承担的责任。开发者需提供全面的设备特性说明,并透明地披露训练数据、模型局限性和已知风险,这也是世界卫生组织20253月指南所建议的做法。除了提供高质量的上市前研究证据外,制造商还应持续开展上市后监测和风险管理,包括对产品在现实世界中的性能进行监测。此外,隐私保护、公平可及性和公众参与等伦理考量应贯穿产品全生命周期。

研究人员、制造商、监管机构和社会各界应携手合作,强化证据基础、确保安全并坚守伦理准则。只有通过这种集体共同承担责任,数字精神健康的真正潜力才能得以释放。


参考文献:

[1]The Lancet Digital Health. Evidence and responsibility of artificial intelligence use in mental health care. Lancet Digit Health. 2025 Nov;7(11):100959. doi: 10.1016/j.landig.2025.100959. Epub 2025 Dec 10. PMID: 41381299.

[2] Kulke JK, Fuhrmann LM, Berking M, Ebert DD, Baumeister H, Derfiora A, Veldhouse A, Weisel KK. Efficacy of standalone smartphone apps for mental health: an updated systematic review and meta-analysis. Lancet Digit Health. 2025 Nov;7(11):100923. doi: 10.1016/j.landig.2025.100923. Epub 2025 Nov 24. PMID: 41290454.

[3] Hua Y, Na H, Li Z, Liu F, Fang X, Clifton D, Torous J. A scoping review of large language models for generative tasks in mental health care. NPJ Digit Med. 2025 Apr 30;8(1):230. doi: 10.1038/s41746-025-01611-4. PMID: 40307331; PMCID: PMC12043943.

链接:https://pubmed.ncbi.nlm.nih.gov/41381299/