数十年来,研究者一直在努力寻找能够客观识别焦虑和抑郁的生物标志物。现在,这番努力终于开始取得成果。
人工智能能够整合数十种细微的生理特征,以辅助诊断精神疾病
“看起来你这一周过得很不容易。”一个没有实体的声音这样对我说,随后提出一连串越来越私人的问题。“你最近有没有感到情绪低落或抑郁?”“你能描述一下这种感受吗?”“当有好事发生时,这种感觉是否有所缓解呢?”
在我逐一作答后,这位由聊天机器人担任的采访者会感谢我的坦诚,并对我遇到的任何问题表示同情。对话结束时,我还会谈到自己的睡眠状况、性欲以及食欲。
这会是未来的模样吗?一些精神科医生认为,类似这样的聊天机器人未来可能会在诊断中发挥重要作用。他们的目标是建立一系列由人工智能分析得出的“数字生物标志物”,用以辅助评估病人当前的精神状况、提供治疗方案,并持续追踪其心理健康情况。目前候选的生物标志物包括:我们说话时的语音节奏、面部表情的细微变化、身体动作的改变,以及与睡眠相关的心率变化。
大量必要数据已经存在于我们日常随身携带的设备中,这为精神科医生了解患者生活提供了前所未有的视角。如果这种方法行之有效,它应当有助于制定更加个性化的治疗方案,并在患者陷入危机之前预判复发风险。不过,这类诊断的可靠性仍存在重大疑问,更不用说难以避免的隐私问题了。
“这些可穿戴设备让你能够在人们的日常生活中实时捕捉大量信息,”美国纽约州石溪大学精神科医生兼研究人员阿尼萨 · 阿比-达尔甘(Anissa Abi-Dargham)说,“它收集的数据量几乎是无限的,但挑战在于如何处理这些数据。”
精神病学的演变历程
如果数字生物标志物能够真正成熟,它将标志着精神病学史上最重大的转变之一。自这一领域诞生以来,病情诊断几乎完全依赖医生与患者之间的深入对话。问诊通常会探究患者是否出现了与某种疾病相关的一系列症状。例如,抑郁症往往涉及情绪、食欲、性欲、动机以及睡眠的变化。
但分配给每一种精神疾病的症状集合,往往不准确到令人沮丧的地步。以抑郁症为例,其表现形式极其多样,既可能是睡眠过多,也可能是睡眠过少,以至于两个症状毫无重叠的人,也可能被给予同样的诊断结果。同时,抑郁特征的出现,既可能只是直截了当的单相抑郁症,也可能是更复杂疾病(如双相情感障碍)的开端。长期以来,精神病学一直试图模仿其他医学领域的诊断精确性,但始终未能真正做到。
到20世纪中叶,科学家开始思考,是否可以通过不同疾病的生物标志物来建立更客观的诊断方法。这些标志物包括神经递质(如血清素和多巴胺)的变化,它们可能影响大脑调节情绪的能力;也包括激素水平的改变,这可能是压力反应异常的信号。这些生物标志物可以通过脑成像、脑脊液样本或简单的血液检测来识别。
随着精神病学努力将自身确立为一门严肃的医学学科,该领域的顶尖研究人员致力于寻找客观的生物标志物。托马斯 · 因塞尔(Thomas Insel)在2002年至2015年间担任美国国家心理健康研究所(NIHM)所长,他推动该机构寻找精神疾病的遗传或神经生物学特征。因塞尔在2017年表示,在他任内,NIHM投入了约200亿美元,但最终并未取得理想成果:“对于数以千万计的精神疾病患者,我认为我们并未在降低自杀率、减少住院率、改善康复方面取得真正的进展。”
这番努力仍在继续。例如,有研究提出,部分抑郁症患者体内存在较高水平的炎症反应,这或许能让医生使用抗炎药物进行治疗,这一观点引发了相当大的兴趣。但这远非定论。目前,还没有任何精神疾病拥有被普遍接受的生物标志物。
细微的面部线索可以揭示焦虑和抑郁等疾病状况
数字化转型
尽管进展相对缓慢,但研究人员并未因此放弃基于数字足迹来评估心理健康的尝试。瑞典隆德大学的社会学家沙伊 · 穆利纳里(Shai Mulinari)指出,这一概念的发展起初缓慢,直到2010年代中期,随着我们对智能手机和智能手表的依赖程度不断加深,相关研究才逐渐加快,而近年来人工智能的进步更是为这一领域按下了加速键。“在过去几年里,我们利用人工智能分析大型数据集的能力发展得非常迅速。”
到目前为止,这项研究已经为抑郁症、广泛性焦虑障碍、社交焦虑障碍、自杀倾向以及创伤后应激障碍找到了潜在的生物标志物。以上这些都是最常见的精神疾病,影响着数百万人。如果数字生物标志物能够有效推广,它们有望让治疗监测变得更加精确。
抑郁症由于其极高的患病率(大约每六个人中就有一人会在人生某个阶段患抑郁症)吸引了最多的研究关注。早在2009年,美国宾夕法尼亚州匹兹堡大学的杰弗里 · 科恩(Jeffrey Cohn)领导的研究团队就注意到,抑郁症患者的声音往往较为平直,音高变化很小。仅凭这一指标,研究人员就能根据汉密尔顿抑郁量表预测一个人的精神状态,准确率高达79%。面部表情也是如此:一个经过训练、用于分析面部运动的计算机程序,其预测准确率与语音生物标志物完全相同。后续研究还表明,有可能通过语音音高来识别双相情感障碍的不同阶段,因为在躁狂发作期间,音调往往会升高。
科恩后来创立了慎思智能公司(Deliberate AI),目前担任首席科学家。该公司旨在基于上述成果和发现继续推进研究。例如,该公司研究了对话中的整体语流。“抑郁症通常与更高的停顿频率和更慢的语速相关。”公司联合创始人兼首席执行官马克 · 阿夫耶斯(Marc Aafjes)指出。与此同时,面部分析如今也将头部运动和肌肉动态纳入其中,而不仅仅是诸如微笑频率等更直观的表情变化。
“正是这些特征混合出现才让我们的分析能够达到高水平的准确性和可靠性,”阿夫耶斯说,“在重度抑郁的情况下,非语言行为往往是信息量最丰富的信号——如果只分析语音和语言内容,很可能会忽略这些方面。”
慎思智能还与美国得克萨斯州贝勒医学院的科学家合作,研究生物标志物在康复过程中的变化。“我们已经证明,这些指标与现有的测量方法具有很高的同时效度,这对于获得监管机构和临床医生的认可极为重要。”阿夫耶斯说。
一种新的诊断方式
这些进展正在推动数字生物标志物从理论走向实践。慎思智能的一款工具最近被纳入美国食品药品管理局的一项新试点项目,其诊断结果可能很快就会被认可为临床试验中的一个终点指标。
与此同时,该公司也在努力简化数字化诊断流程,希望提高其普及性。最初,数字化诊断需要由精神科医生进行一次完整的临床访谈来收集生物标志物,但现在,只需分析几分钟的简短语音片段,就能达到同样的准确率。
当这一技术与我亲自体验过的人工智能聊天机器人结合使用时尤其有意义。那次对话略显生硬,有时我也会因为向一个非人类实体倾诉内心而感到些许不自在,然而,对话的整体体验基本流畅。
人们希望,这类虚拟交流能够克服当前诊断时的一些障碍:受限于受训专业人员数量有限,很多人难以及时接受真人医生的评估访谈。
虚拟交流问诊方式能更方便地追踪一个人随时间推移的症状变化,而无需患者频繁预约昂贵的复查流程或填写冗长的问卷。患者个人可以每天与人工智能访谈员进行简短的“签到检查”,同时由软件分析其语音和面部生物标志物。
“我们可以利用这些高保真的‘快照’捕捉症状的波动,而以前是做不到这一点的。”阿夫耶斯说。
此项技术方法的实际应用意义重大。通过建立个体的基线状态并对症状进行密切追踪,精神科医生就可以判断治疗方案是否像预期一样有效,并据此调整药物剂量或更换方案。
在生物标志物之间寻找平衡
该团队还在撰写一篇论文,探讨如何利用这些生物标志物预测自杀想法和行为,从而在个体伤害自己之前发出预警并进行干预。“在预测自杀想法方面,最强的指标包括语速和句法结构异常一致的情况,”阿夫耶斯说,“相比之下,更能指向直接自杀意图的行为,往往是面部表情的剧烈波动,特别是皱眉或间歇性微笑。”如果平台检测到某人处于自杀风险中,它可以将其转介给真人精神科医生以进行干预。
采取这种思路的并不只有慎思智能。事实上,随着多家机构竞相将人工智能引入精神病学领域,我们或许正在见证一场“淘金热”。以总部位于旧金山的略语健康公司(Ellipsis Health)为例,该公司正在利用机器学习开发针对抑郁症和广泛性焦虑障碍的语音与语言生物标志物。在一项于2022年进行的试验中,该公司应用程序的用户被鼓励每周提供5分钟的语音样本,持续六周,内容涵盖一般健康问题、个人生活状态或工作状态等话题。
该项目的分析结果在区分是否达到这两种疾病临床诊断阈值方面,整体表现非常出色,与标准问卷结果高度一致,假阴性和假阳性的比例都很低。这正是一个可行的生物标志物所需要达到的平衡。
其他候选的生物标志物还包括通过可穿戴设备的加速度计测量的身体活动量。新罕布什尔州达特茅斯学院的尼古拉斯 · 雅各布森(Nicholas Jacobson)发现,广泛性焦虑障碍往往表征为高强度活动(即体育锻炼)水平较低,但身体躁动行为(如坐立不安、来回踱步)水平较高。
而社交焦虑障碍则可能体现在人们的手机使用行为中,例如联系他人或被他人联系的频率,以及电话响起时是否接听等。雅各布森发现,将这些信息与运动数据结合起来,可以准确地预测症状的严重程度。
智能手表等可穿戴设备收集的数据可以为评估人们的心理健康情况提供关键信息
寻找数字生物标志物的过程中也出现了一些令人失望的案例。这些反面案例提醒人们,对“技术可以取代面对面交流”的想法应保持警惕。以一项考察睡眠质量的研究为例:睡眠不佳既是抑郁症的成因之一,也是其症状之一,因此,人们或许会认为,精确监测睡眠状况是预测心理健康变化的明智方法。
然而,美国加州大学洛杉矶分校的医学信息学研究人员萨米尔 · 阿克雷(Samir Akre)发现,参与者自我填写的睡眠问卷,在预测抑郁症方面,远比从智能手机和智能手表收集的数据更为准确。
阿克雷的发现凸显了直接与人沟通、倾听其主观感受的重要性。因此,他告诫精神科医生,不要过度依赖数字生物标志物。“归根结底,真正重要的是个体的切身体验,”他说,“我担心,在一种反乌托邦式的极端情况下,某人的手表会显示他们一切正常,而实际上并非如此,然而没有人会去倾听他们的苦楚。”
值得庆幸的是,我们距离那样的悲观情况仍有一段距离,而这一领域也在谨慎地发展。美国心理学会最近才开始讨论其“圣经”《精神障碍诊断与统计手册》的下一版修订工作。在2025年6月的年度会议上,该学会宣布设立一个专门负责生物标志物的小组委员会,并向研究人员征集候选测试方法。
该小组委员会计划采取审慎的路径。若某项指标通过其严格标准,将被列为“新兴”生物标志物,其目的在于勾勒未来图景,而非认可这些技术为确凿的诊断测试。“我们只是希望让人们了解这一领域的最新动态,并能够随着相关技术逐渐成熟,评估其是否具备进一步应用的条件,”小组委员会成员阿比-达尔甘说,“这些信息的呈现方式将会非常谨慎。”她表示,最终,其中一些候选方法可能会得到验证,并被归入“成熟的数字技术”类别,“但那将是一个非常漫长的过程”。一旦此类情况真正发生,那将是对精神科医生可以开始使用这些生物标志物的一项重要认可。
个人医疗记录的隐私问题也可能会引发顾虑。不过,阿比-达尔甘强调,小组委员会的首要关注点仍然是方法的可靠性及其临床实用性,即这些技术能在多大程度上改善病患的医疗照护状况。
然而,如果缺乏积极的反馈,反对声音就会变大。穆利纳里就怀疑,数字生物标志物的潜力被过度夸大了。他指出,“数字生物标志物”这一概念本身就相当模糊,因为某些候选指标(如手机使用记录)实际上只是行为观察,并未测量任何与潜在生理机制相关的内容。
“如果你把某样东西称为数字生物标志物,那你也许就能获得经费。但如果你只是称它为一种疾病相关因素,就拿不到钱,”他说,“所以,这里面肯定存在一些炒作。”
尽管如此,穆利纳里仍保持乐观,他将当前各界对数字生物标记物日益增长的兴趣与千禧年前后基因测序领域掀起的巨大热潮相提并论。“当时我们听说,它会解决所有的疾病。”他说。尽管这项技术并未完全兑现部分过于夸张的承诺,但它如今已成为医学的重要组成部分——他希望数字生物标志物也能走上类似的道路。“新技术总会伴随着炒作,有时在最开始确实会带来问题,但最终也可能促成重要发现。”
阿比-达尔甘也持有类似的看法。“这是一个极具挑战性的领域,”她说,“但我认为它前景光明。”
资料来源 New Scientist
——————————
本文作者大卫·罗布森(David Robson)是一位科学作家,专注于人类大脑、身体和行为极端情况的科学内容写作,作品颇受好评。


