人工智能驱动的语音分析可以帮助识别精神障碍吗?

本文是关于人工智能解决日常问题的潜力的有限系列文章的一部分。

想象一下一个测试就像测量体温或测量血压一样快速和简单,它可以可靠地识别焦虑症或预测即将发生的抑郁症复发。

医疗保健提供者有许多工具来衡量患者的身体状况,但没有可靠的生物标志物——从患者外部观察到的医疗状态的客观指标——来评估心理健康。

但一些人工智能研究人员现在认为,你的声音可能是了解你的精神状态的关键——而人工智能非常适合检测这种变化,而这些变化即使不是不可能,也很难以其他方式感知。 结果是一组旨在跟踪您的心理状态的应用程序和在线工具,以及向远程医疗和呼叫中心提供商提供实时心理健康评估的程序。

辛辛那提大学医学院的心理学家兼助理教授玛丽亚·埃斯皮诺拉 (Maria Espinola) 说,心理学家早就知道,某些心理健康问题不仅可以通过听一个人说什么,还可以通过听他们说什么来发现。

埃斯皮诺拉博士说,对于抑郁症患者,“他们的讲话通常更单调、更平和、更柔和。 它们还具有减小的音高范围和较低的音量。 他们需要更多的停顿。 他们经常停下来。”

她说,患有焦虑症的患者会感到身体更加紧张,这也会改变他们发声的方式。 “他们倾向于说得更快。 他们呼吸更加困难。”

今天,机器学习研究人员正在利用这些类型的声音特征来预测抑郁和焦虑,以及其他精神疾病,如精神分裂症和创伤后应激障碍。 使用深度学习算法可以发现额外的模式和特征,这些模式和特征在简短的录音中捕捉到,即使是训练有素的专家也可能不明显。

哈佛医学院助理教授、马萨诸塞州总医院临床心理学家凯特·本特利 (Kate Bentley) 说:“我们现在使用的技术可以提取有意义的特征,即使是人耳也无法识别。”

“找到生物学或更客观的精神病诊断指标,超越传统上使用的更主观的评估形式,如临床医生评定的访谈或自我报告措施,令人兴奋不已,”她说。 研究人员正在追踪的其他线索包括活动水平、睡眠模式和社交媒体数据的变化。

这些技术进步是在对精神保健的需求特别迫切的时候出现的:根据国家精神疾病联盟的一份报告,2020 年,美国五分之一的成年人患有精神疾病。而且这个数字还在继续攀升.

Bentley 博士说,尽管 AI 技术无法解决合格的精神卫生保健提供者的稀缺问题——这远远不足以满足该国的需求——但希望它可以降低接受正确诊断的障碍,帮助临床医生识别患者可能不愿寻求护理并促进就诊之间的自我监测。

“在两次预约之间可能会发生很多事情,而技术确实可以为我们提供以更持续的方式改进监测和评估的潜力,”本特利博士说。

为了测试这项新技术,我首先从健康技术公司 Sonde Health 下载了 Mental Fitness 应用程序,以查看我的不适感是否是严重问题的征兆,或者我只是感到疲倦。 这款免费应用程序被描述为“语音驱动的心理健康跟踪和日记产品”,邀请我记录我的第一次签到,这是一个 30 秒的口头日记条目,它将我的心理健康按 1 到 100 的等级进行排名。

一分钟后,我得到了我的分数:不是很好的 52。应用程序警告说“注意”。

该应用程序标记出在我的声音中检测到的活跃程度非常低。 我听起来单调只是因为我一直试图小声说话吗? 我应该听取应用程序的建议,通过散步或整理空间来改善我的心理健康吗? (第一个问题可能表明该应用程序可能存在缺陷:作为消费者,可能很难知道您的声音水平为何会波动。)

后来,在面试之间感到紧张不安,我测试了另一个语音分析程序,这个程序专注于检测焦虑水平。 StressWaves Test 是来自医疗保健和保险集团 Cigna 的免费在线工具,它与 AI 专家 Ellipsis Health 合作开发,使用 60 秒的语音录音样本来评估压力水平。

“是什么让你夜不能寐?” 是网站的提示。 在我花了一分钟讲述了我持续的担忧之后,该程序对我的录音进行了评分并给我发了一封电子邮件声明:“你的压力水平适中。” 与 Sonde 应用程序不同,Cigna 的电子邮件没有提供任何有用的自我提升技巧。

其他技术增加了潜在的人机交互层,例如位于加利福尼亚州伯克利的公司 Kintsugi,本月早些时候在 A 轮融资中筹集了 2000 万美元。 Kintsugi 因日本人用金脉修补破碎的陶器而得名。

Kintsugi 由 Grace Chang 和 Rima Seiilova-Olson 创立,他们因过去难以获得精神保健的共同经历而建立联系,Kintsugi 为远程医疗和呼叫中心提供商开发技术,帮助他们识别可能从进一步支持中受益的患者。

例如,通过使用 Kintsugi 的语音分析程序,护士可能会被提示多花一分钟时间向有绞痛婴儿的忙碌父母询问他自己的健康状况。

开发这类机器学习技术的一个问题是偏见问题——确保项目公平地为所有患者工作,无论年龄、性别、种族、国籍和其他人口统计标准如何。

“为了让机器学习模型运行良好,你确实需要拥有非常庞大、多样化和强大的数据集,”Chang 女士说,并指出 Kintsugi 使用来自世界各地的多种不同语言的录音来防范尤其是这个问题。

Bentley 博士说,这个新兴领域的另一个主要问题是隐私——尤其是语音数据,它可以用来识别个人。

即使患者同意被记录,同意的问题有时也是双重的。 除了评估患者的心理健康之外,一些语音分析程序还使用录音来开发和改进自己的算法。

Bentley 博士说,另一个挑战是消费者对机器学习和所谓的黑盒算法的潜在不信任,这些算法的工作方式甚至开发人员自己都无法完全解释,特别是他们使用哪些功能进行预测。

“创造算法,理解算法,”塞梅尔神经科学与人类行为研究所临时主任、加州大学洛杉矶分校精神病学系主任亚历山大·S·杨博士回应了这些担忧。许多研究人员对人工智能和机器学习的普遍看法:在程序的训练阶段几乎没有人为监督。

目前,Young 博士仍然对语音分析技术的潜力持谨慎乐观的态度,尤其是作为患者自我监测的工具。

“我确实相信你可以模拟人们的心理健康状况或以一般方式近似他们的心理健康状况,”他说。 “人们喜欢能够自我监控自己的状态,尤其是慢性病患者。”

但在自动语音分析技术进入主流应用之前,一些人呼吁对其准确性进行严格调查。

“我们真的需要更多地验证不仅是语音技术,还有基于其他数据流的人工智能和机器学习模型,”Bentley 博士说。 “我们需要通过大规模、精心设计的代表性研究来实现这一验证。”

在那之前,人工智能驱动的语音分析技术仍然是一种很有前途但未经证实的工具,它最终可能成为一种衡量我们心理健康温度的日常方法。

分享

最新更新

重要新闻

相关文章