MIT科学家：人工智能自动化助力医疗决策

资讯尔东,来源：MIT,News 零壹财经 2019-09-17 阅读：2828

关键词：人工智能 医疗 mit

人工智能的出现能够帮助临床医生诊断和治疗，甚至是提升患者对于治愈的希望。

近日，美国麻省理工学院的计算机科学家们，希望通过人工智能在医学方面的应用，进而替代一些人工投入过高的步骤，从而改善医疗决策。因为随着某些数据集变得越来越大，许多医疗决策过程变得越来越费力。

在预测分析领域，人工智能的出现能够帮助临床医生诊断和治疗，甚至是提升患者对于治愈的希望。例如，透过机器学习模型，在自我学习过程中能够归纳患者的数据特征，帮助医护人员进行败血症的治疗，进而设计更安全的化疗方案。另外，人工智能还能够帮助医生预测患者患乳腺癌或死于ICU的风险。

通常，训练数据集是由许多患病和健康的受试者组成，但存在每个受试者的数据相对较少的问题。重要的是，医疗专家们必须在数据集中找到那些对预测很重要的特征。这样一项“发现特征”的工作，不仅消耗较大的资金成本，还会消耗宝贵的人力。但随着智能可穿戴传感器的兴起，这项工作得到了较大的缓解。研究人员可以通过传感器返回的数据，在较长的时间内洞察患者的生理状况、跟踪睡眠模式、步态和语音活动。经过一段时间的数据收集，医疗专家们可以为每个科目提供数十亿个数据样本。

这种“特征工程”可能是一项费力且昂贵的过程。但随着可穿戴传感器的兴起，它变得更具挑战性，因为研究人员可以更长时间地监控患者的生物识别，跟踪睡眠模式，步态和语音活动。经过一周的监测，人工智能设备可以为每个医疗科目提供数十亿个数据样本。

根据最新研究发现，麻省理工学院的研究人员展示了一种具备机器学习的新技术——预测声带疾病特征的模型。模型建立在大约100个医疗科目的数据集，每个科目都有大约一周的语音监测数据和数十亿个样本。数据集的数据是从安装在受试者颈部的小型加速计和传感器中，捕获到相应的信号。

在实验中，预测声带疾病特征模型使用从这些数据中自动提取到的特征，在通过高精度训练后，对具有和不具有声带结节的患者进行分类。声带疾病是在喉部发展的病变，通常是由于患者滥用声音，如大喊大叫。重要的是，该模型在没有大量手工标记数据的情况下完成了预测任务。

该模型的主要创作者，Jose Javier Gonzalez Ortiz，一位麻省理工学院计算机科学与人工智能实验室（CSAIL）的博士生，解释到，“收集长时间序列的数据集，在人工智能的帮助下，变得越来越容易，但仍然需要医生运用他们的知识来标记数据集。未来，希望模型能够为专家提供大量的治疗参考，并将所有病例特征工程装载到机器学习模型中。”

这个模型检测到声带结节的相关活动，进而为医生提供诊断和治疗疾病的方法。随着技术的推进，通过新设计的算法，可以更准确地识别并警告人们可能会使声带受损的行为。

麻省理工学院的研究人员还与美国喉部手术和语音康复中心展开合作，联合开发和分析来自智能穿戴传感器的数据，以便在及时跟踪受试者的声音使用情况。当人们谈话时，颈部的传感器开始收集声音，通过加速度计收集数据，最后传输到智能手机上。

通过研究，科学家们通过104名受试者，收集了大量的时间序列数据，其中一半的受试者被诊断出患有声带结节。对于每个患者，还存在健康者匹配对照。这意味着对照组具有相似年龄，性别，职业和其他因素。

在经验上，针对对模型有用的各种疾病或病症特征，专家需要进行人工识别。而这一人工识别过程，能够预防模型进行机器学习遇到的问题：过度拟合。

模型存在的过度拟合问题，是模型会根据不同受试人声带的健康状况，进行分类，从中寻找规律。但问题是，模型会根据之前的分类模式，对患者进行识别，当出现在分类库中没有出现的病症时，模型可能会失效。因为在这一过程中，模型无法正确对新出现的病症进行匹配。

因此，科学家在优化模型时，遇到的一大挑战就是如何防止过度拟合。科学家通过在模型中输入大量的陌生声带信息，使模型能够通过深度学习，最终掌握如何捕捉各类声音，以及的声音的强度。

当他们的模型遍历主题数据时，它被编程为定位发声段，其仅包含大约10％的数据。对于这些发声窗口中的每一个，该模型计算频谱图，频谱图随时间变化的频谱的视觉表示，其通常用于语音处理任务。然后将谱图存储为数千个值的大矩阵。

当模型对大量数据进行挖掘时，它会被设置成对各声音模块进行定位。对于各个声音模块，模型能够输出具备时间序列特点的频谱图，能够用于语音处理过程。最后，模型会将频谱图以矩阵的形式存储。

在庞大的数据面前，还有一个问题就是如何有效地处理矩阵。科学家通过自动编码器，原理是运用神经网络，从大量数据当中进行有效提取。最开始，自动编码器会将频谱图压缩到30个值的编码；之后，再从压缩后的编码中重新解压成对应的频谱图。

理论上，这个压缩到解压的过程中，模型必须控制频谱图保持高度的一致性。科学家为了实现这一点，在模型机器学习过程中，添加了学习压缩后的时间序列频谱图的全部特性。之后，在学习完大量的被压缩的频谱图后，模型能够进行更精确的预测。

在模型的训练过程中，它会将声音特征映射到患者组和对照组两个组别。一般，患者的声音模式会比对照组多。首先，科学家们选用未曾出现在模型当中的声音进行测试。之后，模型会将相似的频谱图压缩为某一特征。最后，模型依此得出规律，将发声区段不正常的受试者归为患者组，其他归为对照组。

在实验中，该模型与需要手动特征工程的最先进模型一样精确地执行。重要的是，研究人员的模型在训练和测试中都能准确地进行，表明它从数据中学习临床相关模式，而不是学科特定信息。

在实验中，预测声带疾病特征模型执行操作时，跟人工操作一样精确。重点是，该模型在训练和实验过程中都能准确地执行指令，表明它能够从数据中学习到临床的相关模式，而不是某一特定信息。

往后，研究人员希望通过监测各种治疗方法，例如手术和声带治疗，是如何影响声音行为的。如果患者的行为随着时间的推移从异常变为正常，那么他们可能正在康复。研究人员还希望在心电图数据上使用类似的技术，用于跟踪心脏的肌肉功能。

专题推荐：金融毛细血管

零壹智库推出“金融毛细血管系列策划”，通过系列文章、系列视频、系列报告、系列研讨会和专著，系统呈现“金融毛细血管”的新状态、新功能、新价值、新定位。