IBM医疗AI死于难产:NLP搞不定医学问题!
编译 | Debra
编辑 | Vincent
AI前线导读:无论是大企业还是小企业,专业医疗公司还是没有医疗背景的公司,医疗AI这个巨大的市场都在吸引着它们的目光,医疗AI赛道早已拥挤不堪。蓝色巨头IBM在主要业务增长乏力,逐渐落后于谷歌、苹果等公司的困境下,想要抓住医疗AI这根救命稻草活命。但在投入巨大人力、财力之后,仍然逃脱不了走进死胡同的一天,究其原因,还是在于落地困难。
更多优质内容请关注微信公众号“AI前线”(ID:ai-front)
电子和电子工程师协会杂志IEEESpectrum的高级副主编ElizaStrickland上周发表了一篇文章《IBM沃森医疗AI的低产和被高估的程度》。本文讨论了IBM沃森为什么在医疗保健行业创建高效的AI医生之前还有很长的路要走。
一战成名
IBM沃森是一个能够用自然语言回答问题的问答计算机系统,它在2011年2月在智力竞赛电视游戏Jeopardy(危险边缘)中击败两个人类冠军取得成功!当时,IBM的研究人员在探索将沃森的能力扩展到“革命化”医疗保健的可能性,决定将沃森出色的NLP功能应用于医药,甚至承诺提供商业产品。
2014年,IBM第一次展示沃森使用人工智能改变医学的潜力。在Demo中,沃森收集了一组奇怪的患者症状,并利用它们生成一个诊断清单。当时,沃森给人留下深刻的印象:沃森的记忆库包含最罕见的疾病信息,其处理器完没有偏见,使其优于其他帮助医生的AI。它可以在几秒钟内处理一个棘手的病例。
如果沃森能够将这种即时专业知识带到世界各地的医院和诊所,人工智能似乎可以减少诊断错误,优化治疗,甚至缓解医生短缺的情况——不是替代医生,而是通过帮助他们更快、更好地完成工作。——Strickland
然而,尽管有关人工智能产品商业化的新项目很有希望,但它无法实现这一承诺。在公司总部之外,IBM发现其强大的技术无法与当今医疗保健系统的混乱现实相匹配。将沃森应用于癌症治疗这个医学界面临的最大挑战之一时,IBM遇到了机器学习方式和医生工作方式之间的根本性不匹配。
“自那以来的八年里,IBM大肆宣扬开发人工智能医疗技术,其中许多已经失败了。此外,IBM沃森医疗健康部门生产的产品更像是只能执行日常任务的基本AI助手,甚至连AI医生都算不上。——Strickland
沃森在医疗保健行业面临的挑战
非结构化数据
虽然IBM想要努力探索沃森在医疗保健行业的可能性,但当时,他们面临的最具挑战性的问题是医学中的大量患者数据,即非结构化数据。这包括医生的笔记和出院摘要,这些充满行业术语、缩写和主观声明的摘要占典型患者记录的约80%。
癌症诊断不准确
IBM沃森面临的另一个挑战是癌症的诊断。纽约市凯特琳癌症中心的肺癌专家MarkKris与其他优秀的医生一起,在2015年训练了一个名为沃森肿瘤的AI系统,它可以通过读取关于癌症的大量医学文献和真实癌症患者的健康记录,揭示人类不为人知的疾病模式。
德州大学MD安德森癌症中心的其他优秀医生与IBM合作创建了一个名为肿瘤专家顾问的工具。然而,这两种产品都遭到了严重的批判,称沃森的肿瘤学顾问有时会提供“无用的”和“危险的建议”。
Strickland写道:“对这两个项目的深入研究揭示了机器学习的设想与医疗保健现实之间的鸿鸿沟——”真正的人工智能“与当今医生对功能性产品的要求”。
尽管沃森很快就学习了关于临床研究的文章,但人们很难教会沃森以医生的方式阅读这些文章。“医生从文章中学到的用来改变他们护理的信息,可能不是论文里的重点。沃森的思维基于统计数据,所以它能做的就是收集有关主要结果的统计数据,“MarkKris补充道。
无法从患者的电子健康记录中挖掘信息
研究人员进一步发现,沃森也无法从患者的电子健康记录中挖掘信息。此外,他们意识到,在将新患者与其他大量癌症患者进行比较以发现隐藏疾病模式时,沃森无能为力。此外,他们希望沃森能够模仿专家肿瘤学家的技能,但结果让他们感到很失望。
沃森为什么“发射失败”?
率先进入,第一个出局
2014年,IBM创建了一个崭新的总部,起名IBM沃森,在位于曼哈顿类似于微型天文馆的玻璃实验室中,IBM会邀请潜在的客户和来访的记者进入沃森的电子“大脑”中,。在黑暗的空间里,游客坐在旋转的凳子上,花哨的图形围绕着墙壁的弧形屏幕闪烁。
之后,沃森在电视节目《危险边缘》中战胜人类冠军脱颖而出,IBM便为其规划了今后的职业生涯:成为一名AI医生。IBM将沃森的自然语言理解能力应用于医学,并承诺首批沃森医疗产品将在18-24个月内上市。
实际上,IBM宣布的那一天并没有到来。在此后的八年中,IBM高调宣布进行医疗AI研究,但其中一些已经失败了。该公司花费数十亿美元用于收购以加强实力,但内部人士表示,被收购公司尚未做出太多贡献。从IBM的沃森健康部门生产的产品与曾经设想的优秀AI医生根本不能相提并论:它们更像是可以执行某些日常任务的AI助手。
加州大学旧金山分校医学系主任,同时是2015年出版的《数字医疗》(TheDigitalDoctor:Hope,Hype,andHarmattheDawnofMedicine’sComputerAge)一书的作者RobertWachter说道:“说好听点,我认为他们遇到了一些麻烦。”他说,在某种程度上,IBM正被其雄心壮志折磨:它是第一家大力推动人工智能进入诊所的公司。但它也因夸大沃森的能力而蒙受恶意和怀疑。“他们先进行营销,第二步才是产品,让每个人都兴奋不已,”他说。“然后是真正见分晓的时候,遇到棘手的问题,IBM首先出局,向所有人证明了这很难。”
迄今为止很少有成功产品
自2011年以来,IBM沃森宣布了许多医疗保健项目。他们的表现如何?
IBM于2011年开始致力于将沃森引入医疗保健行业。从那时起,该公司已经发布了近50份关于合作伙伴关系的公告,旨在开发新的医疗保健工具。一些合作致力于为医生和机构提供工具;一些人致力于消费者应用。虽然许多联盟还没有产生商业产品,但IBM表示这些研究工作很有价值,并且在维持很多关系。这是一个有代表性的项目样本。
图像之外,NLP 等 AI 技术很难有实际产品落地
然而,除了图像,即使是今天最好的AI也难以理解复杂的医疗信息。实验结果证明,编码人类医生在软件方面的专业知识是一个非常棘手任务。正如全世界所看到的,IBM已经在市场上学到了这些痛苦的教训。虽然该公司并没有放弃它的“登月计划”,但它的“发射失败”已经向技术专家和医生们表明,训练一名AI医生是多么困难。
在2011年的《危险边缘》中,沃森的胜利表明了其在自然语言处理(NLP)方面的卓越技巧。为了玩这个游戏,它必须解析复杂的文字游戏线索,搜索大量的文本数据库以找到可能的答案,并确定最好的答案。沃森不是一个优化的搜索引擎;它不只是根据关键字返回文档。相反地,它使用了数百种算法来映射句子中的“实体”并理解它们之间的关系。使用这种技能,它能理解游戏中的线索和它挖掘的数百万文字来源包含的信息。
“看起来沃森好像可以理解语言的含义,而不仅仅是识别单词的模式,”在《危险边缘》比赛期间担任IBM主要医学科学家的MartinKohn说道。“它比现有的AI强大了一个数量级。更重要的是,沃森通过机器学习自行开发了这种能力,发现了模式,并为如何从输入(线索)到输出(正确的响应)建立了模型。”
Kohn从哈佛大学获得医学学位并获得了麻省理工学院的工程学位,他很高兴能帮助沃森解决医学语言问题。“沃森似乎有可能克服这些复杂性,”他说。通过将其强大的NLP能力转变为医学理论,沃森可以阅读患者的健康记录以及医学文献的全部内容:教科书、同行评审期刊文章,批准药物清单等。通过访问所有这些数据,沃森可能会成为一名超级医生,能够辨别出人类无法看到的模式。
Chase与IBM研究人员一起研究了一种诊断工具的原型,但IBM选择不将其商业化,因此Chase在2014年与IBM分道扬镳,作为众多早期沃森的狂热者中的一员,他对沃森从那时起在医学商店进展缓慢感到失望。
关于医疗 AI 的一些现实
由于各种原因,医生是一个保守派,采用新技术的速度很慢。但在医疗保健的某些领域,医疗专业人员开始认为人工智能系统是可靠和有用的。以下是AI医学的一些早期发展。
在计算机业务中落后于谷歌和苹果,IBM急需开拓新领域回血,因此选择了前景巨大的医疗AI领域。2014年,IBM向沃森部门投资10亿美元,该部门正在为多个业务部门开发技术。2015年,IBM宣布成立一个特殊的沃森健康部门,到2016年中期,沃森健康已经收购了四家健康数据公司,总成本约为40亿美元。IBM似乎拥有使AI在医疗保健领域干一番事业所需的技术、资源和承诺。
今天,沃森领导人将创建沃森健康的过程形容为艰难崎岖的道路,将AI带进医疗领域是个非常大的挑战。
例如,IBM医疗保健和生命科学研究副总裁AjayRoyyuru说道,诊断工具没有上市是因为此前不存在此类商业案例。“诊断不是我们的目标,”他说。“这是医学专家们做得很好的事情。这是一项艰巨的任务,无论你用AI做得多好,它都不会取代专家。“
Bengio:迄今为止没有一种AI可以匹配人类医生的理解和洞察力
为了找到医疗人工智能的商业案例,IBM开展了一系列令人眼花缭乱的项目,针对医疗保健系统中的所有不同参与者:医生、行政人员、保险公司和患者,以获得“使用AI分析大量数据集的决策支持。”IBM宣传力度最大的项目专注于肿瘤学,希望将沃森的“认知”能力转化为大数据为患者提供个性化癌症治疗。
在许多应用实验中,沃森的NLP与许多其他AI系统一样,努力理解医学文本。“我们在NLP方面的表现要比五年前好得多,但仍然比人类差得多,”蒙特利尔大学计算机科学教授,人工智能研究员YoshuaBengio说。Bengio表示,在医学文本文件中,人工智能系统无法理解模糊性,也无法了解人类医生会注意到的微妙线索,目前的NLP技术可以帮助医疗保健系统:“它不需要完全理解,就可以做一些非常有用的事情。”但到目前为止,没有一种AI可以匹配人类医生的理解和洞察力。“不,我们还打不到,”他说。
暂时克服不了癌症
IBM对癌症的研究是这家公司遇到的主要挑战之一。一位肺癌专家MarkKris表示:“我认为没有人会知道这(实现癌症诊断)会花多长时间。”他所在的研究机构早在2012年就和IBMWatson展开了合作。
Kris和其他医生在2015年训练了一个人工智能系统,该系统成为了Watson肿瘤产品。德克萨斯大学MD安德森癌症中心的医生与IBM合作创建了一个名为Watson肿瘤顾问。白血病部门测试了该工具,但它从未商业化。
Watson肿瘤顾问遭受了多方批评。有文章指出Watson肿瘤是无用甚至会提供危险的建议。Kris说他经常听到批评说该产品不是“真正的人工智能”。在投入6200万美元之后,IBM与MD安德森癌症中心的合作项目最后以失败告终而被取消。
该项目表明,机器学习的承诺与医疗保健的现实根本不匹配,在“真正的AI”与当今医生对功能性产品的要求之间存在着巨大鸿沟。
一些研究将Watson的癌症治疗建议与医院肿瘤学家的建议进行了比较。一致性百分比表示Watson的建议与专家的治疗计划相匹配的频率。
Watson肿瘤通过获取大量癌症患者健康记录和医学文献来学习。IBM希望Watson凭借其强大的计算能力来检查这些记录中的数百个变量,发现人类无法看到的模式。功夫不负有心人,Watson很快就学会了如何浏览临床研究的文章并确定基本结果,但遗憾的是它不会像医生那样阅读文章。医生是从文章中提取信息,用来改变他们的治疗方法,而Watson的思维是基于统计数据,所以它能做的就是收集有关主要结果的统计数据。“但医生不这样做。”
例如,在2018年,FDA批准了一种新癌症药物,它对所有表现出特定基因突变的肿瘤都有效。人类医生会建议每个肺癌患者都接受这种基因检测,但Watson不会根据有55名患者中4名肺癌患者改变结论。
无法从健康记录中挖掘信息
此外,研究人员还意识到,沃森无法从医学文献的突发新闻中独立提取见解只是第一个打击,另外,它还无法像他们预期的那样从患者的电子健康记录中挖掘信息。
还没完,AI超级医生梦想的最后一击,是研究人员意识到,Watson无法将此前在癌症患者身上发现的隐藏模式与新的癌症患者进行比较。SloanKettering和MD安德森都希望AI能够模仿他们的专家肿瘤学家的能力,他们在为新患者制定医疗方案时利用他们对患者、治疗和结果的经验。可以进行类似分析的机器功能将非常强大。
与现有医疗体系黄金标准不符
但是,医疗保健系统目前的标准并不鼓励这种现实世界的学习。MD安德森的肿瘤学专家顾问仅发布了与官方医学指南相关的“基于证据”的建议以及医学文献中发表的研究结果。如果人工智能系统的建议基于它在医疗记录中发现的模式——例如,某种类型的患者在某种药物上表现更好——其建议不会被视为基于证据的,即医学中的黄金标准。如果没有科学研究的严格控制,这种发现只会被认为是相关性,而不是因果关系。
Kohn和其他很多人认为,为了AI能够发挥其全部潜力并变革医学,医疗保健的标准必须改变。“黄金标准并不是真正的黄金,”Kohn表示,人工智能系统可以考虑的因素比临床试验中表现的要多得多,并且可以将患者进行更多分类,以提供“真正的个性化护理”。基础设施也必须改变:医疗保健机构必须同意共享其专有和隐私控制的数据,以便AI系统可以从数百万患者数据中学习。
美国市场遇冷
根据报告显示,IBM在美国市场遇冷。一些肿瘤学家说他们更相信自己的判断,不需要沃森告诉他们该做什么。其他人则表示,它只是会提供一些他们了然于胸的建议。但Kris表示,一些医生发现它可以作为一种即时的补充性意见,以安慰紧张的病人。“尽管它不完美,且作用有限,但它非常有用。”IBM的销售代表在美国以外的地区运气好点,印度、韩国、泰国和其他医院都采用了这项技术。许多医院在营销时以使用IBMWatson品牌为傲,告诉患者他们将享受人工智能癌症治疗。
尽管面临一些挑战,IBM沃森也的确有一些成绩,比如IBM与北卡罗来纳大学、耶鲁大学和其他知名机构合作开发的沃森基因组。该工具可帮助遗传学实验室为肿瘤科医生提供报告。沃森读取患者基因突变列表,并在几秒钟内生成一份描述所有相关药物和临床试验的报告。此外,2017年IBM在北卡罗来纳大学的合作伙伴发表了一篇论文,介绍了沃森基因组工具的有效性。
无论有效与否,IBM沃森仍然需要跨越重重障碍,才能实现IBM将沃森变成无可挑剔的“AI医生”的梦想,其他在医疗AI赛道上遭遇类似困境的企业,也应以此为鉴,及时做出应对策略和调整,才是最要紧的。
正如翼展科技CTO边海锋所说:“对于那些没有医疗背景,但却有资金和各种资源支持的大公司,他们做医疗AI的挑战主要是在产品上缺乏领域知识,找不到能够解决客户痛点的应用场景,其次是如何打造一个熟悉医疗客户群体的团队。”
参考链接:
https://spectrum.ieee.org/biomedical/diagnostics/how-ibm-watson-overpromised-and-underdelivered-on-ai-health-care#LinkToAIHealthTable
https://hub.packtpub.com/ieee-spectrum-ibm-watson-has-a-long-way-to-go-before-it-becomes-an-efficient-ai-doctor/
今日荐文点击下方图片即可阅读
完爆旧系统!Facebook开源图神经网络库PBG,无需GPU搞定数十亿节点图嵌入
课程推荐
大学绰号C狂,毕业仅2年就成为首席架构师,主导WPS长达3年的架构设计和开发。他创建了金山实验室,以技术总监的身份主导分布式存储开发。在加入了盛大创新院后,成功推出了「盛大网盘」和「盛大云」。
七牛云CEO许式伟,首次完整、系统地分享自己20年架构经验与思考。
《许式伟的架构课》,上线仅3天,订阅数突破1W,限时¥99,原价¥129,立减¥30,请扫码或点击“阅读原文”试读或订阅!
你也「在看」吗???
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线