叫好不叫座 AI医疗“卡脖子”难题怎么破?
发表于2023-10-08 23:05:44

  原标题:叫好不叫座 AI医疗“卡脖子”难题怎么破?

  一直以来,医疗行业都被视为AI应用的最佳场景之一。在上一轮AI医疗浪潮中,人工智能的应用主要集中在影像领域。那么,在本轮AIGC浪潮中, AI医疗是否迎来了新的突破口? 

  近日,红杉资本发布了一篇名为《Generative AI in Healthcare》的报告。其中提到,目前AI能够很好地处理患者互动、文档记录、预授权、编码和收入周期管理等环节,例如将医生和患者的对话,自动转化为电子病历和编码等等。红杉资本认为,现在的AI开始渗透到医疗行业的多个环节,从而大大提高医疗领域的效率和质量,降低成本和人力。

  那么,除了处理这些看起来不够前沿的非结构性数据,医疗行业的“卡脖子”领域——医疗诊断,在这一轮人工智能浪潮中,能否获得新的解决方案?又有哪些难点?近日,华尔街日报发布的一篇文章《Can AI Help Doctors Come Up With Better Diagnoses?》给出了一些答案。文章作者为Laura Landro,她专注于医学与健康领域方面写作,出版过书籍《幸存者:控制你与癌症的斗争》等。适道对原文内容进行了缩写和补充,以下是正文。

  准确性是永远的痛点

  第一,AI无法取代医生经验。虽然生成式AI能提出诊断建议,并提示医生:患者可能出现的病情趋势。但在临床实践中,除了一张冷冰冰的体检报告,医生还要和患者面对面交流,通过望闻问切、建立联系、获取信任,从细微之处察觉患者的病情起因发展,排查不符合逻辑的事实。

  例如,在肥胖门诊中,很多病人会隐瞒自己的真实饭量。医生可以环环追问,推测出病人实际的饮食和运动情况,从而给出合理的治疗方案。但如果将这些“说谎的病人”交给AI,它大概率会陷入错乱。

  第二,AI会“胡编乱造”诊断书。如果说ChatGPT自创参考文献勉强算得上可爱,那么当它开始自创诊断书,就是可怕了。

  英国的一项研究发现: 聊天式AI漏掉重要诊断的概率高达60%,而这些诊断往往会危及生命,也是每个经验丰富的临床医生最关心的问题。

  显然,大部分患者也对AI医生也是将信将疑。在一项针对美国成年人的调查中,66%的女性和54%的男性都不太放心AI提供的医疗服务。

  Source: Pew Research Center, survey conducted Dec. 12-18, 2022

  解决数据问题=解决一大半难题

  为防止诊断出现误差,一些基于特定任务而开发的模型被应用在医疗领域。

  例如,梅奥诊所(Mayo clinic)设计了一种可以检测心房颤动(AFib)迹象的算法,医生只需点击嵌入梅奥电子健康记录中的AI仪表板,即可查看所有检查心电图患者的情况。

  哈佛大学和麻省理工学院的一项联合研究发现,在胸部X光检查中,AI的表现比66%了解患者病史的放射科医生更为准确。

  上述这两种模型有助于评估风险,帮助医生进行下一步检查和治疗。但它们只能执行由训练数据集及标签预先定义的任务,在临床实践中无法完成其他任务,灵活性很差。

  那么,AI诊断的担子就落在了更为灵活的大模型上,它们能否胜任?

  虽然,在大模型下,AI诊断不再是只给出简单的结果,它也可以像专家一样,跟医生进行深度讨论;大模型带来的人机自然语言无障碍交互,也可以调动多种能力解决多个场景的问题。

  不过也正如上文所举的第二个例子, 大模型“胡编乱造”的能力是阻碍其在医疗领域应用的一大绊脚石。

  但这个问题也不是不能解决。

  首先,技术的进步可以大大改善现状。

  就像第一次工业革命时期,世界上第一辆火车跑不过马车,唱衰大模型医疗诊断还为时过早。

  例如,斯坦福大学的研究人员发现,在回答一些临床推理问题时,GPT-4稳赢大二的医学生,它不仅比GPT-3.5准得多,甚至没有一本正经地胡说八道。OpenAI表示,虽然GPT-4生成事实内容的可能性比GPT-3.5高出来 40%,但要进一步降低出现“幻觉”,还有很多工作要做。虽然我们不知道要做哪些工作,但至少情况会变得更好。

  其次,解决数据问题,就能解决一大半难题。

  模型的好坏取决于人类喂给它的数据。这些数据依赖于人类的反馈结果,本身就可能带有浓重的主观色彩,并非客观准确。而当“不够好”的数据充斥其中,人工智能模型赖以生存的良性循环模式(飞轮效应)也就玩不转了。

  一方面,大型、多样化的医疗数据集难以获取。从当前来看,国内大部分医疗数据存储于各级医疗机构,业务系统相对独立,数据较难实现共享,存在明显的“数据孤岛”现象。

  目前国内AI模型训练所需要的医疗数据,大都是通过企业和医院签署研发协议获得。在实际操作中,会有专门的模块进行数据清洗,只保留必要的数据。而在数据收集到模型建立过程中,医院和企业需要做好物理隔离,做到数据不出院,模型出院。

  另一方面,大量训练数据集意味着高昂的成本。这也就提出了新的挑战:数据集合模型究竟要多大才合适?但实际情况却可能是:收集医疗数据的需求取决于医疗实际应用情况,甚至无法对数据需求做出准确的预估。例如,对于癌症的诊断,需要由影像科、病理科、肿瘤科医生组成的多学科专家小组共同判断,保证患者拿到一份准确的诊断书。而当这样的诊断交给AI模型时,其输出的内容又该如何进行事实核查?

  另外,虽然国内已经出现了一些AI医生,例如阿里健康的AI医生号称能在1.5秒内给出90%准确性的诊断;百度的AI医生可以识别900多种常见疾病,但恐怕没有患者会将其诊断和大医院的专家诊断相提并论,这说明了当下最大的问题——你真的相信AI医疗诊断吗?

  哪些赛道胜算最大?

  综上,在新一波人工智能浪潮下,医疗诊断的AI解决方案依然挑战不断,保有很大的想象空间。那么,在AI医疗其他赛道,有哪些机遇可以被企业立即抓住?

  从市场需求及规模来看,国内AI医疗影像、AI药物研发依旧是主要的增长突破口。也就是说,属于上一轮AI医疗浪潮的任务还没完成。

  医学影像科在医院发展过程中扮演着举足轻重的角色,影像数据目前占据医疗数据的90%,年增长率超过30%;影像报告占据全部诊断信息的70%;影像科的收入占据医院收入的比重超过25%。

  根据Global Market Insights的数据,全球AI医疗影像市场规模占医疗AI市场的25%,是仅次于AI制药的第二大细分市场。对于国内医疗行业来说,目前我国医疗影像数据的年增长率高达30%,但是影像科的医生年增长率却只有4%。考虑到医生的培训周期比较长,发展AI影像医疗能够有效缓解医疗人才短缺的问题,市场仍有较大的增长潜能。

  而在AI药物研发方面,AI可以有效解决新药研发的高成本、低效率和高风险的问题。2020年我国新药研发行业的市场规模为1.2万亿元,但是新药研发的成功率仅为11.3%,即使进入III期临床成功率也只有53.4%,临床阶段整体费用占比高达70%。

  这说明新药研发需要投入巨额的资金和时间,但是收益和风险都很不确定。而通过人工智能的认知能力,加速靶点发现、化合物筛选、药物设计等环节,可以有效提高新药的成功率和质量。

  例如2021年,我国AI药企英矽智能与浙江大学合作,利用自主研发的AI平台,对抗癌药物PD-1抗体进行了优化设计,并获得了美国FDA的临床试验许可。这样的成就显示了AI技术在新药研发方面的潜力,也预示了其规模化增长的可能。

投稿:lukejiwang@163.com
Copyright © 2002-2024 鹿科技