叫好不叫座 AI医疗“卡脖子”难题怎么破？-叫|好不|叫座|AI-鹿科技

　　原标题：叫好不叫座 AI医疗“卡脖子”难题怎么破？

　　一直以来，医疗行业都被视为AI应用的最佳场景之一。在上一轮AI医疗浪潮中，人工智能的应用主要集中在影像领域。那么，在本轮AIGC浪潮中， AI医疗是否迎来了新的突破口？

　　近日，红杉资本发布了一篇名为《Generative AI in Healthcare》的报告。其中提到，目前AI能够很好地处理患者互动、文档记录、预授权、编码和收入周期管理等环节，例如将医生和患者的对话，自动转化为电子病历和编码等等。红杉资本认为，现在的AI开始渗透到医疗行业的多个环节，从而大大提高医疗领域的效率和质量，降低成本和人力。

　　那么，除了处理这些看起来不够前沿的非结构性数据，医疗行业的“卡脖子”领域——医疗诊断，在这一轮人工智能浪潮中，能否获得新的解决方案？又有哪些难点？近日，华尔街日报发布的一篇文章《Can AI Help Doctors Come Up With Better Diagnoses?》给出了一些答案。文章作者为Laura Landro，她专注于医学与健康领域方面写作，出版过书籍《幸存者：控制你与癌症的斗争》等。适道对原文内容进行了缩写和补充，以下是正文。

　　准确性是永远的痛点

　　第一，AI无法取代医生经验。虽然生成式AI能提出诊断建议，并提示医生：患者可能出现的病情趋势。但在临床实践中，除了一张冷冰冰的体检报告，医生还要和患者面对面交流，通过望闻问切、建立联系、获取信任，从细微之处察觉患者的病情起因发展，排查不符合逻辑的事实。

　　例如，在肥胖门诊中，很多病人会隐瞒自己的真实饭量。医生可以环环追问，推测出病人实际的饮食和运动情况，从而给出合理的治疗方案。但如果将这些“说谎的病人”交给AI，它大概率会陷入错乱。

　　第二，AI会“胡编乱造”诊断书。如果说ChatGPT自创参考文献勉强算得上可爱，那么当它开始自创诊断书，就是可怕了。

　　英国的一项研究发现：聊天式AI漏掉重要诊断的概率高达60%，而这些诊断往往会危及生命，也是每个经验丰富的临床医生最关心的问题。

　　显然，大部分患者也对AI医生也是将信将疑。在一项针对美国成年人的调查中，66%的女性和54%的男性都不太放心AI提供的医疗服务。

　　Source: Pew Research Center, survey conducted Dec. 12-18, 2022

　　解决数据问题=解决一大半难题

　　为防止诊断出现误差，一些基于特定任务而开发的模型被应用在医疗领域。

　　例如，梅奥诊所（Mayo clinic）设计了一种可以检测心房颤动（AFib）迹象的算法，医生只需点击嵌入梅奥电子健康记录中的AI仪表板，即可查看所有检查心电图患者的情况。

　　哈佛大学和麻省理工学院的一项联合研究发现，在胸部X光检查中，AI的表现比66%了解患者病史的放射科医生更为准确。

　　上述这两种模型有助于评估风险，帮助医生进行下一步检查和治疗。但它们只能执行由训练数据集及标签预先定义的任务，在临床实践中无法完成其他任务，灵活性很差。

　　那么，AI诊断的担子就落在了更为灵活的大模型上，它们能否胜任？

　　虽然，在大模型下，AI诊断不再是只给出简单的结果，它也可以像专家一样，跟医生进行深度讨论；大模型带来的人机自然语言无障碍交互，也可以调动多种能力解决多个场景的问题。

　　不过也正如上文所举的第二个例子，大模型“胡编乱造”的能力是阻碍其在医疗领域应用的一大绊脚石。

　　但这个问题也不是不能解决。

　　首先，技术的进步可以大大改善现状。

　　就像第一次工业革命时期，世界上第一辆火车跑不过马车，唱衰大模型医疗诊断还为时过早。

　　例如，斯坦福大学的研究人员发现，在回答一些临床推理问题时，GPT-4稳赢大二的医学生，它不仅比GPT-3.5准得多，甚至没有一本正经地胡说八道。OpenAI表示，虽然GPT-4生成事实内容的可能性比GPT-3.5高出来 40%，但要进一步降低出现“幻觉”，还有很多工作要做。虽然我们不知道要做哪些工作，但至少情况会变得更好。

　　其次，解决数据问题，就能解决一大半难题。

　　模型的好坏取决于人类喂给它的数据。这些数据依赖于人类的反馈结果，本身就可能带有浓重的主观色彩，并非客观准确。而当“不够好”的数据充斥其中，人工智能模型赖以生存的良性循环模式（飞轮效应）也就玩不转了。

　　一方面，大型、多样化的医疗数据集难以获取。从当前来看，国内大部分医疗数据存储于各级医疗机构，业务系统相对独立，数据较难实现共享，存在明显的“数据孤岛”现象。

　　目前国内AI模型训练所需要的医疗数据，大都是通过企业和医院签署研发协议获得。在实际操作中，会有专门的模块进行数据清洗，只保留必要的数据。而在数据收集到模型建立过程中，医院和企业需要做好物理隔离，做到数据不出院，模型出院。

　　另一方面，大量训练数据集意味着高昂的成本。这也就提出了新的挑战：数据集合模型究竟要多大才合适？但实际情况却可能是：收集医疗数据的需求取决于医疗实际应用情况，甚至无法对数据需求做出准确的预估。例如，对于癌症的诊断，需要由影像科、病理科、肿瘤科医生组成的多学科专家小组共同判断，保证患者拿到一份准确的诊断书。而当这样的诊断交给AI模型时，其输出的内容又该如何进行事实核查？

　　另外，虽然国内已经出现了一些AI医生，例如阿里健康的AI医生号称能在1.5秒内给出90%准确性的诊断；百度的AI医生可以识别900多种常见疾病，但恐怕没有患者会将其诊断和大医院的专家诊断相提并论，这说明了当下最大的问题——你真的相信AI医疗诊断吗？

　　哪些赛道胜算最大？

　　综上，在新一波人工智能浪潮下，医疗诊断的AI解决方案依然挑战不断，保有很大的想象空间。那么，在AI医疗其他赛道，有哪些机遇可以被企业立即抓住？

　　从市场需求及规模来看，国内AI医疗影像、AI药物研发依旧是主要的增长突破口。也就是说，属于上一轮AI医疗浪潮的任务还没完成。

　　医学影像科在医院发展过程中扮演着举足轻重的角色，影像数据目前占据医疗数据的90%，年增长率超过30%；影像报告占据全部诊断信息的70%；影像科的收入占据医院收入的比重超过25%。

　　根据Global Market Insights的数据，全球AI医疗影像市场规模占医疗AI市场的25%，是仅次于AI制药的第二大细分市场。对于国内医疗行业来说，目前我国医疗影像数据的年增长率高达30%，但是影像科的医生年增长率却只有4%。考虑到医生的培训周期比较长，发展AI影像医疗能够有效缓解医疗人才短缺的问题，市场仍有较大的增长潜能。

　　而在AI药物研发方面，AI可以有效解决新药研发的高成本、低效率和高风险的问题。2020年我国新药研发行业的市场规模为1.2万亿元，但是新药研发的成功率仅为11.3%，即使进入III期临床成功率也只有53.4%，临床阶段整体费用占比高达70%。

　　这说明新药研发需要投入巨额的资金和时间，但是收益和风险都很不确定。而通过人工智能的认知能力，加速靶点发现、化合物筛选、药物设计等环节，可以有效提高新药的成功率和质量。

　　例如2021年，我国AI药企英矽智能与浙江大学合作，利用自主研发的AI平台，对抗癌药物PD-1抗体进行了优化设计，并获得了美国FDA的临床试验许可。这样的成就显示了AI技术在新药研发方面的潜力，也预示了其规模化增长的可能。