换句话说,在他的认知中,一件成功的医疗诊断产品,不仅会「学习海量的数据」,还要对诊断过程有一个深度理解。把医生写报告,向上级寻求帮助,二次审核等梯级任务都学到手,具备像人类一样的「处理不确定性的能力」。 某种程度上,这个设想与 Google Deepmind 团队一边做糖网病筛查诊断系统,一边研发医务支持与任务管理系统的「两手抓」计划有共通之处。 「所以,我们想优化的是整个看病流程,而非仅仅提高一个诊断结果的准确率。这不是一个单纯拼技术水平高低的问题,而是谁能在现实诊疗过程中更有风险控制的能力。」 但是,无论通过什么手段来保证诊断的准确率与提升医生的满意度,丁晓伟也承认一定需要考虑地域之间的差异。这也是 VoxelCloud 在美国与中国分别设立研发中心,与美中两国医疗机构同时进行项目试验的根本原因: 「我们的研发中心是洛杉矶,跟梅奥医学中心,UCLA 医学中心的关系也非常好,项目都是一起合作的。在国内,虽然合作医院需要取得授权才可以透露名字,但已经有 100 多家了,都是北京和上海的三甲医院。 这样做的理由,不只是因为病患的数据会有地域差异。国内外的诊疗流程也很不一样,两者都是相辅相成的,而且两地的研发结果也能做到互补,我们必须同时考虑到。
VoxelCloud与交大洽谈医疗影像合作 数据是否是核心竞争力? 好算法虽然是价值千金,但是好数据却更是「千金难买」。 风投机构 8VC 的 CEO Joe Lonsdale 曾在今年在斯坦福举行的 Light Forum 会议上称:「做医疗诊断一开始遇到的挑战就在于搜集与创建数据」。 而美国癌症中心 MD Anderson 的一位负责人也认为,只有在拥有上万患者数据的前提下,才能初步找到针对性治疗模式: 「从各种患者数据中找到不同的特征很关键,这对针对性治疗与精确用药非常有帮助。但是如果不能扩大现有数据集,上述愿景是无法实现的。你可能只有 1 万个肺癌患者数据,但其实这个数字并没有很大。」 此外,一位专注于医疗创业项目的分析师告诉机器之能:「现在 AI 医疗初创项目之间的竞争核心,就在于谁能拿到更多的数据。」 很简单,医疗数据之于医疗诊断的重要性,就像道路测试之于无人驾驶汽车。你只有不断地让汽车去实地训练,不断地收集与「咀嚼」道路数据,才能绘制出更高精的地图,逼近更高的安全数值。 同理,人体的复杂性更是不必多说。这也是为何 IBM 的数据工程师与医生们耗费了六年之久,才仅仅让 Watson 学习了 7 种癌症;而科技巨头与这个领域内所有创业公司也只能从单一的或者两三种疾病入手来进行摸索学习。 丁晓伟也认同这个观点。他认为,目前这个市场,大多数公司都在做肺癌、糖网病的 AI 医疗诊断,一方面是因为这些病种发病率非常高,影响范围非常广,且难以攻克,所以研究价值非常大。 而另一方面,其实是因为这些病的数据比较容易能拿到,包括网络等很多途径都是能搜集到很多案例的。 「这些可能是起点与上手都相对其他病症来说更容易一些(不是说本身容易)的项目,所以大家都从这几个病种入手。」
目前大多数AI医疗公司研究最多的4种病症:肺癌、糖网病、冠心病、肝病 根据知名医疗媒体 mobihealthnews 的一份调查,在医疗领域,数据的收集形式其实很丰富,包含临床实验、医生报告、医学图像、传感器和生物样本等多种获取途径。 然而,如何获取优质数据,特别是「干净」的患者数据,对于所有该领域的公司来说,是更为至关重要的。 (责任编辑:admin) |