「不管是研究项目、还是产品项目,模型的能力是不可能超出收集数据的质量。目前对于癌症来讲,可能最有效的做法就是取得病人的手术活检,或者穿透活检的病例结果,然后把这个结果作为金标准用于目前的训练。 但问题在于,在一家医院里,有活检病人的数量是远少于没有活检病人数量的。」丁晓伟这样解释高质量数据的重要性。 换句话说,要保证有持续的高质量数据的输入,公司只能尽可能多得通过与医院及其他医疗机构的合作来获得。因此,如何「拿下」医院的合作项目,也是鉴别 AI 医疗创业公司生存能力的一个重要衡量标准。 虽然丁晓伟并没有过多透露 VoxelCloud 与国外包括美国 NIH(美国国立卫生研究院)、梅奥医学中心等顶尖医疗机构的合作条约内容。但很显然,其导师 Demetri Terzopoulos 在全球医疗界的赫赫声望,为 VoxelCloud 铺开了一张巨大的关系网: 「我们算是师徒创业吧,我的博士生导师 Demetri 是英国皇家科学院院士和加拿大科学院院士,在业界的地位非常高。 当然,IEEE Fellow、ACM Fellow 等头衔,奥斯卡技术成就奖,德国亥姆霍兹奖等一大堆奖项就不用说了,其实他被肯定的最重要的一点,是对医疗应用层的贡献。譬如他参与研发的图像分割算法,就被广泛应用于医疗成像技术中。」 这种略显豪华的技术背景优势,是否能够让开发者在面对成百上千万的数据时,更能对它们进行游刃有余地处理? 根据丁晓伟给出的一份案例显示,他们正在基于一份包含 250 多万病例的数据集上做出眼底各种疾病分析模型,诊断结果已经能够达到专业医生水平的准确率。
VoxelCloud团队部分成员,中间穿红衣的为Demetri Terzopoulos 然而,他们需要面对的挑战依旧很大。 MIT(麻省理工科技评论)曾在批评包括 Watson 在内的诸多医疗诊断系统「不作为」时,把矛头指向「数据处理的难度」而非「数据的量级」,这同样也是所有 AI 医疗公司都有的短板: 「很多时候,诊断结果不够好并不是公司本身的原因,而是由于数据的复杂性与相对不可用性。因此,这需要 AI 系统基于数据调整参数,以达到最佳拟合效果。对于相对容易的任务,比如检测恶性肿瘤 X 射线,效果可能很好;但在很多关系复杂的病况下,就很难实现。」 而加州大学伯克利分校公共卫生学院的生物统计学教授 Maya Peterson 也持有同样的观点,她在今年 7 月的一次医疗会议上指出: 「人体的数据真的太过复杂,而我们还没有完全理解他们之间的联系。在探索更加复杂的病症中,机器学习在某种程度上野心过大,这也不是一件好事。」 这不是一个当下能谈盈利的市场 对于 AI 医疗创业公司来说,还有另一个很严酷的事实:数据的量级是与其价格成正比的。与此同时,还有优质算法与优秀技术团队的高昂成本。 换句话说,在进入这个市场前,所有人都应该意识到这是一个「资本无底洞」。 2015 年 8 月,IBM 耗费 10 亿美元收购了医学成像及临床系统供应商 Merge Healthcare,垂涎的就是后者手中积累的海量数据。 2016 年 2 月,IBM 又甩出 26 亿美元欲拿下医疗保健数据与分析服务提供商 Truven Health Analytics,为的就是后者掌握的 8500 家客户与 3 亿病患数据。 这两个举动也被 MIT 看作是「IBM Watson 即便再被世人讨厌,也仍然有其竞争优势」的关键证据。 而另一个残酷的反面案例是,作为 Watson 的第一批合作伙伴,曾希望借助 Watson AI 诊疗技术来构建独立肿瘤专家建议系统的安德森癌症中心 MD Anderson,在耗尽 6000 万美元后,宣告项目失败。
此外,与庞大投入相对应的,是商业模式仍然在寻找,盈利更是不可能谈起的早期探索状态。 丁晓伟向机器之能透露,VoxelCloud 目前已经推出了成熟的产品,但在当下所有签订的合同中,与公立医院的项目肯定是非盈利的合作形式,而私立机构用他们的系统则是要收钱的。 「现在大家都处于早期,研发与搜集更多的数据是最重要的事情。虽然我们已经有了不少成熟的产品线,但是这个领域真的太新了,我们必须怀着谨慎和敬畏的心,持续往前去推进。 (责任编辑:admin) |