2017年11月29日

 

把眼底筛查 AI 装进笔记本电脑里,河谷互动是怎样一步一个脚印的?


11月29日,雷锋网对河谷互动的Healgoo AI产品进行了专访。以下是刊登的采访内容。

 

用 AI 做眼底疾病筛查的企业不在少数,广州河谷互动医疗科技有限公司(以下简称河谷互动)并非最耀眼的那一家。但它已经在这条路上走了很远。

 

河谷互动的 AI 眼科诊断系统 Healgoo AI 已经应用到了基层的眼底疾病筛查当中,给患者带来了实实在在的帮助。

 

今年7月21日,河谷互动就携 Healgoo AI 产品在广州市海珠区松鹤养老院开展了一次免费的眼病筛查活动。只要通过一台眼底相机,对左右眼球分别拍照之后,数据就会自动传入河谷 AI 眼科诊断系统,进行分析,并迅速生成一份书面的眼疾诊断报告,供眼科医生参考使用,整个过程仅需几分钟。

 

从远程阅片到 AI 阅片

 

河谷互动 CTO 孟巍介绍,河谷互动成立于 2013 年 9 月份。当时他们就已经洞察到了眼底疾病筛查的巨大市场,于是开发了一个叫做 Eye Grader 的远程医疗云平台。

 

筛查点和基层医院的医生拍摄好眼底照片后,可以通过 Eye Grader 平台把照片上传到云端,交由三甲医院的医生人工阅片。筛查出的患者还可以通过平台转诊到专业的眼科医院进行治疗。

 

据孟巍介绍,目前全国已经有400多家医院在使用这一平台,辐射范围涵盖了西藏以外的全国所有省份。甚至香港、印度和澳大利亚等地区也有部分医院在使用 Eye Grader 平台。中华健康快车基金会、中国防盲基金会、远程视界集团、中山眼科中心、澳大利亚眼科研究中心的糖网筛查项目也都是在 Eye Grader 平台上展开的。

 

得益于此,河谷互动早期积累下了大量的眼底照片数据,为之后转向 AI 阅片奠定了基础。

 

孟巍认为,数据集、算法、人才和硬件是研究 AI 的四大要素,其中数据集最为重要。他说道:“我们作为 AI 应用型企业,主要目标并非发明新的网络和算法。大家采用的都是比较常规的算法,本质上大同小异,因此主要比拼的是数据集。我们的优势就在于拥有大量的数据。”

 

孟巍表示,Eye Grader 是一个人工阅片平台,平台上的眼底照片都是经过两名通过 NHS 考试认证的专业阅片人员共同审阅后给出报告的。因此河谷互动的数据标注质量非常高,准确度甚至超过了 Kaggle 比赛的数据集。

 

据了解,河谷互动按疾病的严重程度把眼底照片划分成了五个等级,数量平均分布,随机选择了 20 万张用于模型训练。另外还准备了 7 万张用于模型测试。

 

从特征识别到卷积神经网络

 

2014 年 Eye Grader 平台逐渐壮大,有限的阅片师已经无法从容应对如此庞大的阅片量,河谷互动开始尝试用人工智能技术提升阅片效率。

 

当时深度学习的大火还没有燃起,河谷互动选择了从基于特征识别的机器学习算法开始着手研究。特征识别算法需要先识别视盘、视杯、出血、渗出等病灶,测量并计算相关参数与标准进行比对,然后根据病灶的面积和个数等定义疾病的严重层级。

 

经过一段时间的探索和研究,河谷互动发现这种算法的鲁棒性不强。对于某些眼底照片它的识别效果非常好,但对于另一些眼底照片,它的识别准确率却难以达到应用水准。

 

孟巍向雷锋网(公众号:雷锋网)介绍道,特征识别算法主要有以下几点缺陷:

 

  一、对病灶的识别不够准确。比如容易漏掉出血点,或者把血管的一部分误认为出血点,从而导致对疾病严重程度的判断出现偏差。

 

  二、系统存在“木桶效应”。以糖网筛查为例,糖网筛查不仅要看出血点还要观察渗出,需要用到两个不同的模型,最后综合两个模型的输出得出结论。结论的准确性往往取决于效果最差的模型。

 

  三、系统存在“依赖性”。比如计算出血点的面积前,要先将血管提取出来并抠除。如果前一步计算出现偏差,势必会影响到接下来的结果。

 

  四、有些疾病无法按严格数学标准来定义。就拿白内障来说,白内障在眼底照片上的呈现是照片的模糊程度,这很难用数学模型来定义。

 

“综合考量之后,我们认为特征识别算法有很大的局限性。刚好当时 Kaggle 的比赛出来了,我们和斯坦福大学研发实验室的团队商量一起参赛,最后用深度学习算法取得了 Leaderboard 前十五名的成绩。比赛结束后,我们又基于Eye Grader 平台的数据集,结合比赛中的调参经验对算法进行了优化。现在我们的算法已经有了极大的提升,糖网识别准确率达到了 96.7%。”孟巍对雷锋网说道。

 

据孟巍介绍,目前大多数做眼底筛查产品的 AI 企业采用的仍是特征识别算法,只不过其中有些采用的是传统的机器学习算法,有些则是基于特征识别的深度学习算法。特征识别算法本质上是把眼底照片分割成了很多部分,然后寻找相应的特征值与标准进行对照。卷积神经网络则把眼底照片作为一个整体。

 

他说道:“我们无需告诉它照片中有哪些特征点,只要让它知道每一张照片对应的结果是阴性还是阳性,它就能通过学习大量数据摸索出具体的规律。”

 

但算法在“黑箱”状态下捣鼓出来的规律到底靠不靠谱呢?河谷互动也很好奇。因此他们让算法在对照片进行分析后,把它认为对诊断结果有影响的地方标注出来,形成一个热力图。热力图显示,算法的判断依据和眼科医生是一致的。

 

此外,河谷互动还邀请了各种年资的住院医师、主治医师和主任医师,在相同数据集下和人工智能进行比试。结果显示,河谷互动的眼底筛查 AI 在糖网识别方面已经超过了主治医师,接近主任医师水平;在青光眼和老年黄斑性变方面甚至超过了主任医师。据孟巍向雷锋网介绍,基于该测试结果河谷互动已经向国际期刊 Ophthalmology 提交了论文,目前正在等待 Review。

 

从云端到离线

 

河谷互动的产品目前已经能够胜任糖网、青光眼、老年黄斑变性和白内障四种眼底疾病的筛查,针对每种疾病都有一个独立的模型。此外,河谷互动还专门训练了一个图像质量判断模型,确保眼底照片的质量。

 

尽管如此,在孟巍看来,“AI 取代专业医生”的说法还是不太靠谱。他指出,河谷互动首先要解决的是三类场景下的眼底疾病初步诊断问题:

 

  一、基层社区和边远乡村的眼底筛查。

 

  二、很多基层医院只有五官科,没有专业的眼科,五官科医生对眼科疾病的了解有限,人工智能可以帮助他们进行初步的诊断,判断是否需要将病人转诊到专业的眼科。

 

  三、糖尿病患者平时在内分泌科进行控糖管理,人工智能可以帮助不具备阅片能力的内分泌科医生初步判断病人的眼底病变情况。

 

产品实际应用过程中,河谷互动遇到了一些挑战。首先,很多社区和乡村的网络条件很差,基于云端的人工智能筛查产品没有用武之地。其次,医院保护病人数据安全的意识很强,对把眼底照片上传到云端心存顾虑。

 

因此河谷互动在云端版本 Healgoo AI 之外,还花费大量精力优化算法,专门开发了能在笔记本电脑上运行的离线版眼底疾病筛查系统。

 

孟巍表示:“云端版本更容易实现,而且成本低,不用添置新的设备,开通账号即可使用,计算速度也更快。但由于网络环境欠佳,云端版本在基层筛查场景中并不靠谱。我们的离线版系统在市价 5000 左右的笔记本电脑上就能运行。未来我们还将进一步优化算法,降低其对硬件的要求,提高系统的经济性和便携性。”

 

据了解,河谷互动的离线版眼底疾病筛查系统在拍摄完照片 1-2 秒内即可给出结果,结果中除了对疾病进行分级,还会给出相应的信心指数。如果自信度比较高,那么基本就能确诊;如果自信度只有50%左右,则说明结果仍有待商榷。

 

从产品到商品

 

对于企业来说,做好产品只是第一步;如何找到一套成熟可行的商业模式,将产品转化成商品并实现盈利,才是企业生存的根本。这是当前很多 AI 医疗企业所面临的困境。

 

河谷互动市场经理宋镰坦言,AI 医疗产品的市场推广确非易事,不过相对其他企业河谷互动有其独到的优势——已经覆盖了400多家医院的 Eye Grader 远程医疗云平台。

 

他表示,河谷互动计划将 Eye Grader 平台和眼底筛查 AI 打通。这样一来,就能和眼底相机厂商合作(河谷互动的 AI 为眼底相机厂商的产品提供附加值,相机厂商则为河谷互动提供销售渠道)将眼底筛查 AI 推广到医院和基层的筛查点。通过 AI 筛查出病人之后,再将其眼底照片上传到 Eye Grader 平台由大医院的医生进行确诊,并根据患者的病情严重程度在医联体内部实现分级转诊。”

 

在医联体建设中,除了行为上的协同,数据层面的对接也很重要。由于各个医院采用的系统不同,设备厂商五花八面,数据的标准化和互联互通一直是医联体建设的一大难题。宋镰表示,未来河谷互动还可以为各级医院提供一个数据采集系统。该系统可以和各个医院的眼科检查设备对接,从而实现真正的数据标准化和互联互通。

 

宋镰认为,用人工智能产品直接帮助医疗机构做慢病管理,对医疗行业的贡献有限。借助人工智能推动医联体建设或许更有价值,这也是河谷互动正在努力奋斗的目标。

 

点击查看:雷锋网原文链接