专注肿瘤大数据与产业应用平台

专注肿瘤大数据与产业应用平台
2018年11月14日 19:53 新浪健康

编者按:与糖尿病探索空间大的情况相似,肿瘤大数据应用面同样丰富,价值不菲。如何与政府、医疗机构协作,整合患者信息,并对其进行结构化数据处理,获得产业、学术、商业价值?

2018年10月27日,由中国健康产业创新平台主办,中欧国际工商学院卫生管理与政策中心承办,普华永道协办,新浪健康、爱问医生作为战略合作媒体特别支持的2018中国健康产业创新论坛在上海顺利闭幕。

零氪科技创始人、CEO张天泽零氪科技创始人、CEO张天泽

计算机专业出身的张天泽,2004年毕业后先后就职于腾讯、阿里,2009年开始创业,直到2015年融资之前试错5年,零氪科技用9年时间再次证明医疗慢行业的必然属性。零氪科技如何从拥有数据到拥有能力,赋能企业、赋能临床,让我们一探究竟。

选定公司方向标,持之以恒

零氪是专注于肿瘤领域的医疗大数据公司,医疗大数据产业,处于16万亿新医疗产业的枢纽位置,发挥着引领、驱动、串联的重要作用。这个定位思路来源于张天泽曾过往看到的2016年中国肿瘤患者迁徙图,

上幅看起来像双十一物流,又像春运,但实际上是一个个肿瘤家庭带病人去求医的路径,这个图背后有几笔惊人数字:

1) 每年肿瘤患者,院内包括院外一部分费用(不包括交通、食宿等)是四千亿;

2) 发病人数是四百万;

3) 40%用药不够准确,浪费严重;

如果要选择一个疾病需要数据切入它能够带来改变,零氪科技的选择是肿瘤,但在实际投入时,张天泽发现所以医疗不是一盘数据就可以解决的,其路险峻。

零氪科技目前已经是国内领先肿瘤数据解决方案公司之一,可以用一种方法将临床参差不齐病例数据都整理起来,然后逐渐进行详细报告输出。数据产业赛道之所以难做,利益相关方很多,这个时候逐一分条看,有指向几个产业的应用:药品研发评价、医药营销与流通、辅助诊断与辅助治疗、商业健康险、基因数据整合分析、学术与科技服务、药品监管以及医学专业教育等,所以医疗数据非常需要政府支持,这些事情之所以有这么多应用场景,呼之欲出却只闻声音不见人。零氪科技一直在思考,如何产生能用的数据、能用数据检查方式是什么,用什么样的数据分别解决什么样的产业问题。

医疗数据挖掘之路

医疗数据之前有人提到健康中国战略,规划了十万亿大市场,但是每一个市场都有很多问题需要解决。北美的肿瘤临床医药领域,同样面对大量RWD亟待开发的现状。北美有数据报告显示,北美医疗临床使用率很低,3%临床病人加入实验,97%的病人病例看完之后直接放到档案室里没有有效使用,所以成立了一个PROGRESS,专门把数据汇集起来帮助医生有效进行学术交流和数据挖掘,处理数据水平也是大量机器加人工处理为起点的。

医疗病例,并非一定是医疗数据,并不是能用于操作的都叫数据,比如说一部电影,MOV格式的可以用U盘考走,但是其电子化档案并不是数据,没有办法直接使用,所以医疗数据使用在张天泽看来,可以形象描绘为对原油冶炼和开发。原油冶炼后可变成很多应用场景,但是如果没有好的冶炼技术就不能变成可用的。所以任何一种资源和粗资源都有一个成本收益剪刀差,如果采集挖掘成本很昂贵,这个时候只有一部分场景用得起才会用,比如新药研发必须要做,这个时候才挖掘临床数据,如果大规模把临床数据,各种综合数据有效挖掘起来,就可以取出用于自己的应用场景,用于训练,用于市场洞察和分析。

每年几百万中国肿瘤病人产生两部分数据,一个是信息整合,一个是进行结构化数据处理,很多环节都有很多关键性技术,产生高质量结构化队列级数据,这个时候数据进行挖掘分析再价值分装。零氪科技工作人员有四类背景,分别是BAT科技型背景、CRO、药企医学背景,和商业服务,这四类融合一起,一点点把数据处理为保险、药企等不同合作服务对象需要的形式。

基于优质医疗数据的优质临床医疗应用

零氪一开始做这件事情,发现临床病例不是数据,辩证数据很难,临床病人很多,中国大型三甲医院集中头部医院,而肿瘤患者是择期的,是可以挑时候,这个时候医生看病都看不过来,无暇顾及处理数据。病例也不能直接使用,没办法直接进行统计。院内信息产生是下围棋前半盘,没有后半盘,到底谁赢无法判断,无法评价治疗方案,为了解决这个问题,零氪组建了一个团队,帮助三甲医院,随访肿瘤病人达到60万,所以这里面做的功课非常重,之前要不是有类似滴滴做的很重产业科技公司去推动资本市场,要做重这个事情估计也做不起来。

1、行业指标方面,零氪看到非结构化院内数据也是非常不标准。以乳腺癌为例,肿瘤大小的描述是没有统一的判断和记录,对于大型三甲医院核心的肿瘤科,确定患者分期进展关键指标到底错误率有多少?三甲医院错误率是50%,零氪是从病例报告,影像报告里面取客观数据,用NCCN不同标准自己去算分期。

2、安全性方面,专家很在乎自己数据安全性,怎么确保伦理安全情况下数据可以有效流动使用很关键。零氪一开始给医院做的是业务,把医院临床病例做成可以研究的数据,现在设计了很多科研表格,病例里面大概描述变成直接点选,符合国际标准的结构化数据模型,翻译成结构化数据进行分析,每一个面还有字典定义不同医院描述。

第一阶段,两个人读,读两遍录两遍再有一个人去检查;

第二阶段,大量人读产生标注阅读理解,然后用算法继承和读懂后面自动化处理。

前面做的很重,做的越多这个时候就有机会用算法,用前面业务素材资料产生你想要的能力,人工智能运用不是用来分析数据,而是用来产生数据处理数据,这是零氪科技过去三年中产生的AI应用,这个AI应用大家是看不见的。

3、科研方面,大量学术研究可以证明这个事情是不是有产出。上个月欧洲大会ASCOMerit有一个主题报告,刚刚结束的乳腺癌汇报都是通过这个数据产生的结果。

4、临床医疗应用上,不用盲测,几十万页肺癌CT报告结节,AI可以判断良恶性风险。今年中国医学年会上,我们请了一些专家和机器来判断结节良恶性,准确率很高,机器的速度更快。后来我们又进一步拿了牌照,给患者一些建议,做AI辅助诊疗平台,一天350例患者拿来做算法,这350例有50例患者选择做手术,300个患者判断良性就不做了。零氪核心是不是为了做影像良恶性判断做的,为了给出手术方案或者是治疗方案。

5、整个药品生命周期产业中产业分四个阶段,新药发现,实验室研究,临床注册研究,上市后推广和学术,我们专门挑选出几个场景,有数据、有患者、有临床资源,能够为产业新药研发快速上市提供帮助的,产生了四亿企业合同规模,企业围绕数据量需求很大。去年帮助合作企业把临床指南和共识修正,效率也很高。

(本文根据嘉宾发言速记蓝眼睛整理,未经讲者本人确认)

大数据肿瘤临床

新闻排行榜

健康美图

名医有话说

大医精诚

特别推荐

品牌策划

高清视频

热门微博