微基因CEO陈钢:口水中的秘密,基因数据的未来

微基因CEO陈钢:口水中的秘密,基因数据的未来
2018年12月13日 17:14 新浪健康

【导读】11月30日,在亿欧主办的2018亿欧大健康创新者年会上,微基因CEO陈钢发表了题为《口水中的秘密,基因数据的未来》的演讲。他认为基因是数字化生命的基础。

  11月30日,由亿欧主办的2018亿欧大健康创新者年会在北京国贸大酒店成功举办。本次峰会围绕消费级基因检测、医药零售、医美体检、眼视光、医疗口腔等议题,与行业人士一同探讨新政策与新机遇下大健康行业的未来走向。

  出席本次峰会的嘉宾有美年健康董事长俞熔、联合丽格董事长李滨、星创视界董事长王智民、康复之家CEO康凯、美维口腔医疗合伙人兼COO宋大卫、微基因CEO陈钢、诚存资本合伙人方贤赟、重山资本创始合伙人孙超、亿欧公司副总裁高昂等。

  大会上,微基因CEO陈钢发表了题为《口水中的秘密,基因数据的未来》的演讲。

  他的主要观点如下:

  1、大多数疾病的风险评估都离不开基因,比如说阿尔茨海默症。健康消费的三个关键词——老龄化、慢性病、预防,都跟阿尔茨海默症有明确关系。

  2、基因组数据几乎是最去中心化的数据。

  3、基因是数字化生命的基础,人工智能应用于健康领域的前提是把人体的基础数据进行数字化。

  以下为演讲速记(有所删减):

  大家上午好,很高兴有机会来亿欧的活动。

  我们是做基因的,在座的都是灵长动物的后代。我们身上的每一个基因,每一个基因的每一个元素或多或少跟它有关系。它给我们留下了很多的信息,有好的、有坏的。比如五百万年前我们的祖先开始直立行走,我们不再趴着。现在由于脊椎的问题,很多人又得趴下,看手机看多了。也有不好的东西,我们有没有办法预防呢?

  说说大家关心的事情——钱。我们在座的都想怎么得到更高的工资,怎么拿到更多的融资。大概在2009年之后,中国人民大学做了一次中国劳动力市场的调查,中间有一个很有趣的统计的相关性就是身高和收入。在中国的劳动力市场里面,不管是男性还是女性,身高都跟平均收入呈正比的关系。所以好像长高一点,平均收入会高一些。

  这个数据看上去似乎很意外,但是实际上挺合理的。我们经常能看到各种招聘里面说165以上、170以上的要求。除了开坦克的要求身高不能超过多少以外,其他很少有超过180的不要,感觉挺合理的。但科学家,总想探究一下中间到底是什么因素会影响。

  因为我们知道影响身高的因素很高,有先天的、有后天的。姚明的女儿会比在座的很多男同志要高。同样一个家庭里面的小孩身高也有高有矮。我们把这些因素全部拆开,很想知道到底是后天的因素跟身高有关,还是先天的因素跟身高更有关。我们最近跟中国人民大学一起做了一次研究,在我们几十万用户里面调查了一下大家的经济情况,我们有大量的基因跟身高的研究结果,我们知道哪些基因会跟身高产生或多或少的影响。

  实际上我们遗传的那一部分对身高产生影响的部分跟收入没有任何相关性,而真正影响收入的还是后天影响我们身高的那些因素。比如家里面小时候是不是有足够的营养摄入,是不是在合理地运动。某种程度上说虽然基因会影响身高,实际上对于我们社会竞争力和收入还是要靠大家的后天努力。

  在中间的研究我们可以确认的一个事情是身高确实会受到基因的影响,我们用人工智能的方法,用基因数据预测一个人的成年身高,可以看到有非常强的显著性。大家从图上看到的两环实际上是男性和女性的身高差异。我们会发现有很多其他的事情,比如说我们对于85后、90后的身高的预测的误差会明显小于我们对年龄更大的人的误差,因为在过去这么多年里,中国经济飞速发展,使得年龄稍微大一点的人身高更大因素来自于影响。而今天营养比较丰富的情况下,大家拼天赋。

  除了身高与收入在基因上的关联,影响大家健康的还有很多疾病会受到基因的影响,比如说肿瘤,到现在我们各种肿瘤的风险评估实际上都逃不开基因。去年,我们的合作方上海交通大学的两个老师和他们的团队做了两万多中国人的基因检测之后,专门做了中国人的精神分裂症的基因易感性的研究结果,发现了一百多个中国人当中跟精神分裂有关的疾病。反过来说,即使像精神分裂症这样的疾病,都跟基因有非常显著的关系的。

  再比如我们经常说的心血管类疾病,就是在两个月以前,顶级的遗传学期刊上面就用几十万人的数据构建出机器学习的模型,纯粹用基因组数据加上年龄,预测心血管疾病发病的准确性。提供的值具体是什么含义,这个准确率大概是基因检测去检测一个单基因遗传病的水平,或者在临床上是大规模使用的水平。

  诸如此类,很多疾病都会受到基因的影响。

  还有更典型的比如阿尔茨海默,直到今天我们没有非常有效的长期延缓疾病的方法。过去十几年里,各大药厂砸进去无数钱,最后只有一家中国药厂的三期临床过了。

  这会导致什么样的情况?其实这个情况挺惊人的。如果我们继续保持我们对阿尔茨海默症始终是现在这种既不能治疗、也不能长期有效延缓的状态,几十年后,这个影响会越来越大。健康消费的三个关键词——老龄化、慢性病、预防,都跟阿尔茨海默症有明确关系。阿尔茨海默症最大的发病率风险因素是老龄化,全世界都在老龄化,这会导致一个结果是根据现在的流行病学调查和人口发展的情况,到2050年全世界有5%的人或多或少受到阿尔茨海默症的影响。而且我们知道这样的疾病它影响的不是一个人,前段时间我去北京天坛医院,应该是国内最顶级的神经内科医院,他们刚刚成立了认知科学中心。那个中心的病房,不仅进去的时候要刷卡,出来也得刷卡,因为病人自己出来的时候经常回不去。所以像痴呆这样的病,不仅仅影响病人本身,家庭至少会有一个人要完全投入进行陪护,还有医疗人员。大家去京东搜阿尔茨海默症的书,除了这些专业书籍以外,其他的书都是如何陪护阿尔茨海默症病人。5%的人加上陪护、加上医疗投入,这是在2050年会影响将近10亿人的疾病。我们生命科学领域难得有可以超过《王者荣耀》的影响力。

  我们知道阿尔茨海默症很大程度上会受基因的影响,基因是中间非常大的风险因素。所有人的风险随着老龄化都在不断上升,但是套用一个经典的句子,所有人的风险都在上升,但是总有那么一些人他的风险上升速度比别人快。比如我们发现一小群人在中国占的比例不大,但是在75岁的时候阿尔茨海默症的发病风险是一般人平均水平的20倍,28%的水平。在这群人里面,平均每三到四个人就会有一个人在75岁的时候患阿尔茨海默症,这个比例很高。

  大家可以说这种发病率在75岁发病率很高的人群占中国人群不到1%,我们经常遇到这种不好的消息的时候都会默认自己是其余那99%,似乎跟自己没什么关系。但实际上还想告诉大家的是,虽然不是很多人会有这种20倍的风险,但是大概在中国有18%的人就是大概将近五分之一的人在75岁的时候发病率是普通人的7到8倍。比如台上这个人,在19号染色体有突变,会导致我在不同年龄段之后发病风险比普通人高出若干倍。阿尔茨海默症目前没有太好的干预和延缓的方法,但是另一方面流行病学调查又调查出了很多跟阿尔茨海默症发病有关的风险因素比如肥胖,心血管的发病或者脑外伤,我没法预测,但是我下台的时候会不会摔跤这件事,由于我过去一年努力控制体重,对我产生很大的帮助。如果到了影响人群达到20%的时候,很多人都不会再忽视这个事情。

  回到我们刚刚说的事情,如果我们现在一直保持这样的状态,到2050年会有这么多人受影响,有没有什么办法我们能够延缓?我们已经知道阿尔茨海默症跟基因有巨大的关系,所以实际上所有的基因包括阿尔茨海默症的临床试验,比如说今年FDA有一个失败的临床试验,虽然失败了,但是FDA对于临床试验中入组病人和参考单位组的病人的基因突变的比例是有一定的要求,不能用药组全是高危人群,而不用药组全是没有突变的,这样这个试验不需要做就会产生明显的影响。

  这样大量的不管是基础研究还是临床研究,都会需要大量的基因组数据参与其中。而基因组数据有个特点,它几乎是最去中心化的数据。比如说今天我要十万台的iPhone手机,马上去京东下个订单,就可以买来十万台手机。但是今天我说我要十万组的基因组数据,我就是把台上这个人测十万次,还是一份基因的数据。当我需要十万组基因数据,真的需要十万个人参与其中。这样的研究是有人群特异性,我如果想让中国的阿尔茨海默症得到好的干预方案、治疗方案甚至健康的预防方案或者是最终的治疗方案的话,这些研究要大规模在中国人口规模上展开,需要十万个中国人参与其中,才能做这个事情。所以这是为什么会做微基因这个事情的很重要的原因之一。

  所以我们做微基因的过程中间,实际上做了很多的研究,希望我们的用户能够参与诸如阿尔茨海默症这样的研究,提供大量的信息。当然所有的这些研究,都是建立在各种数据安全和保护的规范上面,比如说我们现在虽然国内的基因组存储还没有非常明确的规范,但参考美国临床信息系统的建设规范和欧盟的隐私保护规定,都是可以做很多好的实施和实现的策略。

  刚才高总把基因检测画了两个大的树状图,一边是临床,一边是消费。不管是临床还是消费,都有一个最根本的点,首先得测得准,得有足够的东西验证你测得准。在过去我们经常说到消费好像是很好玩的事情,不管谁都可以做消费的事情,把这个门槛降得非常低。今天门槛相对低一些,因为我们做了很多的铺垫的工作。但是另一方面从检测到最终的产出,实际上FDA是有一系列的规范。这是FDA对于个人基因组检测做的医疗器械的批准,最后批准的总结或者报告有三四十页,上面有一些关键的东西,比如说怎么去采样,采样器,就前排的嘉宾桌上可能有采样器,采样器是不是FDA批准的,保存时间会是什么样。

  由于这个产品实际上在医疗器械上面属于非处方类的基因检测,所以消费者可以自己操作。消费者操作之前会干什么事情?吃饭、嚼口香糖、抽烟、喝酒。如果大家有机会去看唾液是五颜六色的,因为各种影响。在什么样的场景下面得到的结果会有足够好的一致性?这从采样到检测平台到最后的数据产出有一系列的规范。根据FDA批准的这类产品二类医疗器械做了两千多份的验证,在不同的场景下进行采样,最终这些检测的位点,比如ApoE上面铺垫的位点是不是能够保持一致,这些实际上是有大量的工作要做。而ApoE的检测并不是很容易的事情,ApoE专业点来说在基因组方面不管是测序还是什么都很难把它测准。甚至在大规模的基因组研究项目里面,需要有专门的算法团队人员优化ApoE突变检测的算法。所以这方面我们做了很多工作去做这个事情,比如followFDA的标准。因为暂时在国内,CFDA对于一个DTC的基因检测还没有一个明确的审批的要求或者审批的先例。根据FDA的要求,用什么样的唾液采集器,用什么样的检测平台,最终你要做什么样的质量控制保持这些位点的准确性和一致性,这些有大量的工作要做。

  当然有了FDA这样的监管机构在前面不断地努力,我们可以看到像我刚才提到的通过ApoE上面e4突变的基因检测去直接向消费者提供这样的基因检测,去评估阿尔茨海默症风险的产品,已经在去年获得了FDA的批准。

  当然基因检测这个事情实际上只是一个事情的开始,我们过去几年随着信息技术的不断发展,我们把音乐、书籍,甚至大家现在点的外卖都不断数字化、信息化。刚才高总提到大量的人工智能技术开始用于医疗健康领域,而人工智能用于健康领域的一个前提是什么?前提是我们能把影像、眼底的信号变成数字化。而基因组数据实际上是人体的基础数据,如果这个基因和各种组学数据没有大量被数据化之后,人工智能很多东西在这上面施展的空间就会受到很大的限制。而基因组数据作为人体的基础数据,作为我们从父母那里得到的遗传突变,甚至是遗传给下一代的基础信息,实际上是整个生命数字的起点或者基础。

  当然我们走到今天,指数级增长的技术影响的肯定不仅仅是医学或者是生命科学,甚至在今天基因组影响的不仅仅是自然科学。比如回到开头和人民大学做的研究,研究经济收入、研究群体行为跟基因的关系,实际上已经把基因组技术从自然科学扩展到社会科学。

  简单来说基因组技术作为这个技术本身,从检测到读写这一系列过程下去,它影响的必然不仅仅是自然科学或者医学这个小范围,而是会影响所有的学科,影响到整个世界。这个世界终将会因为这些组学技术和我们的人工分子学层面去改变整个社会,带来一场新的变革。

  谢谢大家!

 

新闻排行榜

健康美图

名医有话说

大医精诚

特别推荐

品牌策划

高清视频

热门微博