智能医疗

陈一昕:人工智能在美国医疗大数据中的应用

  

 

  陈一昕,江苏扬州人,华裔计算机科学家·陈一昕博士现为美国华盛顿大学副教授,终身教授。研究领域为数据挖掘, 机器学习,优化算法 , 人工智能,云计算等。在AIJ,JAIR,TKDE,TKDD,TIST,TPDS等国际一流期刊和VLDB, AAAI, KDD, IJCAI, ICML, RTSS等国际顶级会议和上发表论文90余篇。 任数据挖掘和人工智能领域的顶级期刊JAIR, TKDE, TIST的编委,和 KDD, AAAI, IJCAI, ICDM, SDM等一流国际会议的程序委员会委员。为美国国家科学基金委,香港研究基金委,奥地利国家科学基金委,瑞士国家科学基金委的评审委员。

  首先我想介绍一下大数据的背景,然后介绍一下在大数据的背景下,尤其在美国有着怎样的一些新型的应用。第三部分我想介绍一下,我们在医疗大数据做的一些实例。最后也谈一下数据共享和个人隐私保护的一些问题。

  大数据已经上升到了一个国家战略,从奥巴马政府把大数据定义为新的石油开始,最近这几年,其实大家已经听了非常非常多关于大数据的理念,在中国也已经把医疗健康大数据上升至一个国家战略的层面,习总书记也指出,我们中国已经步入一个老龄化的社会,针对老龄化的这些工作面临着非常严峻的形式,克强总理在政府报告中也指出,大力发展移动健康医疗信息化,不仅会给广大人民带来福祉,同时也能创造新的经济增长点。

  所以我们会看到,大数据在医疗信息化的过程当中,分为这么几个阶段,从前期医疗信息化产品数据到资源的整合,到信息的整合,我们现在正在逐渐迈向一个新的阶段,当我们把这么多数据收集上来之后,如何来分析这些数据,如何让这些数据真正发挥价值,因为我既在中国,也在美国,在我的观察,如何挖掘出数据的价值,利用像机器学习,人工智能,大数据的手段来分析,建模,最终真正的给用户带来价值,这条路其实还有很远的距离要走。

  大家都知道最近谷歌开发了一款软件叫阿尔法GO,它打败了人类的冠军。在阿尔法GO背后,其实是依赖于很多技术的发展,一个是计算技术,一个是建模技术,大数据技术。在阿尔发GO背后的人工神经网络,它有几十亿的参数,这么多的参数,它就可以来学习分享复杂的模式,如何发现这个参数,其实它需要用到大量的计算。在谷歌有上千台的GPU的集群来算这些东西。

  我们自然而然问的一个问题就是,有这么好的计算资源,这么强大的计算能力,这么好的数据决挖掘技术,能不能在医疗健康领域给我们大家带来新的好处,新的福利。比如说针对癌症的治疗,针对慢性病的预警等等,能不能利用计算的守丹帮助我们的医院,医生,健康行业做的更好,这些都是有着巨大潜力的一些方向。

  这个就是我们从数据的层面来讲,通过我们收集到了很多很多数据,刚才我讲了,利用大数据的手段,其实我们可以做很多很多的事情,比如说在临床系统方面,我们可以利用大数据,其实在美国我们做大量的工作,可以对ICO,急重症的病人进行提前的预警,可以对普通病房的病人监控他的病情,可以对已经出院的病人预警他会不会再次如院,对于普通的人群,我们也可以关注他的健康状况,预测他得一些慢性病,像糖尿病等等的一些风险。对于睡眠,对于精神压力等等,都可以利用大数据的手段进行监控,进行反馈,进行预警,进行干预治疗。

  所以第二部分我想谈一谈大数据后面的新医疗有那些方向,最近我也去了美国波士顿,开了一个美国国家卫生局的大会,在会上有八十几家公司,每家公司给了一分半钟的时间发言,介绍他们公司的产品,大家排成队,所有的PPT都已经提前弄好的,每个公司讲一分半。我们就可以看到有大量的创新,在各个领域。我稍微总结一下,做了大量的创新,这些公司有的融到了B轮,C轮,D轮,有的是天使轮,有的刚刚起步,但是我觉得他们的活力让我感到非常激动,因为我看到一个百花齐放的一个局面。

  一个就是病情的监控,由于患者在院内监控的质量低,包括院外的病情追踪的缺失,所以利用大数据的手段,利用一些仪器,首先传感器等等,可以对病人进行更加时时的追踪。

  另外包括病情及时在医院内部,由于一个病人他身边可能有很多设备,每个设备自带一个很小的显示器,但是其实医生在压力非常大的工作环境下,包括护士,是没有办法对病人进行很深入的,很仔细的一项一项检查,有些公司会把信息通过整合,可视化,更加直观,动态的呈现出来。

  第二个就是提前的预警,这个也是大数据最容易发挥价值的地方,比如说我们很多病人,他在医院里面,比如说术后很容易发生白血病,感染性休克,这种发病率还是非常高。一旦发生之后,其实风险也是非常高的。但是有大量的研究表明,其实可以利用大数据,数据挖掘,人工智能的手段提前预警。当然现在已经有一些模型,可以从某种程度上预测败血病的发生,但是是非常不准确的,我们通过深度学习,就像阿尔法GO后面的人工神经网络一样,把他后面大量的,连续的时间序列的数据整合起来,包括它多维的数据,待会儿我会分享一个实例,比如说它的脉搏,血氧,血压,体温等等,多维的数据,连续的时间序列整合起来,发现新的模式,利用大规模的计算实现更加精准的提前预警。那么在临床上面也取得了非常好的效果,这只是举一个例子。像其它各个方面,比如像手术中的,有一个问题叫术中苏醒,麻醉之后仍然有1%到2%的人在术中会苏醒,这个事情就是一个可怕的事情,如何来监控,预测术中塑性,还有如何预测像肾衰,突发心脏问题等等,这些都是可以通过大数据的手段,结合时时的数据来进行预警的。

  第三,就是辅助决策,就是说在预警的基础上更进一步,如何帮助健康管理团队,帮助医生,帮助护士提供决策,采取行动,这对我们大数据的技术也提出了新的要求,要求我们不光能提前预警,知道下面有可能发生什么问题,同时能给出建议,比如血压太高了,他的血常规出现什么问题,他的呼吸系统出现什么问题,循环系统,肝脏肾脏出现什么问题,然后进行提前预警,然后干预治疗,这也是我们可以通过计算的手段发现的。

  第四就智能的管理,这个更多是在院外的情况下,这个我们也有很多创新,对于病人,尤其是慢性病潜在的患者进行智能的管理,跟踪他的身体健康状况,给予他改善的建议。

  还有好几家公司我看到了是对用药进行监控,有一家公司是直接时时记录你的用药状况,对你的用药进行反馈,并且根据你个体的一些特征,他可能对接一些体检设备,便携式的血压,血脂,血糖等等,然后根据你的用药状况根据一个综合的计算,给你提供个性化的用药建议。

  再比如说新药的研发,在这块儿也有一家公司,他通过深度学习的手段给药厂提供建议,我们知道美国开发一款药,他可能需要投资十亿美金,用好多年投一款新药,但是新药往往需要做临床实验,这个时候就需要选择,哪些人去,或者你的药的剂量如何控制,或者如何选针对性比较高的人群等等,这些东西都是可以通过大数据的手段来实现。

  另外就是护理,护理这一块儿的确我们也知道是一个刚需,尤其中国步入老龄化社会之后,比如像脑卒中患者,脑卒中的死亡,致死致残率是非常高的,那么对于病人的护理其实是一个很大的问题,一旦病人出现,对于家人朋友都带来很大的负担,如何利用信息化的手段更好的提供智能护理,这也是我看到的一个创业的方向。

  另外就是个性医疗,还有通过基因,通过等等一系列的手段,对个体提供更个性的医疗,如何用药,如何采取靶向药治疗等等,这些也有新型的公司在做这些事情。

  最后是资源分配,这个主要是在医院管理的层面上也有一些公司在做,通过大数据把医院的系统全部的收集过来,然后对医院整个的管理流程提供更先进的管理手段,我们目前也在承担着国家卫计委有关于中国的医院质量评估的相关工作,我不知道有没有人去过,去年九月份在西安的中美健康峰会,在中美健康峰会上面,我们出台了第一款中国三甲医院的一个医院质量评估的系统,这个系统就是我们在北京高精尖这个团队开发的,然后目前在二期,我们要把这些医院的系统打通,然后来把医院的质量进行监控,进行分析,进一步提高医院的运行效率和运行质量。

  刚才我分享了一些漫谈,分享一些我在美国见到的创新公司的想法。下面我介绍一下我们做的大数据医疗的实例。首先我先简单介绍一下自己,我是在美国华盛顿大学,我是一个机器学习和人工智能的专家,计算机系的教授。但是我们华盛顿大学,它的医学院是美国排名前三名的,和哈佛,约翰霍普金斯并列的三大医学院之一,所以我去了之后,跟他们很多医学院进行了很多合作,所以我在美国主要做的是医疗大数据分析这块儿。主要是能够获得我们医学院大量的真实的数据。

  从2013年开始我回国,首先在中国联通单人首席科学家做医疗大数据的研究,从2016年起,我们就到了北京高精尖创新中心,同时成立了一个公司来运作,如何把美国的医疗大数据技术落地的一些工作。所以下面我想给大家分享一下,一个是我在美国做的一些案例,另外是在中国做的一些事情。

  在美国做的就是我刚才说的临床辅助决策了。我分享的这个案例是针对普通病房的病人,我们知道有大量的病人住院,住在普通病房里面,不是ICU。普通病房美国医院里面,平均有4%到17% 的病人会突发各种恶化症状,死亡率是非常高度德国我们想做的一件事情就是,能不能利用我们大数据的分析,利用普通病房当中病人现有的数据提供一套预警系统,降低他们突发危机病症的这种概率。

  我们现在在临床上,主要美国有一套,叫mus评分系统,那是一套比较简单的,基于一些生命体征的评判体系,比如说你的血压,你的体温等等,通过一个大分析之后,对病人的危急正进行评分,如果评分超过一定的预值的话,可能会送到ICU这样一些行为。但是在大数据的时代,这一类简单规则决定的评分系统远远是不够的,首先他没有考虑到病人一个动态的发展状况。第二,它的准确度是不够高。

  所以我们的理念,我们在华盛顿大学做的项目就是让数据来说话,因为我们知道每个临床的病人,每个住院的病人,在医院里边,从入院之后都会有完整的医疗记录,包括他的生命体征,包括他做的一些实验,测试结果,用药情况我们都是有完整的数据记录的。在住院病人来讲,在美国每隔15分钟到1个小时,护士都会测量一下他的主要生命体征,比如像体温,血氧,血压等等。我们就说是,能不能让这些数据说话,通过给这些数据分析建模。所以我们做了这么一套系统,这套系统主要目的就是监测正在住院的病人,并且给他提供提前的预警。

  所以这套系统我们是一个双层的架构,在上层我们利用了他现在有关的数据,筛选出具有高危风险的人群。筛选出高危人群之后,我们会给他戴说一些时时的传感器进行第二层的预警,预测哪些病可能有更高的风险,同时进行干预治疗。

  这是我们收集的一些数据的例子,我们现在一共用了34项指标,包括它的脉搏,体温,血氧,他的呼吸等等。这边显示了五项数据,我们可以看到他之一个动态的,时时的数据流。

  这是我们总结了一下现有的,对医疗数据挖掘的一些工作。其实我们知道,在学术界一直对这种临床数据时时分析有大量的研究,其实主要可以分为两大类。一类是基于传统的,医学的这种打分评判体系,另外一类是基于更现代的,机器学习,人工智能的流派,通过对数据分析进行建模。

  我们应该说是属于右边这种,第二类,通过机器学习的方法对数据进行建模。

  具体的技术我就不讲了,我们看一下我们在美国华盛顿大学附属医院,叫巴恩斯犹太医院,也是非常大的一个医院,美国第八大医院,我们做了一个临床实验。这个为期已经有好几年了,参与病人超过五万人的这么一个临床实验,我们把病人分为实验组和对照组。实验组的病人如果收到我们的预警,就会派一个医生或者护士对他临床进行一个诊断,讨论,并且采取一定的干预手段。

  我们可以看到,通过几年观察,它的区别是非常大的。在实验组有干预预警的情况下,病人的死亡率只有8%,在没有干预预警的情况下,病人的死亡率达到27%,所以我们可以看到有人工智能手段干预之后,它的效果是非常显著的,这也可以说是人工智能技术首次在临床严格证明了对临床的疗效是有很大的帮助的。

  第二块儿我想介绍一下我们目前在国内这个团队做的一些事情,主要就是慢性病的管理。慢性病已经成为影响我们健康非常重要的一个因素。这个大家都很熟悉了,尤其在中国,我们可以看到,这些年随着环境,天气等等各方面的影响,我其实中国的一些慢性病,像脑卒中这样的慢性病增长的速度和死亡率是远远高于欧洲,日本,美国。所以我们如何来让普通人群能够关注自己的健康,评估自己的生命健康状况,同时能够提供预警,提供反馈,这个是我们想要达到的一件事情。所以我们目前这个团队就开发了一套系统,叫IntelliCare业务体系,这个业务体系其实分为四大部分,在线下,主要是一个体验小屋和一个终端。这个小屋就是传统意义上理解的健康小屋,里面可以对接各种各样的设备,目前我们已经对接了市面上主流的主要公司的设备,我们都已经对接了,包括身高,体重,血压,血脂,血糖,心肺功能,呼吸,精神压力,动脉硬化,骨密度,人体成份等等,这些我们都已经对接了。

  另外在终端层面,我们开发了APP和微信端,所有的用户可以非常直观的看到自己所有的历史记录,包括生命体征,包括我们的预警模型的反馈结果,包括我们给他的改善建议,包括用药建议等等。

  在上层,我们有一个云,这是我们打造的一个大数据云平台,所有的数据全部采集到这样的云平台,这个云平台的特点它是标准化,统一化的,任何一个用户,只要是它的用户,不管是用什么样的设备测量,他的数据都会标准化到我们统一的数据库当中进行统一的分析。比如你今天在北京,明天到深圳出差,后天到上海,你也许用的是不同的设备,只要属于我们体系里面的,你的数据都是统一的,而且是一直保留下来。

  在云端我们核心的是我的预警算法,通过我们在美国积累的技术,我们针对中国人的健康状况做了新的模型,其中主要有,一个是脑卒中的预警模型,一个是心血管疾病的模型,还有一个慢性病的模型,脑卒中这个模型我们是和北京协和医院医以及全国脑卒中防治中心王拢德院士一起承担了国家脑卒中防治的一个建模的课题,我就把美国的机器学习的技术应用到他们提供的中国的几十万人群的队列数据上面,对脑卒中进行预警。所以这就解决了一个数据冷启动的问题,当然我们的模型就像阿尔法GO一样,每天晚上要下十万盘棋提高自己。我们也是,我们每天搜集上来的新的数据,我们会滚动的对模型进行迭代,进行优化。

  另外一块儿我们对接的服务,我们服务这块儿,一个是启动一个洞察平台,对整个区域的所有用户的健康状况进行感知,包括对设备的使用状况进行感知。

  这个就是我们开发的一些模型,利用先进的大数据的手段,同时我们也打造了一个拥有120台机器集群训练我们深度学习的模型。

  这个是展示一下我们的终端,目前终端可以对接的像移动电脑,手机,ipad,包括纸质报纸都有,它会提供全景的个人健康信息。

  对于每个用户来讲,他如果打开APP的话,我们有非常好的可视化的界面,目前我们这个可视化是由我们的曹兰博士,也是国家青年计划专家从IBM团队出来的一个可视化的专家,把个人的数据通过最主观,最易理解的方式展示在我们的APP上面。

  这个是一个时时展屏,尤其适合在一些社区,比如像养老,像健康社区进行展示,如果各位感兴趣的话,其实这个展屏在外面也有,我们的公司叫犀牛科技。为什么叫犀牛科技呢?因为犀牛相当于独角兽的意思,大家如果感兴趣可以在外面展台上看一下我们时时展屏。

  这个时时展屏,一是可以展示,通过非常直观的方式展示每个人的健康状况,同时提供预警。左下角这个展屏,我们会对你每一项指标进行一个深度的解读,同时会提出你的健康管理改善的建议。目前我们也在和一些医疗机构合作,比如像一些养生,营养,中医药的一些机构合作,提供线下的医疗改善的服务。右下角我们还有一个全国的,时时的整体展示中心,主要给机构管理者提供分析和判读能力。

  我们可以再仔细看一下,对每一个用户而言,如果进入我们的体系的话,这个是他个人的整体的健康状况的展示,我们看到左侧这个其实是一个我们的真实用户,我们在全国已经布了几十个点,这是一个真实用户,我们做了匿名化的处理,我们可以看到它的各项指标,像血糖,骨密度,心血管,人体成份,精神压力,等等都进行了一个展示。右边是对他的健康进行一个评估,比如你点一下血压,我们就会对他的血压状况做一个解读,右下角通过一种多纬图的方式对他的健康整体状况做一个评估。

  这个其实也是,在APP上面也可以展示,在大屏上展示,对这个人各项指标更细化的,精确的解读,包括他的每一项指标,我们都用颜色代表正常,预警,不正常,另外对于他的人体成份,大家可以看到他的体形是属于正常型还是胖型,另外就是精神压力。

  左下角我们看到的是他的历史记录,我们有一个综合评分系统,就是对他的整体健康状况做一个综合评分。我们可以看到,这位先生他的健康状况在最近五次评估当中是逐步改善的,另外我们还对他有哪些风险如何改善,提供一些文字性的建议。

  这个是我们目前的一个洞察平台的状况,对于我们整个体系在全国的部署以及用户使用状况做了一个综合的分析,同时我们可以看到,在全中国人群的一个健康分布的状况,包括有糖尿病,脑卒中,高血压等等风险的人群,各个地方的分布是什么样子的。

  另外一块儿,我们做的就是,刚才说了对个体的改善。另外一块儿我们做的是它的智能洞察,就是说对于管理运营者,比如说一个社区或者一个社区的卫计委,一个社区的民政局,对于他来讲,可以分析整个社区人群的健康状况。这些我就不展开讲了,总之我们可以跟踪每一个人群,他的各项特征。包括一些年龄段的比例,每个年龄段的健康状况,高血压的比例,脑卒中的比例等等。通过一些大数据的手段对人群进行画像。

  这个是一个非常有意思的,这也是我们的曹兰博士做出来可视化的,这是一个叫做路径分析,就是分析用户对每一个检测项的顺序以及路径,我们可以看到大量的人进来,首先会分析什么样的身体状况,然后下面会分析哪一项等等,我们对路径进行一个分析,包括对于整个使用情况的分析等等。

  目前我们这套体系,我们希望把战线朝外走,其实我刚才讲了,一个是院内的创新,另外是院外慢性病的预防,其实我们认为,更重要的应该是院外,对慢性病进行防治,这也是目前很多社区的理念。所以目前我们合作的伙伴来自于好几方面,一是工会机构,像卫计委的,民政局,这样的工会机构,为社区提供健康,另外是医养小镇,包括像目前的一些华大幸福,在推的这样的很多小镇上面,可以利用我们的信息化,我们提供线上的健康管理运营的体系。另外就是养老地产,我们也知道,尤其中高端人群非常关注自己的健康,很多人去南方,像海口,海南这样的地方进行养老,在养老方面非常适合结合我们的体系,对于这些用户进行关怀,进行健康的管理。

  最后是健身中心,我们今天这个会场在亮马桥,其实在亮马桥的对面,在酒店后面就一个嘉意大厦,大家如果去的话有一个健身房,是全国第一家,叫做夜店式健身房,这个健身房是采用很多的高科技的手段进行包装,这里面就有一套我们的体系。离这里非常近,如果大家感兴趣可以去健身房实地的体验一下我们的系统。

  这是我们在全国布点之后,我们要看到效果,所以这是我们的一个应用案例,我们可以看到,每一点代表一个人,我们可以看到每个人,横坐标是测量的次数,纵坐标是他的综合健康评分,我们通过我们布的点对他做了一个相关分析和回归分析。

  我们可以看到,很明显他的健康状况和使用我们的系统的测量次数呈现一个正相关的关系。当你越多的关注自己的健康,尤其我们防灾社区里面,如果你去做体检,你可能一年只能做一次,但是我们的小屋如果放到社区里面,其实可以天天去测,所以你可以看到,只要你关注自己的健康,它和自己的健康改善是呈一个正相关的状态。

  另外是有一些实际的应用案例,我们通过用户遵从我们的改善方案,他的效果还是非常明显的。我们看到最前面这张图画一位老先生,他的脑卒中的风险非常高,一开始我们的系统预警达到了42%,我们建议他去医院做了一个诊疗,医生跟他讲,他的血管基本快要堵住了,所以这是一个非常明显的案例,我们通过一些改善的手段,可以看到运动,饮食等等,最终他的风险降到只有百分之二十几,也就是说我们可以通过反馈的手段实实在在改善个人的健康状况。

  最后我简单讲一下数据安全与隐私的问题,因为这也是大家非常关心的,尤其是我们有一些客户在一个养老地产,都是高端客户,他有自己的私人医生,他非常注重自己的隐私,我们如何保证我们的数据云能保护他们的隐私,包括他们的私人医生的姓名也不愿意让别人知道。这些我们其实也是在数据安全方面做了大量的工作,采用了这种,将业务与数据分离的这种这样一种新型的网络结构,包括我们数据的安全性,另外是我们数据传输的安全性以及我们采用匿名化的手段对用户的隐私提供保护。这些我们就已经形成了一套非常成熟的方案。

  这各是我在美国做的一项技术,我们叫哈斯帕技术,这其实是两大医院,一个是美国华盛顿大学医院,还有一个是美国纽约的癌症中心,他们想合作一个项目,进行对癌症的建模,但是双方都不愿意把自己的院士数据拿出来共享。怎么办呢?我们就提出了一种新兴的架构,也就是在中间做一个datalib,双方把数据拿处理进行加密,放到这个里面去,然后大家的数据综合到一起进行建模,建模之后这个模型沉淀下来,原始数据可以撤走,最终沉淀下来的就是这个模型,也就是说我们可以把数据的价值挖掘出来,但是不会泄露原始数据的隐私,所以通过这样一套架构,我们可以实现对于个人隐私的保护。如果大家感兴趣的话,可以线下我们再交流,整个这套体系的架构。

  今天我就分享到这里,谢谢大家。

» 本文关键词: 美国智能医疗 人工智能

相关阅读

勤联智慧医疗:AI Doctor

2018-05-24

为数据存储护航 东芝助力“智慧医疗”

2018-05-31

智慧医疗未来发展如何?

2018-06-08

云小宝--智能医疗机器人

2018-06-23