菜单总览
新闻

讲座回顾——AI应用于大规模分布式医疗健康数据

  • 2020.09.16
  • 新闻
9月9日,爱丁堡大学副校长、理工学院理工学院主任David Robertson教授带来主题为“AI应用于大规模分布式医疗健康数据”的直播讲座,以下为讲座回顾。

        9月9日,爱丁堡大学副校长、应用逻辑学讲席教授 David Robertson 带来“AI 应用于大规模分布式医疗健康数据”的主题报告,AIRS 执行院长李世鹏院士担任主持。

        Robertson 教授的报告主要介绍了如何建立一个可信赖的、国际联合的、持久的数据基础设施架构以支持对新冠病毒等全球大流行病的快速响应,达到联合全世界的医疗机构,生物以及健康研究机构的数据,并用于减少大流行病的危害,造福全世界的人。

        首先,Robertson 教授介绍了 HDR-UK ,英国健康数据研究院,这个英国最大的数据研究院的使命,以及其下的众多分院。研究院的未来期望就是拿到所有6千6百万英国人的各种健康数据,以及个人终身的数据汇总。在技术角度上这是一个非常庞大且具有挑战性的任务。

        关于这个数据基础设施架构,Robertson 教授介绍了医疗数据的整体框架,包括各个分院的数据收集,数据创新中心对数据的整理,以及本报告将会重点介绍的内容:数据的基础设施价格的搭建,用户的数据在这里是得到了很好的个人保护。

        介绍完 HDR-UK 后,Robertson 教授介绍了医疗数据行业的难点和挑战。整体框架中,数据通常来自不同的种类,把这些不同种类的数据映射回本体,并用于医疗判断的依据。这里面每个层面都有很多挑战例如:1)个人是否有意愿给出数据,2)不准确的数据测量,3)相关实验的协议是环境依赖的,很难通用,4)由于之前的种种问题,数据给出的结论很难让人信服,或者需要收集大量数据而造成延误。

        之后,Robertson 教授解释了数据来源的复杂性,以及数据的易被干扰性。一个简单的例子就是在原始图片中加入对抗噪声,一个良性的皮肤癌,就会被诊断成恶性。也举了一个例子,如果需要正确诊断一个不常见的病种,需要多少的采样人数,对于一些少见的疾病,则需要全世界的合作。

        对于这些数据处理,需要复杂的联邦知识。Robertson 教授给大家介绍了数据架构的框架,一个创新型的推理系统。这个框架的数据来源是各个中心实验室的数据库,利用本体映射的方式生成知识图谱,利用推理和连续性整理了一下知识图谱,这个操作非常有帮助。之后用户需要调用数据,是直接访问知识图谱而不是原始数据,这个架构的目的不是做具体的数据实验,而是针对复杂的海量数据实验提供帮助。

        Robertson 教授介绍了当前数据实验中的请求的一些困难,数据请求是单一独立进行,通过非正式协议(数据库的数据都是基于正式协议制定的 ),审批也是单一独立进行,实验时需要全程对数据监控,而且在数据处理中,从一个信任的环境中拿出数据是比较困难的。

        在这里,通过正式协议来做数据实验会更加方便以及高效,Robertson 教授给大家介绍了一个正式协议的例子。

        基于正式协议,新的数据实验流程可以变为以下的新形式。因为所有的请求流程都是通过正式协议,其中数据安全,隐私都得到了保护。数据监控就不需要,整个流程可以自动化进行。这个方法在其他行业已经早已应用,只是刚刚在医疗行业使用。

        接下来,Robertson 教授用了人的例子解释如何利用自动化去减轻对中心化环境的依赖,一个可以信赖的本地网络,减少对可信赖的中心化第三方机构的依赖。同样的方法也应用在了这个数据中心的请求方式上面。基于这个方法,本体映射的形式也发生了改变。

        介绍完自动化去中心化思想后,Robertson 教授也介绍了一个通过排序提高协议交互质量的办法,并用会议预定作为例子,一个好的协议能有效提高交互质量。

        最后,Robertson 教授对这次报告做了一个全面的总结,并回答网上研究人员关于在医院分布式数据的问题。

视频回顾