「一定是恢复健康的人。」


「这位同学真是正能量满满,不过在数量级上,离正确答案还差得很远呐。」


「那一定是病历!」


「听起来,这个回答似乎充满了怨气。中国医生苦于写病历久矣,看来是真的。不过恭喜你,就其实质而言,已经非常接近正确答案了。」


那么,最终的正确答案究竟是什么呢?


作为读者的你,看到这里也许已经猜出来了。是的,一个医院每年产生最多的,且最重要的,是数据。


 

数据,开创新的医学模式

在 1997 年上映的高分科幻大片《千钧一发》中,除了有伊桑·霍克与裘德·洛的精彩演绎外,很多看过的人或许还记得这样一个画面:


婴儿才呱呱坠地,在旁的护士就从一台医疗机器里拿出一份体检报告单。上面逐条列出了这名婴儿的一生中罹患各种疾病的风险和患病几率,甚至详细到有预期死亡年龄。


虽然这部影片所展现的场景至今仍未照进现实,但拜人类基因组计划(简称 HGP)所开启的数据之门所赐,我们已经能够看到这一幕最终落地的曙光。


2001 年,人类基因组草图发表,这既是 HGP 成功完成的标志,同时也意味着医学数据爆炸式涌现的导火索已被点燃。这项计划不但令人类对自身和疾病有了更深刻的认识,而且还进一步催生出后续一系列组学的研究。另外,基因测序技术也因此得到极大发展。


彼时,HGP 共耗资 30 亿美元,而今,一个全基因组测序费用已经降低至接近 1000 美元,预计到 2030 年,这一数字有可能低于 100 美元。



临床需求与技术成熟两厢叠加,促使美国国立卫生研究院于 2015 年启动精准医疗队列研究,计划入组 100 万 18 岁以上的志愿者参与该项研究,最终将精准医疗的理念引入到临床实践与科研中。世界主要国家纷纷跟进这一理念,试图将其尽早推进至临床。


 

人的一生,产生多少数据量?

相比现有的以标准化诊疗为主要特征的医学范式,精准医学更加强调个体化诊疗,更重视疾病的预测、早期筛查和预防。显而易见,精准医学的优势明显,给患者带来的益处也更多。


不过,为了实现这一愿景,需要分析包括遗传、生活方式、环境等在内的数据,用以评估个体患病的种类与可能性,并对高风险疾病进行筛查和干预。


这一切,都有赖于大量数据的支持,可以说,数据是精准医学的「基础设施」。



而再对此细分就会发现,临床数据、基因数据和行为数据构成了精准医学的三大基础数据。


其中电子病历和影像数据是临床数据的主要内容,平均而言,每个人一生积累的临床数据约合 0.4TB。近年来,随着医院业务的数字化升级以及高分辨率 CT 和核磁影像设备的广泛应用,加上手术示教、远程医疗、术中造影等动态影像技术的引入,使得这一数字正在逐年快速走高。


基因数据来自个体基因测序和分析。就目前的技术手段进行估算,完成一个人的全基因组测序,原始数据往往可以达到 1TB。加之医生还要对患者的基因序列与公开数据集和私有生物样本库进行对比分析,会产生大量的中间数据。预计每个人的基因数据将有 6TB 之多。


这三类数据中,行为数据最为庞大,涵盖面也最广,涉及运动、饮食、睡眠、社交乃至个人经济状况。随着可穿戴设备和移动互联设备的广泛应用,这些利用传统设备无法顺利采集到的数据开始呈现出暴发性增长的态势。


保守估计,一个人在其一生中,能积累超过 1000TB 的此类数据。


 

数据存储、分析和解读是核心能力

医疗数据数量的爆炸式增长既为精准医学的付诸实用创造了条件,同时也在某种程度上造成了「过载」现象。



具体而言,后者主要表现在数据的存储、计算和传输等基础计算机技术领域。仅以临床数据中最为常见的影像数据为例,中国的一家三甲医院平均每年积累的数据量有 50TB 之多。


单为保障这类数据的存储与访问就令许多医院信息中心的主任头疼不已,遑论更大体量的基因数据和行为数据。


如何实现高效的数据分析和对比?如何使不同大型数据集更加高效集成?如何实现数据的快速检索和存储?如何提高计算平台的可扩展性?如何边界安装部署,降低日常维护成本?如何应对海量数据的访问需求,如何实现高效的数据分享并确保其安全性?


这些亟待解决的需求不但减缓了精准医学进入临床的步伐,同时也对医院和研究机构的计算机性能和基础架构提出了重重挑战。


为此,在计算技术领域拥有经年积累和诸多优势的英特尔提出「2020 年,一天完成基因数据的采集、分析和解读」的「All in One Day」的目标。


为了实现这一目标,英特尔正在持续为产业界合作伙伴提供创新产品与技术,并与合作伙伴齐心协力实现计算能力的发掘与释放。


 

数据处理的利刃

英特尔®至强®处理器与至强融核®处理器以其高效、稳定的并行计算能力和数据处理能力,正成为生命科学研究、药物研发创新以及健康和临床转化等提供数据分析和测试的有效工具。


可支持高速、低延迟数据传输能力的英特尔® Omni Path Fabric 互连技术,有助于大幅提升网络通信效率的英特尔 10 GbE 和 40 GbE 万兆以太网技术,能够显著加速数据访问效率的英特尔®固态硬盘和的英特尔®企业版 Lustre 分布式文件系统等软硬件产品线,与至强处理器®与至强融核®处理器协作,在相关应用软件代码实现优化的基础上,能够在精准医疗各个环节上大数据的计算、数据存储和传输发挥更大作用。


此外,精准医疗宏大愿景的实现还有赖于系统级的技术创新,即依托于数据中心技术,构建针对精准医疗的大规模、高效、经济的云计算平台。而英特尔在存储、网络及系统等各方面的关键技术和产品可以有效提升云平台的功能与性能指标。



在当下,海量的精准医学数据正向我们呼啸而来。这些数据如同未经雕琢的璞玉,只有经过医学技术与计算技术的切磋与琢磨,才能呈现出本真的璀璨色彩。作为数据巨擘,英特尔愿同合作伙伴携起手来,让数据驱动创新,让未来并不遥远。

(下载iPhone或Android应用“经理人分享”,一个只为职业精英人群提供优质知识服务的分享平台。不做单纯的资讯推送,致力于成为你的私人智库。)

作者:佚名
来源:丁香园