这是一个大数据的时代。但相比之下,生物医学大数据分散在各个研究机构中,而且被特意地隔离起来,目的是为了保护患者隐私。连接这些分散的数据,既有技术方面的挑战,也有社会方面的挑战。只有解决好这两个问题,才能使生物医学大数据对医疗保健行业的作用发挥充分。
获得大数据可能会使医生和研究人员验证新的假设,并确认那些可能遭受干预的领域。例如,通过从不同地区的商店所获得的杂货购买模式,能否预测出公共卫生数据库中肥胖症和2型糖尿病的患病率?患者的网友在多大程度上能够影响他们对生活方式的选择和对医学治疗的依从?这些相互关联的推断是否真正地存在于大数据中,我们还不得而知。然而,将数据连接到具体患者的层面上来,是探索这些可能性的先决条件。
在有效利用生物医学大数据方面,首要的挑战是要确定卫生保健信息的潜在来源是什么,以及确定将这些数据连接起来之后所带来的价值如何。将数据集从不同的方面进行条理化,大数据便有可能提供解决问题的潜在方案。
一些大数据,如电子健康记录,包括患者接受诊断时的图片、诊断记录等多种资料,其他大数据,如保险理赔数据,同样可以了解患者在一段时间内、在某个狭窄的疾病类型范围内所经历的病史。当数据有助于填补空白时,这些大数据才会增值。
只有清楚这些,才能更容易地明白如何融入卫生保健系统之外非传统来源的生物医学数据。尽管数据的质量有所不同,但社会媒体、信用卡购物、人口普查记录以及大量其他类型的数据,都会有助于收集一个患者的历史资料,特别是有助于揭示可能对健康产生影响的社会因素和环境因素。
(来源:JAMA online)