首页 / 案例

客户背景

目前,大数据技术最具实际意义的应用在于健康档案数据的管理和服务。“健康档案是个人全生命周期的医疗 / 健康数据的管理”。 例如,对于慢性病患者,以往病程的变化,治疗的过程都对医生诊断和处置有着重要的辅助作用。过敏史、不良反应等这些数据对避免出现医疗差错和事故也有着积极的作用。传统的临床科研往往基于抽样调查进行,精准度欠缺。而随着健康档案数据的丰富,工作量大幅减轻,科研数据的质量、数量以及数据处理效率得以提高。

问题与需求

数据量庞大。区域卫生数据中心以城市为单位,将存储健康档案、电子病历、卫生管理三大数据库,作为300万人口的中等规模城市,其卫生数据中心的规模在20年后预计会达到PB级。传统关系型数据在大数据存储实现中存在局限性,在一张表中存储500GB之上的数据时性能跟不上要求。

数据类型复杂多变。区域卫生数据中心,将会存储大量的非结构化数据和半结构化数据。如果采用传统关系型数据库,则面临众多不易解决的问题:PACS影像、B超、病理分析等业务产生的非结构化数据大小不一,从数百KB到数百MB都有,病人的一次诊断活动就需要存储、调阅数百张影像数据;由于医疗卫生业务的复杂性,很难制定统一的数据标准,这就给数据访问和交换带来新的挑战。

未来的数据处理也面临巨大挑战,譬如未来海量数据的存储、备份、扩容、快速的检索特定数据,以及高效的数据交换。

TDH方案的实施效果

海量数据存储。应对超过一亿条记录(文档)的存储需求。

数据格式动态扩展。Hbase提供的列式存储方式,可以轻松应对数据格式的灵活调整。

海量数据快速检索。高并发的并行海量数据检索,满足居民和医生实时检索健康档案的需求。

统计分析。开放的统计分析框架,接近实时的统计分析能力。

平滑扩容。横向扩展性能卓越,应对未来业务和数据量的不断增长。

快速检索。医生可以快速检索患者的个人基本信息、既有病史、就诊及处方等重要信息,从而帮助医生做出更准确的诊断,并有效避免重复用药、药物不良反应等问题。