笔趣阁

手机浏览器扫描二维码访问

第二节 核心技术(第2页)

2.大数据处理技术

针对不同数据类型及应用要求,大数据需要不同的处理技术。例如:在医疗领域,有对时效性要求不高的居民诊疗和健康管理数据,也有高流量的医院信息系统日志,也有可以实现医保诈骗分析的实时数据。

针对这些数据就可以分别采用图5-1所示的大数据处理层的批量计算、流计算和实时计算技术来处理:

(1)批量计算:

2004年谷歌公司提出的MapReduce以及目前最流行的HadoopMapReduce是最具代表性的批量处理模式。

(2)分布式流处理技术:

分布式流处理是主要适用于日志类流数据处理的技术。

(3)实时计算处理技术:

实时计算最重要的一个需求是能够实时响应计算结果,一般要求为秒级。

3.大数据整合技术

目前国际主流做法是基于HL7和IHE等标准进行医疗大数据共享整合。其中,HL7基于消息的交换,实现医疗信息系统或医疗机构之间的信息共享和系统协同;基于文档的交换和整合,实现电子病历和健康档案。IHE定义为在医疗信息系统之间进行信息共享和系统协同的流程规范和数据格式。

4.大数据挖掘技术

大数据时代下的信息具有体量大、复杂性高、更新速度快的特点,从具有如此复杂特性的信息中挖掘出用户所需的情报,难度较以往有了很大的提升,需要对传统的数据分析与挖掘技术进行改进。

(1)数据挖掘算法:

常用的数据挖掘算法主要有关联规则算法、分类算法和聚类算法等,这些数据挖掘算法的分类及其在医疗领域的应用示例见表5-1。

表5-1常用的数据挖掘算法

(2)数据挖掘工具集:

目前,大数据的数据挖掘工具集主要有R语言体系、机器学习体系和挖掘开发包等,这些工具包对一些数据挖掘算法分别进行了并行化改进。

(3)文本挖掘算法:

在医疗大数据领域,文本挖掘算法是一项非常重要的技术。医疗数据包括各种结构化、非结构化和半结构化的数据。要想对这些海量数据进行有效的处理,必须先对非结构化和半结构化的数据进行处理,使其能够被系统快速地识别和应用。

医疗领域面临的非结构化和结构化数据主要包括:医生医嘱、出院小结和各种描述性质的分析报告。针对这些数据,首先需要进行分词,之后再利用医学领域的知识库对分词结果进行概念的识别,最终形成一个机器可读的数据。在这个过程中,所用的技术包括中文分词、文本挖掘和语义分析。

热门小说推荐
起灵师

起灵师

人死入土,方得超脱。然而入土之前,入殓进棺却更加重要,稍有差池,即便是寿终正寝也会被弄得怨气冲天。我,是一个起灵师。人死入轮回,一切便从我开始。...

神医我丑到灵魂深处

神医我丑到灵魂深处

小农民混花都!会符篆!会咒语!会医术!会一切!透视咒!隐身咒!定身咒!穿墙咒!撒豆成兵!纸人术!...

我的倾城大小姐

我的倾城大小姐

因为怒揍变态教授,他被迫弃学卖烧烤,却接连邂逅冷艳女总裁,纯情富家女,更有前女友苦苦等候感情的漩涡中,他该何去何从?...

最强狂婿

最强狂婿

最强狂婿十年前,他被迫逃出豪门世家,从此颠沛流离,惶惶如蝼蚁,人尽可欺。直到那一天,他拨通了那个熟悉又陌生的号码。你若执我之手,我必许你万丈荣光...

桃源小神医

桃源小神医

为了逃脱寡妇周丽的算计,受尽欺辱的乡村穷小子王昊,机缘巧合逆袭成了一个医术超群的神医,他救死扶伤,带领村民勤劳致富,引得校花找上门...

每日热搜小说推荐