笔趣阁

手机浏览器扫描二维码访问

第二节 核心技术(第2页)

2.大数据处理技术

针对不同数据类型及应用要求,大数据需要不同的处理技术。例如:在医疗领域,有对时效性要求不高的居民诊疗和健康管理数据,也有高流量的医院信息系统日志,也有可以实现医保诈骗分析的实时数据。

针对这些数据就可以分别采用图5-1所示的大数据处理层的批量计算、流计算和实时计算技术来处理:

(1)批量计算:

2004年谷歌公司提出的MapReduce以及目前最流行的HadoopMapReduce是最具代表性的批量处理模式。

(2)分布式流处理技术:

分布式流处理是主要适用于日志类流数据处理的技术。

(3)实时计算处理技术:

实时计算最重要的一个需求是能够实时响应计算结果,一般要求为秒级。

3.大数据整合技术

目前国际主流做法是基于HL7和IHE等标准进行医疗大数据共享整合。其中,HL7基于消息的交换,实现医疗信息系统或医疗机构之间的信息共享和系统协同;基于文档的交换和整合,实现电子病历和健康档案。IHE定义为在医疗信息系统之间进行信息共享和系统协同的流程规范和数据格式。

4.大数据挖掘技术

大数据时代下的信息具有体量大、复杂性高、更新速度快的特点,从具有如此复杂特性的信息中挖掘出用户所需的情报,难度较以往有了很大的提升,需要对传统的数据分析与挖掘技术进行改进。

(1)数据挖掘算法:

常用的数据挖掘算法主要有关联规则算法、分类算法和聚类算法等,这些数据挖掘算法的分类及其在医疗领域的应用示例见表5-1。

表5-1常用的数据挖掘算法

(2)数据挖掘工具集:

目前,大数据的数据挖掘工具集主要有R语言体系、机器学习体系和挖掘开发包等,这些工具包对一些数据挖掘算法分别进行了并行化改进。

(3)文本挖掘算法:

在医疗大数据领域,文本挖掘算法是一项非常重要的技术。医疗数据包括各种结构化、非结构化和半结构化的数据。要想对这些海量数据进行有效的处理,必须先对非结构化和半结构化的数据进行处理,使其能够被系统快速地识别和应用。

医疗领域面临的非结构化和结构化数据主要包括:医生医嘱、出院小结和各种描述性质的分析报告。针对这些数据,首先需要进行分词,之后再利用医学领域的知识库对分词结果进行概念的识别,最终形成一个机器可读的数据。在这个过程中,所用的技术包括中文分词、文本挖掘和语义分析。

热门小说推荐
重生之都市弃少

重生之都市弃少

仙尊划破虚空而来,重生为都市小子! 他是叱咤风云的武道奇才,一拳震天慑地,无人敢不屈服!这一世,叶爽纵横花都,逍遥快活,仇人,恶少脚下踩!辣妞,妹子怀中抱!...

重生之我是剑皇

重生之我是剑皇

九转轮回诀,每转必见血。辱我父者,死!欺我妹者,死!毁我身者,死!吾乃剑皇,九天剑下无亡魂,尽仇恨!...

神之禁典

神之禁典

神之禁典由作者皮蛋稀饭创作全本作品该小说情节跌宕起伏扣人心弦是一本难得的情节与文笔俱佳的好书919言情小说免费提供神之禁典全文无弹窗的纯文字在线阅读。...

九天修灵

九天修灵

灵兽突袭魂位开,傲视群雄泪方弹。只待拨云见得日,与尔修灵在九天!...

每日热搜小说推荐