笔趣阁

手机浏览器扫描二维码访问

第二节 核心技术(第2页)

2.大数据处理技术

针对不同数据类型及应用要求,大数据需要不同的处理技术。例如:在医疗领域,有对时效性要求不高的居民诊疗和健康管理数据,也有高流量的医院信息系统日志,也有可以实现医保诈骗分析的实时数据。

针对这些数据就可以分别采用图5-1所示的大数据处理层的批量计算、流计算和实时计算技术来处理:

(1)批量计算:

2004年谷歌公司提出的MapReduce以及目前最流行的HadoopMapReduce是最具代表性的批量处理模式。

(2)分布式流处理技术:

分布式流处理是主要适用于日志类流数据处理的技术。

(3)实时计算处理技术:

实时计算最重要的一个需求是能够实时响应计算结果,一般要求为秒级。

3.大数据整合技术

目前国际主流做法是基于HL7和IHE等标准进行医疗大数据共享整合。其中,HL7基于消息的交换,实现医疗信息系统或医疗机构之间的信息共享和系统协同;基于文档的交换和整合,实现电子病历和健康档案。IHE定义为在医疗信息系统之间进行信息共享和系统协同的流程规范和数据格式。

4.大数据挖掘技术

大数据时代下的信息具有体量大、复杂性高、更新速度快的特点,从具有如此复杂特性的信息中挖掘出用户所需的情报,难度较以往有了很大的提升,需要对传统的数据分析与挖掘技术进行改进。

(1)数据挖掘算法:

常用的数据挖掘算法主要有关联规则算法、分类算法和聚类算法等,这些数据挖掘算法的分类及其在医疗领域的应用示例见表5-1。

表5-1常用的数据挖掘算法

(2)数据挖掘工具集:

目前,大数据的数据挖掘工具集主要有R语言体系、机器学习体系和挖掘开发包等,这些工具包对一些数据挖掘算法分别进行了并行化改进。

(3)文本挖掘算法:

在医疗大数据领域,文本挖掘算法是一项非常重要的技术。医疗数据包括各种结构化、非结构化和半结构化的数据。要想对这些海量数据进行有效的处理,必须先对非结构化和半结构化的数据进行处理,使其能够被系统快速地识别和应用。

医疗领域面临的非结构化和结构化数据主要包括:医生医嘱、出院小结和各种描述性质的分析报告。针对这些数据,首先需要进行分词,之后再利用医学领域的知识库对分词结果进行概念的识别,最终形成一个机器可读的数据。在这个过程中,所用的技术包括中文分词、文本挖掘和语义分析。

热门小说推荐
都市神农医仙

都市神农医仙

苏南是神农医术传承者,为给师父还人情下山成为江南省一个小诊所的医生。他惩恶扬善,医者救人。都市生活精彩缤纷,泼辣老板娘,富商千金,校花白领各色美女蜂拥而至,从此过上一边医者仁心,一边逍遥自在的幸福生活。...

末世庄园主

末世庄园主

天降末世庄园系统!随之而来的还有该死的穿越和恐怖的病毒。变异人和丧尸,变异兽和丧尸兽,天生的对立,无尽的战斗。当然对于庄伦来说,最重要的还是要快乐地活下去,如果要是能有两个漂亮妹纸啪啪啪就更好了。...

腹黑首席爱妻如命

腹黑首席爱妻如命

男神说,我颜值爆表,IQ150,至于学历嘛我的智商已经说明了一切,我的一切都是你,任你挥霍,嫁给我生个宝宝基因爆表,要不要考虑嫁给我?如此自恋的话说得一本正经,她终于忍不可忍,一言不合就动手和男神干了一架,她说,你哪来的自信以为我会嫁给你?男神一步步算计,设下圈套让她钻,迷糊小白兔成功入套,婚后闯下大祸,简木言说,男神我闯祸了。男神百般宠溺任凭你把Z市闹得天翻地覆,我护你周全。等她爱上他,才得知真相,原来步步为营让她成为他的妻子,只是为了当初的一个承诺!她怒!!没有爱情的婚姻她不愿将就,一纸离婚协议却牵出了爱恨纠葛...

天师上位记

天师上位记

卫瑶卿一睁眼,就从张家的掌上明珠变成了一位因为未婚夫太过出色而被嫌弃的平凡少女放个书友群号215715120,欢迎大家进群玩耍...

我的老婆是女帝

我的老婆是女帝

叶火被校花拉进小树林表白了,原本是可喜可贺的事情,但叶火却高兴不起来,因为校花说她是从仙界重生回来的龙华女帝,还拉叶火去摸她肚子上的龙纹身...

神医狂妃:妖孽王爷惹不起

神医狂妃:妖孽王爷惹不起

神医狂妃妖孽王爷惹不起她,当代的医学鬼才,成了古代的落魄千金。还是个爹死娘死,弟弟被贩卖,自己又被追杀的千金?靠,她傅灼灼的人生岂能活的这么惨!一根银针,一身医术,她行医制药,救美男,替爹娘报仇!拿她该拿的,要她该要的!至于那些害她欺她惹她的人,便要他们付出应有的代价!...

每日热搜小说推荐