手机浏览器扫描二维码访问
对照图5-1的数据管理和处理体系,关系型数据库属于结构化数据库,NoSQL数据库和实时数据库属于其中的灵活存储范畴。
医疗大数据并不能采用单一的存储方式,而是需要根据数据特点及应用的需要综合运用关系型数据库、NoSQL数据库、实时数据库、分布式文件存储等多种存储技术。
2.大数据处理技术
针对不同数据类型及应用要求,大数据需要不同的处理技术。
例如:在医疗领域,有对时效性要求不高的居民诊疗和健康管理数据,也有高流量的医院信息系统日志,也有可以实现医保诈骗分析的实时数据。
针对这些数据就可以分别采用图5-1所示的大数据处理层的批量计算、流计算和实时计算技术来处理:
(1)批量计算:
2004年谷歌公司提出的MapReduce以及目前最流行的HadoopMapReduce是最具代表性的批量处理模式。
(2)分布式流处理技术:
分布式流处理是主要适用于日志类流数据处理的技术。
(3)实时计算处理技术:
实时计算最重要的一个需求是能够实时响应计算结果,一般要求为秒级。
3.大数据整合技术
目前国际主流做法是基于HL7和IHE等标准进行医疗大数据共享整合。
其中,HL7基于消息的交换,实现医疗信息系统或医疗机构之间的信息共享和系统协同;基于文档的交换和整合,实现电子病历和健康档案。
IHE定义为在医疗信息系统之间进行信息共享和系统协同的流程规范和数据格式。
4.大数据挖掘技术
大数据时代下的信息具有体量大、复杂性高、更新速度快的特点,从具有如此复杂特性的信息中挖掘出用户所需的情报,难度较以往有了很大的提升,需要对传统的数据分析与挖掘技术进行改进。
(1)数据挖掘算法:
常用的数据挖掘算法主要有关联规则算法、分类算法和聚类算法等,这些数据挖掘算法的分类及其在医疗领域的应用示例见表5-1。
表5-1常用的数据挖掘算法
(2)数据挖掘工具集:
目前,大数据的数据挖掘工具集主要有R语言体系、机器学习体系和挖掘开发包等,这些工具包对一些数据挖掘算法分别进行了并行化改进。
(3)文本挖掘算法:
在医疗大数据领域,文本挖掘算法是一项非常重要的技术。
医疗数据包括各种结构化、非结构化和半结构化的数据。
要想对这些海量数据进行有效的处理,必须先对非结构化和半结构化的数据进行处理,使其能够被系统快速地识别和应用。
医疗领域面临的非结构化和结构化数据主要包括:医生医嘱、出院小结和各种描述性质的分析报告。
针对这些数据,首先需要进行分词,之后再利用医学领域的知识库对分词结果进行概念的识别,最终形成一个机器可读的数据。
在这个过程中,所用的技术包括中文分词、文本挖掘和语义分析。
重回校园读书?不,泡妞才是王道!可爱小萝莉迷人校花富家千金人气女明星不请自来粉色漩涡之中,暧昧勾人欲,波涛晃人眼,陈华遥该如何是好?苟且是君子,到手是好汉,且看极品学生的猥琐勾女传说。本站为书迷更新极品学生最新章节,查看张君宝所撰都市言情极品学生的最新章节免费在线阅读。...
他们毕业于史莱克学院,是被长辈老师喜爱的孩子。他们被世人称为史莱克七怪,是同辈甚至长辈羡慕的天才。他们一同升入神界,七人一同在神界生活千年。原本平凡无聊的日子被神王打破。他们终于回到了斗罗大陆。可是神界之外,真的没有让他们而恐惧的对手吗。唐三,真的仅仅是唐三而已吗。...
人生沉浮,似乎懒散永伴身旁,那是不是因为还没有遇到那个让你成长的人或是事?一个生活在怪异世界的少年,一个现代科技与野性融合的社会。彼方生活的常人,似乎与此间现实的人们没什么过多的区别,但危机已经笼罩住了这个看似和平的世界。成长成独当一面似乎只能是必然的选择,而那成长路上的也许还都是未知。...
绝世高手,隐匿都市,化身大学老师,体验红尘生活,没事教训下痞子流氓,和美女畅谈人生,直到那个人出现,一切都变了...
当年盘古大神在混沌中游历时曾经收了十二颗诸天定海珠,后来给了十二祖巫,成为了他们掌控十二系本源能量的源珠。但是数千万年后,这些源珠全部流失到了那个魔法空间的最下层上,不过却无人能够真正发挥出它们的作用来。黄天玄走了大运,被雷劈后居然得到了从那个世界里穿越过来的两颗源珠,还得到了那个世界修练魔武技能的功法,从此走上了不同的人生道路...
岳母滚,现在就给我滚,你配不上我苏家。叶天是一名上门女婿,从小卑微被人冷眼。直到有一天,他获得神秘传承。岳母以前都是我的错,求求你留下吧...