云彩店邀请码|半壳|优胜
消息与通信本领正在以空前绝后、超乎生人设想的速率兴盛。互联搜集,更加是大范围互联搜集,囊括仍旧产生洪量范围的因特网、万维网(World Wide Web)、百般P2P搜集,再有正在飞快延长的传感网、卫星搜集、RFID本领所产生的物联网彼此融洽,产生了一种新的搜集空间样式。在这种新的搜集空间情况下,数据处置面对着新的宏大挑拨:第一,数据强衍化性。在大范围互联搜集情况下,比方web2.0中,数据在所有搜集中赶快传输与变换,使得数据,以至数据形式连接地赶快衍化。第二,莫大异构与自制性。在大范围互联搜集情况下,数据跟着搜集的散布式特性,爆发莫大异构与自制性。比方P2P搜集中数据处置以及部分数据处置等。第三,多档次数据不决定性。在大范围互联搜集情况下,不管是消息搜集和获得(比方传感搜集的消息搜集,深度web的消息抽取)、消息查问处置(朦胧查问、消息检索排序),仍旧消息集成与调整都须要处置数据的不决定性题目。对准那些挑拨,本舆论在归结归纳古人接洽的普通上,在数据模子和操纵的表面、本领和本领上面发展了相映的接洽,简直囊括:第一,提出鉴于文法的数据模子(Grammar based Data Model,GDM),该模子不妨一致地刻画百般模子的数据,囊括联系型数据、半构造化数据、XML数据以至构造化文书档案和图数据等。在属性文法的普通上,设置GDM的查问准则,并给出了囊括采用、投影、笛卡尔乘积、贯穿、分批、会合等的GDM汇合代数操纵,为批量数据处置奠定了普通。为情势化地刻画GDM数据操纵,鉴于一目二阶论理(Monadic Second Order Logic)设置GDM数据操纵论理,并给出GDM汇合代数操纵和GDM数据操纵论理之间的对应联系,与此同声表明生存GDM数据操纵的线性功夫算法。第二,在鉴于文法的数据模子的普通上,将Web网页情势化为GDM的数据范例,将Web网页的数据抽取情势化为GDM的形式拉拢文法的估计。经过这种情势化处置,Web数据抽取题目变化为文法估计题目。与此同声,对准GDM数据模子,提出一种可计划的左右文无干文法的估计算法,实行Web数据抽取。第三,对准数据不决定性题目,以元组依附性为中心,提出一种鉴于元组生存性的几率数据库模子。鉴于该模子,给出了采用、笛卡儿乘积和投影等几率联系代数操纵,并在接洽几率数据库查问的内在和外延语义的普通上,提出了一种安定的、灵验的几率数据查问算法。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/206285.html
本站部分内容来源网络如有侵权请联系删除