云彩店邀请码|半壳|优胜
空间数据发掘是对空间数据中的隐含常识、空间联系机动索取的接洽本领。空间数据既不妨是点、线、面等空间实业数据,又不妨是具备地舆场所和属性特性的空间东西,数据典型稠密,使得简单的空间数据发掘本领难以满意本质运用需要。而且数据量宏大,使得空间数据发掘极为耗费时间,不许灵验地满意当时效性需要。罕见的空间数据发掘本领囊括统计领会本领、聚类领会本领、空间领会本领、计划好多本领等。计划好多中的Voronoi图本领能较好地表白空间实业的临近联系,不妨处置点、线、面等空间实业数据发掘题目。而暂时线、面等搀杂实业目的的加权Voronoi图接洽较少且功效较低,所以针当面元目的的加权Voronoi图接洽具备要害价格。空间聚类本领是常用的空间数据发掘本领,更加是K-Means空间聚类本领,不妨处置具备地舆场所和属性特性的空间东西。但跟着消息化社会的兴盛,空间数据呈爆裂式的延长,而串行算法计划功效不高,难以处置洪量空间数据。基于Hadoop在处置大范围洪量数据上的上风,正文当面元加权Voronoi图和K-Means空间聚类算法举行了MapReduce并行化安排,重要的处事功效归纳如次:(1) 对Hadoop关系本领举行了阐明,领会了散布式文献体例HDFS的处事体制和MapReduce的实行过程,为后续算法安排供给了表面按照。(2) 对准具备较为搀杂拓扑构造的面状空间数据,贯串面元边境索取思维,矫正了面元加权Voronoi图算法,并在Hadoop平台上实行了其并行化。并运用面元加权Voronoi图来处置空间数据发掘中的空间目的感化范畴界定题目。(3) 对准具备地舆场所和属性特性双重含意的空间数据,安排实行了鉴于Hadoop的K-Means空间聚类的并行化算法,并以新浪微博用户数据为例举行用户聚类,考证了算法的灵验性和可行性。实行了鉴于Google Map的聚类可视化。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/217163.html
本站部分内容来源网络如有侵权请联系删除