云彩店邀请码|半壳|优胜
在数据发掘中运用取样本领,不妨明显普及数据发掘工作的功效。关系准则发掘是数据发掘范围中最要害的接洽目标之一,所以接洽鉴于取样战略的关系准则发掘是很有意旨的。本舆论经过接洽关系准则发掘工作的特性,领会百般取样本领及其特性,决定了表白原始数据集与其样品数据集在关系准则发掘工作中分别特性的目标,即用缩小了非一再一项集感化的一项集扶助度之间的分别来表白。本舆论提出了一种鉴于取样本领的关系准则发掘算法HAS(High Accuracy Sampling-Based)关系准则发掘算法,该算法沿用了以原始数据集与其样品数据集在关系准则发掘工作中分别特性目标为按照的二阶段取样本领。HAS关系准则发掘算法在一个不妨更精确代办总体特性的样品上实行发掘工作,进而在保护功效的同声普及了发掘截止的精确性。接着,本舆论还接洽了在增量情景鉴于取样战略的关系准则发掘算法,并提出了HASI关系准则发掘算法。结果对HAS关系准则发掘算法举行了实行,并沿用SQL Server在线领会效劳自带的数据库foodMart2000举行了试验,在各别取样比例情景下对数据运转HAS关系准则发掘算法,对算法举行了考证。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/277353.html
本站部分内容来源网络如有侵权请联系删除