云彩店邀请码|半壳|优胜
跟着本领的超过和社会的兴盛,各范围内的数据库范围连接夸大,并且日益表露出大样品、多目标、时序性、含噪声等特性。具备那些特性的大范围搀杂数据集对现相关联准则发掘本领的发掘功效提出了新的挑拨。所以,怎样从含洪量噪声的大范围搀杂数据会合索取灵验消息,怎样对准大范围搀杂数据集安排高效的关系准则发掘算法,怎样普及关系准则发掘的功效和品质,便变成暂时关系准则发掘接洽中的一个中心题目。对准暂时关系准则发掘本领在发掘大范围搀杂数据集时所面对的功效题目,正文从表面模子的建立,表面本领的安排,表面模子与本领的运用与实证三个方面临大范围搀杂数据集关系准则发掘题目打开了深刻接洽,提出了一套高效的大范围搀杂数据关系准则发掘本领,具备要害的表面、实际意旨和运用价格。简直来说,本舆论的重要接洽实质和革新功效如次:。1、提出了鉴于数据简单和数据收缩思维的大范围搀杂数据关系准则发掘模子。Agrawal关系准则发掘模子在刻画大范围搀杂数据关系准则发掘进程时生存很大的控制性。本舆论在Agrawal关系准则发掘模子普通上,贯串数据简单和数据收缩思维及其本领,对Agrawal关系准则发掘模子举行了拓展,提出了鉴于数据简单和数据收缩思维的大范围搀杂数据关系准则发掘模子,为此后大范围搀杂数据集关系准则发掘接洽供给了模子框架。2、提出了三种高效的大范围搀杂数据关系准则发掘算法。(1)提出了鉴于二元联系矩阵及其演算的一再项集发掘算法(Binary Relation Matrix Frequent Itemset Mining, BRMM)对准Apriori算法在发掘大范围搀杂数据集时生存的数据构造、贯穿和剪枝战略、探求空间等上面的不及,开始将简单收缩后的工作数据库进一步收缩映照为二元联系矩阵数据构造,在此普通上,提出了一种新的剪枝和贯穿战略以及探求空间的动静收缩战略,运用二元联系矩阵数据构造和相映的优化战略,安排了鉴于二元联系矩阵及其演算的一再项集发掘算法,并经过示例和试验对算法的本能举行了领会比拟,试验截止表白,不管是在大范围稠密数据集仍旧稀疏数据集上,BRMM算法的发掘功效都要鲜明优于Apriori算法。结果为了符合更大范围关系准则发掘的须要,将BRMM算法举行了拓展,安排了鉴于二元联系矩阵及其演算的并行一再项集发掘算法(Parallel Binary Relation Matrix Frequent Itemset Mining, PBRMM),并对算法本能举行了领会。领会证明,PBRMM算法同样是一种高效的并行一再项集发掘算法。(2)提出了鉴于一再名目联系矩阵的一再项集发掘算法(Frequent Item Matrix Mining, FIMM)和相映的工作间关系准则发掘算法。对准Apriori算法和Fp-growth算法在发掘大范围稀疏和稠密数据集时各自生存的不及,提出了空间收缩功效更高、发掘功效更好的一再名目联系矩阵数据构造。在此普通上,将Apriori算法和Fp-growth算法的便宜举行结束合,提出了宽窄优先和深度优先相贯串的鉴于一再名目联系矩阵的一再项集发掘算法和相映的关系准则发掘算法。并经过示例和试验对算法的本能举行了领会比拟。试验截止表白,不管是在大范围稠密仍旧稀疏数据集上,FIMM算法的发掘功效均要鲜明优于Apriori算法和FP-growth算法,说领会FIMM算法对于各别特性的数据集具备更好的符合性。(3)提出了鉴于功夫牵制一再名目联系矩阵的一再项集发掘算法(Temporal Frequent Item Matrix Mining, TFIMM)和相映的关系准则发掘算法。 对准具备功夫牵制的工作间关系准则发掘题目,和现有工作间关系准则发掘算法E-Apriori、EH-Apriori、FITI在发掘大范围搀杂数据集时生存的不及,对一再名目联系矩阵数据构造举行了拓展,提出了功夫牵制一再名目联系矩阵数据构造。在此普通上,将宽窄优先算法和深度优先算法的便宜举行结束合,提出了鉴于功夫牵制一再名目联系矩阵的一再项集发掘算法和相映的关系准则发掘算法。并经过示例和试验对算法本能举行了领会比拟。试验截止表白,不管是在大范围稠密仍旧稀疏数据集上,TFIMM算法的发掘功效均要鲜明优于FITI算法,说领会TFIMM算法对于各别特性的数据集具备更好的符合性,是一种高效的工作间关系准则发掘算法。3、对华夏A股商场2001-2006年各行业板块间的板块关系效力举行了发掘领会采用了wind金融数据库中2001年-2006年华夏A股商场一切股票1444个买卖日的开盘价、最高价、最廉价、收盘价、拍板量、拍板额、换手率、拍板均价行情数据为初始样品点,开始按照正文提出的鉴于数据简单和数据收缩思维的关系准则发掘模子,运用中国国际信托投资公司证券二级行业作风指数和上涨或下跌幅目标对初始数据举行了简单和收缩处置,在此普通上,运用正文提出的鉴于一再名目联系矩阵的关系准则发掘算法和鉴于功夫牵制一再名目联系矩阵的关系准则发掘算法,对华夏A股商场各行业板块间的板块联合浮动和轮动效力举行了发掘领会,一上面考证了正文所提模子和算法的灵验性,另一上面也实证了2001年-2006年,华夏A股商场中各行业板块间简直生存板块联合浮动效力,但不生存鲜明的板块轮动效力。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/274562.html
本站部分内容来源网络如有侵权请联系删除