云彩店邀请码|半壳|优胜
聚类算法在安排之初,商量到属性间变换的搀杂联系,常常只实用于简单属性的数据集。然而跟着运用范畴的连接夸大,如实数据会合常常含有两种或之上的属性数据。这也形成了对搀和属性数据积聚类时,保守算法难以实行在保持属性消息的同声,展现属性在聚类中的效率、辨别各别的属性特性。其余,属性数据间的各别拉拢,也会给一致度或相异度计划填补难度,使聚类功效低沉。 暂时,国表里鉴于搀和属性数据集的聚类算法接洽博得了确定功效,提出了很多算法矫正。然而现有算法仍存局部缺点,这也是正文的动身点地方。正文以矫正搀和属性数据集的聚类算法领会功效为接洽目的,鉴于对属性聚类的归结领会,在表面层面提出聚类算法矫正,经过试验考证均博得了较好的功效;在运用层面,经过建立鉴于Single-Pass的增量聚类模子对搜集消息中产品德量安定事变举行聚类。正文的重要接洽处事或革新性功效详细如次: (1)提出鉴于W-k-means的加权聚类算法。在W-k-means的普通上,商量分门别类属性数据的特性,采用用散布质心表白其簇重心,并用均值刻划数值属性,以此来处置搀和属性簇重心表白题目。其余,提出矫正相异度计划本领,使得各别属性对聚类的感化得以灵验展现。试验截止表白,矫正的W-k-means算法不妨灵验普及聚类算法对搀和属性数据的聚类精确率。 (2)提出鉴于K-prototypes的加权朦胧聚类算法。对准簇重心表白上常有的属性值消息丧失局面,以及边境数据蔟归属的朦胧性。正文先沿用朦胧聚类的办法设置簇归属上的朦胧性。而后,引入共现性规则计划数值及分门别类属性值对于聚类的感化。结果建立加权朦胧K-prototypes聚类算法对数据集举行迭代聚类。试验截止表白,该算法对搀和属性数据集的聚类功效杰出。 (3)建立鉴于Single-Pass算法的产品德量安定事变聚类模子。该模子在举行一致度计划时,引入了功夫属性,并商量消息题目、元数据及正文间文本一致度,来普及模子对多个一致事变的辨别本领。试验截止表白,该聚类模子在本能上有较大提高。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/283582.html
本站部分内容来源网络如有侵权请联系删除