云彩店邀请码|半壳|优胜
由Vapnik提出的支持向量机(SVM)是一种新的机器学习的方法,它是以统计学习理论和结构风险最小化原则为基础。它解决了以往困扰很多机器学习方法的问题,例如模型选择与过学习问题、非线性和维数灾难问题、局部极小点问题等。因此,近年来该方法在分类或者回归问题中得到了广泛的应用。但是,支持向量机是基于传统的监督学习分类方法,对标记样本的获取代价高、效率低,而半监督学习方法在利用标记样本的同时,也利用了大量的未标记样本,因此研究人员在支持向量机的基础上结合半监督学习思想又提出了半监督支持向量机。半监督支持向量机方法是机器学习领域中相对比较新的理论,它在很多方面尚不完善、不成熟,需要进一步地研究和改进。本文主要从半监督支持向量机时间和空间复杂度高以及不能有效处理大规模数据分类问题(如图像分类)两方面对半监督支持向量机展开研究,充分挖掘半监督支持向量机的潜力和优势。主要工作如下:
(1) FCM预选取样本的半监督SVM分类方法。基于LapSVM的半监督分类方法将随机选择一定数量的无标记样本加入训练样本集中训练得到分类器,无标记样本加入的越多,训练得到的分类器的泛化能力越强,但是随着无标记样本数目的增加,训练分类器需要的内存空间和CPU占用时间也随之急剧增加,因此在处理大规模数据分类时,如何选取尽量少的无标记样本来确保分类器的性能,同时降低算法的时间和空间复杂度的问题。为此提出了FCM预选取样本的LapSVM分类方法。该方法利用FCM算法对无标记样本聚类,根据聚类结果选择可能在最优分类超平面附近的无标记样本点加入训练样本集,这些样本可能是支持向量,携带对分类有用的信息,其数量只是无标记样本的一少部分,因此使训练样本集减小,进而减少了算法的时间和空间复杂度。计算机仿真结果表明该方法充分利用了无标记样本所蕴含判别信息,在确保分类器的分类精度的同时有效的降低算法的时间和空间复杂度。
(2) 基于Mean Map聚类核的最小二乘支持向量机半监督分类方法。为了在只有较少的标记样本时,利用未标记样本所含的信息来提高分类方法的分类精度,提出了基于Mean Map聚类核的半监督最小二乘支持向量机分类方法,该方法根据聚类假设,即相同聚类中的样本更可能具有相同的类别标签的原则来修正核函数,该方法采用k-均值聚类算法对所有样本进行聚类,根据聚类结果,构造Mean Map聚类核,然后将Mean Map聚类核和已有的核函数(本文用RBF核函数)相结合构成一个新的核函数,使得到的新的核函数包含了类间相似性(由Mean Map聚类核得到)和样本间相似性(由已有的核函数得到)。从而将未标记样本信息融入分类器,而且采用最小二乘支持向量机,其将标准支持向量机的求解二次规划问题转换为求解线性方程组的问题,降低了算法的时间复杂度,实验表明,本文提出的改进算法充分利用了无标记样本信息,有效的提高了分类器的分类性能。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/216745.html
本站部分内容来源网络如有侵权请联系删除