客服联系方式

当前位置:首页 » 论文摘要 » 正文

论文摘要:基于本体的元搜索结果聚类算法的设计与实现

9620 人参与  2022年01月30日 21:37  分类 : 论文摘要  评论

随着互联网上信息的激增,人们通常利用搜索引擎来查询信息。然而,单一搜索引擎的网页覆盖率往往比较低,用户有时需要查询多个搜索引擎并将其结果进行人工综合。另外,现有的搜索引擎对于用户的查询返回一个长而无层次的列表,这种结果展示方式在用户易用性方面往往达不到预期目标。因为用户需要逐条阅读判断以寻找自己所需的信息,而在对多义词进行检索时,这种结果展示方式给用户带来的不便显得尤为突出。带有在线聚类功能的元搜索引擎可以解决现有搜索引擎存在的上述缺陷。元搜索引擎将多个成员搜索引擎的结果进行收集整合,提高了检索结果的查全率。而Web文档聚类功能又可以自动将搜索引擎返回的结果进行聚类,帮助用户缩小查询范围并快速定位所需信息。本文对现有的元搜索引擎和带有在线聚类功能的搜索引擎进行了研究,提出了一种基于本体的元搜索结果聚类算法。与传统的聚类算法不同,本文采用的方法首先对搜索引擎返回的结果进行预处理,分别提取出每条检索结果的标题、摘要和链接信息。然后利用广义后缀数组提取出检索结果两两之间的最长公共子串并对最长公共子串进行切词。为了使聚类标签更具可读性,本方法随后结合hownet中的语义信息计算最长公共子串里词语间的相似度并构建词汇链,利用词汇链提取出最能代表文档内容的特征词并在此基础上建立文档特征模型。在聚类过程中,本文采用一种具有较低复杂度的改进的Chameleon算法实现了Web文档的聚类。对于科技类垂直搜索引擎的网页聚类,本文结合科技领域本体,采用一种基于字典树结构的特征词语匹配算法,实现了对特定领域网页的聚类。本文最后对算法进行了编码实现,并将其与其他具有类似功能的系统进行了比较。通过对比实验可以发现,采用本文描述的方法实现的系统比基于分词的中文Web文档聚类算法和传统的STC算法在性能和聚类效果方面具有一定的优势,从而证明了该算法的可行性和有效性。

来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!

本文链接:http://87cpy.com/200521.html

鲸鱼幸运星云彩店APP下载
鲸鱼幸运星APP下载

本站部分内容来源网络如有侵权请联系删除

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

站内导航

足球简报

篮球简报

云彩店邀请码54967

    云彩店app|云彩店邀请码|云彩店下载|半壳|优胜|鲸鱼|幸运星

NBA | CBA | 中超 | 亚冠 | 英超 | 德甲 | 西甲 | 法甲 | 意甲 | 欧冠 | 欧洲杯 | 冬奥会 | 残奥会 | 世界杯 | 比赛直播 |

Copyright 半壳优胜体育 Rights Reserved.