云彩店邀请码|半壳|优胜
随着互联网的飞速发展,人们利用互联网开发和共享各种信息,使得信息爆炸式增长,普通网络用户很难找到所需的信息。搜索引擎就是为了解决这个问题而开发的。目前的搜索引擎存在着明显的缺陷:一是搜索引擎结果的海量;另一种是搜索结果的线性排列。本文在现有搜索引擎相关技术研究的基础上,进一步研究文档聚类,致力于搜索结果的自动聚类,使用户能够更直观、更高效地找到想要的结果。本文首先研究了文档聚类的相关技术,然后设计了一种基于Google Web API的解决方案,对搜索引擎返回的结果进行聚类,最终以结构化的方式展示给最终用户。本文的主要研究成果包括:(1)对现有搜索结果重新排序方法的研究,提出一种基于现有搜索结果排序的搜索结果,根据查询词与返回结果的语义相似度完成搜索。重新排序结果的方法。本文的重排序方法采用了《同义词词林(扩展版)》中的树状层次结构,首先计算中文词之间的语义相似度,然后得到查询词与返回结果的语义相似度,并根据相似性 对搜索结果进行完全重新排序。 (2)总结了现有的聚类算法,针对不足之处对在英文搜索引擎结果中聚类效果较好的后缀树聚类算法进行了研究和改进。弥补了后缀树算法在处理中文信息方面的不足,将改进后的后缀树算法应用于中文搜索结果的聚类。 (3)在上述研究的基础上,设计并实现了搜索结果。建立了果实聚类的原型系统,并进行了相关的实验验证。通过对实验结果的分析,证明了本文方法的可行性和有效性。搜索引擎结果聚类是一个全新的领域,许多相关技术仍在发展中。在本文的最后,讨论了进一步的研究工作。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/265058.html
本站部分内容来源网络如有侵权请联系删除