客服联系方式

当前位置:首页 » 论文摘要 » 正文

免费论文:大规模生物医学文献检索中重排序算法研究

7247 人参与  2022年03月24日 18:02  分类 : 论文摘要  评论

随着计算机和互联网技术的飞速发展和广泛应用,各种数字化电子文献资料的数目急剧增加,其中文本数据作为一种重要的信息载体占据了很大的比例。如何从海量的互联网和电子资源中快速而准确地获取用户所需的信息,是信息检索领域所面临的重大挑战和亟待解决的重要问题。在目前绝大多数的信息检索系统中,检索出来的信息(如文档等) 都以排序的方式返回给用户。因此,信息检索领域研究的核心问题之一即为如何有效地对检索到的信息进行排序。已有大量实验表明对初始检索结果进行重排序是提高信息检索系统性能的有效手段。本文在前人的研究基础上,主要研究了如何挖掘和利用文档间的链接关系、文档中的上下文信息和语义信息来进一步提高检索结果的准确率和多样性。本文的主要研究工作和创新点如下:(1)利用文献之间的引用关系来提高生物医学文献检索系统的有效性。文档之间的链接关系可以用来辅助文档的内容信息,从而提高检索系统的有效性。在生物医学文献检索中,这种链接关系就表现为文献之间的引用与被引用关系。本文针对文档之间的链接关系主要研究了以下两点:一是,通过在文献引用图上利用链接分析算法得到文档基于链接的排序分值,并将其与文档基于内容的排序分值相结合,从而判断文档间的链接关系是否有助于提高检索的准确率;二是,进一步考虑如何结合链接信息和文本内容信息才能在减小参数调整代价的同时提高文献检索的准确率。本文提出了一种将概率检索模型和文档间引用链接关系相结合的检索框架,它有效地利用了引用链接关系来提高生物医学文献检索的有效性。(2)利用上下文信息进一步提高和改进高性能生物医学文献检索系统的有效性。生物医学领域知识库(如Gene Ontology、MeSH 词汇表、UMLS 等)是生物医学领域的重要资源,合理利用领域知识有助于改进检索系统。传统检索系统仅仅利用文档中出现的词与关键字,而忽略了文档的语义信息。本文研究了如何有效利用词汇和概念上下文信息对检索结果进行重排序,从而提高检索结果的准确率。本文通过建立一个二维上下文平面空间,以生物医学文献中出现的词和关键字作为其中一维的基向量,以生物医学文献对应MeSH 词汇或UMLS 概念作为另一维的基向量,自然地将文本的词汇特征和概念特征结合起来。最后,本文根据文档向量被所建立的二维平面空间生成的概率对文档进行重排序,从而进一步提高高性能生物医学信息检索系统的有效性。

来源:半壳优胜育转载请保留出处和链接!

本文链接:http://87cpy.com/263947.html

云彩店APP下载
云彩店APP下载

本站部分内容来源网络如有侵权请联系删除

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

站内导航

足球简报

篮球简报

云彩店邀请码54967

    云彩店app|云彩店邀请码|云彩店下载|半壳|优胜

NBA | CBA | 中超 | 亚冠 | 英超 | 德甲 | 西甲 | 法甲 | 意甲 | 欧冠 | 欧洲杯 | 冬奥会 | 残奥会 | 世界杯 | 比赛直播 |

Copyright 半壳优胜体育 Rights Reserved.