客服联系方式

当前位置:首页 » 论文摘要 » 正文

免费论文摘要:文本检索几何要害题目接洽

9593 人参与  2022年01月30日 21:46  分类 : 论文摘要  评论

跟着互联网络的赶快兴盛与普遍,搜集上的百般消息急遽减少,怎样灵验的开拓和运用搜集上的洪量消息变成特殊要害的接洽课题。消息检索本领不妨扶助人们灵验的从网上找到本人感爱好的消息,扶助用户在日益增加的消息中创造对本人有效的常识。然而,现有鉴于要害词配合的消息检索本领的本质功效并不理念,没辙满意人们日新月异的急迫需要。对准这一题目,正文在参考国表里关系接洽功效的普通上,环绕文本的情势化表白本领、查问扩充本领、文本一致性配合战略等感化文本检痛快能的要害成分打开了深刻的接洽,领会了现有本领中生存的不及,提出了越发有理的处置计划,灵验的普及了文本检索的本能。重要奉献及革新点如次:1. 提出了一种鉴于词频散布分割度的用语权重计划本领。文本向量化表白是文本检索本领的基础,用语的加权计划又是文本向量化表白的中心题目。正文对准保守TF-IDF本领中生存的不及,从限制权重与全部权重两个方面临TF-IDF本领举行了矫正。在计划词频时,商量了用语在文本中展示场所的感化,经过用语要害度系数的取值变革展现各别场所的用语对刻画文本中心的奉献水平的分辨;在计划用语辨别各别文本的本领时,沿用词频散布分割度来包办逆文书档案频次,商量越发所有;使得文本向量中用语权重的计划越发有理。试验截止表白,该本领计划所得的用语权重越发精确的反应了用语在文本检索中的要害水平,优于保守的TF-IDF本领。2. 提出了一种鉴于用语聚类特性分门别类的查问扩充本领。查问扩充本领经过百般战略,对用户供给的过于简略的原始查问举行弥补,扶助检索体例越发精确的领会用户的检索企图,是一种灵验的扶助普及文本检索精确率的本领。保守的查问扩充本领只是关怀抽掏出的一组扩充词对检痛快能的完全感化,并不许决定每一个扩充词能否都真实灵验。正文经过试验领会创造,保守鉴于词频散布的扩充词采用规范并不是真实灵验;所以,正文径直按照用语对检索截止的潜伏感化,采用越发灵验的用语聚类特性对候选扩充词举行分门别类猜测,以选定真实无助于于普及检索精确率的好的扩充词。试验截止表白,该本领对文本检索精确率的矫正优于保守查问扩充本领;同声,因为灵验的过滤了更多的无干用语,在检索功效上面也有所普及。3. 提出了一种鉴于用语关系度矩阵的文本一致度配合算法。现有文本检索模子多数是鉴于用语独力性假如的,对文本之间一致度的计划只是按照要害词的板滞配合,不足对文本的语义领会。用语独力性假如固然侧目了词与词之间联系的搀杂计划,大大简化了检索模子,然而它将本来用语之间生存着彼此关系的文本表白为由彼此独力的用语形成的汇合,丧失了很多语法和语义消息,规范了文本检索精确率的普及。正文对准这一题目,提出了一种鉴于用语关系度矩阵的文本一致度配合算法。该本领沿用用语共现领会这一鉴于统计的领会本领,对用语间的语义关系联系举行定量领会,为每篇文本创造一个用语关系度矩阵,该矩阵反应了用语之间关系水平的散布情景,不妨在确定水平上表白文本的语法构造和语义消息,鉴于该矩阵对文本之间的关系水平举行襟怀,不妨越发深刻的领会文本实质,较之大略的鉴于要害词配合的本领更为精确。试验截止表白,在举行文本检索时,该本领不妨越发精确的领会用户的检索企图,对检索截止的矫正功效优于保守鉴于要害词配合的检索本领。

来源:半壳优胜育转载请保留出处和链接!

本文链接:http://87cpy.com/201923.html

云彩店APP下载
云彩店APP下载

本站部分内容来源网络如有侵权请联系删除

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

站内导航

足球简报

篮球简报

云彩店邀请码54967

    云彩店app|云彩店邀请码|云彩店下载|半壳|优胜

NBA | CBA | 中超 | 亚冠 | 英超 | 德甲 | 西甲 | 法甲 | 意甲 | 欧冠 | 欧洲杯 | 冬奥会 | 残奥会 | 世界杯 | 比赛直播 |

Copyright 半壳优胜体育 Rights Reserved.