云彩店邀请码|半壳|优胜
文本是计划机中最罕见的数据方法,在消息寰球里,生存着洪量的文本处置需要。对文本举行处置的运用特殊普遍,罕见的文本处置囊括文本杞人忧天、要害消息抽取、文本实质检索、文本实质改写、文书档案机动天生、文本消息统计与领会等。现有的常用文本处领会决计划有正则表白式,GATE框架,Apache Lucene框架,以及百般对立简直文本处置的处置步调。那些现有的文本处领会决计划及框架,生存着少许缺陷:简直的文本处置体例都是对准某一简直算法或那种文本处置需要,编写特意的处置步调来实行,难以满意可通用可扩充的文本处置需要,对用户而言,百般文本处置算法,领会和实行起来也比拟艰巨;GATE和Lucene框架的运用,须要二次开拓,本领面向普遍用户运用。所以,保守的文本处领会放计划及已有的文本处置框架,难以满意既对开拓者可通用可扩充,又对普遍用户大略易用的需要。正文安排一种通用的文本处置框架,它囊括运用准则来刻画文本处置的简直论理,同声安排相映的准则引擎来实行准则,并开拓文本处置框架的IDE,进而使该文本处置框架完备可视化功效,简化定制和天生简直的文本处置步调的进程。运用准则来刻画文本处置论理,是经过领会普遍性的文本处置进程,不妨将文本处置论理归结为三个基础办法:配合、窜改、写回,由此,安排了相映的准则数据模子,囊括亚原子准则、准则集及前置前提等,来刻画简直的文本处置论理。准则引擎用来证明并实行准则。经过设置准则刻画文本论理,安排准则引擎实行简直的文本处置,进而实行文本处置论理与处置步调的辨别。鉴于Eclipse RCP平台的文本处置框架IDE的开拓,不妨使普遍用户经过可视化图形界面,定制文本准则,实行其所需的文本处置。正文结果供给两个范例来演练该文本处置框架的简直运用,同声经过与其它文本处置东西的功效及本能比较,考证正文所供给的文本处置框架的适用性和灵验性。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/204580.html
本站部分内容来源网络如有侵权请联系删除