半壳优胜

云彩店邀请码|半壳|优胜

当前位置：首页 » 论文摘要 » 正文

论文摘要：基于迁移学习的跨语言情感分析技术研究

6968 人参与 2022年04月07日 17:53 分类 : 论文摘要评论

互联网作为新兴的当代信息的重要载体，正在以惊人的速度发展。Web2.0的兴起给广大互联网用户提供了一个可以自由发表言论、交流和共享自己见解的广阔平台。越来越多的互联网用户开始在网上对商品、新闻或生活体验发表和分享自己的评论和见解。然而，互联网用户使用的语言不尽相同，语言差异给情感分析任务带来不小的挑战。现有的情感分析模型和情感词典、语料等情感资源多数针对英文文本，针对其他语种的研究以及应用都相对较少。如果能将英文的情感分析技术应用到其他语种，则可以更快地对其他语种做情感分析。由此，跨语言情感分析技术应运而生。

跨语言情感分析的目标是使用某一种语言（源语言）的语料资源对其他语言（目标语言）的文本进行情感分析。跨语言情感分析任务所面临的主要问题是目标语言情感资源不足，缺少情感词典以及有标注的语料。而传统机器学习的方法则需要目标语言的语料支持，因此无法直接适用于跨语言情感分析问题。本文针对跨语言情感分析任务中的主客观文本分类任务和情感极性分类两个任务进行了研究，并主要针对跨语言情感极性分类做了较为深入的分析和探讨，提出了SCL-ST跨语言情感极性分类模型。

本文首先针对跨语言主客观分类任务提出基于投票机制的主观文本抽取方法。该方法综合了三种主客观分类模型。首先基于源语言情感词典，通过多种方法筛选种子词，并通过计算点互信息值等方法对现有目标语言种子词进行扩充，从而构建出目标语言的多级情感词典。本文利用该情感词典，提出基于规则方法、加权SVM方法以及极性特征值计算三种模型相结合的方法对目标语言进行情感主客观分析，得到了较好的实验结果。其中特征选取部分使用了较为细致的特征划分，并最终使用投票机制，对三种方法的分类结果进行综合。通过实验可知，基于三种主客观分类模型投票的方法可以更好地平衡准确率和召回率，从而得到较好的实验结果。

此外，在跨语言情感倾向性分类任务中，本文针对源语言和目标语言特征空间不重叠的特点，提出基于迁移学习的跨语言分类模型SCL-ST。该模型基于迁移学习的思想，从情感资源丰富的源语言，将情感知识迁移到情感资源贫乏的目标语言，最终得到目标语言的情感极性分类器。同时，该方法基于半监督学习策略，通过实现特征空间迁移的思想来训练目标语言分类器，一定程度上弥补了迁移学习过程中由于特征空间降维所造成的信息损失。该方法在跨语言情感极性分类任务中，在公开测试集上取得了非常好的实验效果，相对于其他现有方法对分类准确率有较明显的提升。

在前文的基础上，本文设计并实现了基于3D可视化展示的跨语言情感分析展示系统。该系统可以直观反映不同国家和地区互联网用户对于某种产品的评论情况，从而可以分析不同国家互联网用户对产品的喜好。

最后对全文研究的问题以及所做的工作进行了总结，从主题信息以及特征抽取等方面分析了未来值得研究的方向，并初步探讨和展望了深度学习理论在自然语言处理领域的应用前景。

来源：半壳优胜鲸鱼幸运星转载请保留出处和链接！

本文链接：http://87cpy.com/283394.html