投稿问答最小化  关闭

基于语法和语义分割的跨领域方面级情感分类

2023/2/8 17:46:20  阅读:108 发布者:

以下文章来源于中国科学信息科学 ,作者SCIS

吴震,戴新宇。基于语法和语义分割的跨领域方面级情感分类。中国科学: 信息科学, DOI:10.1360/SSI-2021-0166

研究意义

方面级情感分类旨在分析文本中特定方面目标(aspect)的情感极性,是一个重要的细粒度情感分析任务。由于复杂且耗时的数据标注过程,方面级情感分类在很多领域上是低资源甚至是零资源的,这导致监督学习方法在目标领域上通常表现出较差的泛化性能,限制了该任务在实际场景中的应用。因此,跨领域方面级情感分类研究是一项亟需研究的课题。

本文工作

为了解决上述问题,本文提出一种基于语法和语义分割的跨领域方面情感分类方法S3M。具体而言,针对不同领域用词差异造成的领域漂移和注意力泛化问题,本文首次提出利用单纯的语法信息来获取可在领域之间迁移的语法注意力,并引入与目标领域相近的文档情感分类任务作为辅助任务,来增强神经网络模型对目标领域的情感识别能力,最终从语法和语义两个层面分别提升模型的注意力机制和文本上下文表示。图1展示了S3M方法的总体框架。

本文的创新点如下:

1)在语法层面上,S3M首次完全利用语法信息来获得方面目标的注意力权重,从而提升注意力机制在跨领域方面情感分类任务中的鲁棒性。

2)在语义层面上,S3M引入资源丰富的文档级情感分类来提升模型的文本上下文表示,从而增强模型对目标领域情感语义的识别能力。

3)本文有效地将以上两个方法融合在一个框架内,进一步提升跨领域方面情感分类任务的性能。

实验结果

本文使用3个方面级情感分类数据集:Restaurant(R)Laptop(L),和Twitter(T),在6个跨领域方面级情感分类任务:RLLRRTTRLTTL进行实验,箭头的左边和右边分别表示源领域和目标领域。表2展示了不同方法在6个跨领域方面级情感分类任务上的结果,加粗的数值表示每个任务上最好的性能,可以看到:

● 和非迁移的方法相比,基于迁移的方法总体上取得了更好的性能。

BiLSTM-POSATT模型是本文S3M模型的一个变种,它将基线模型BiLSTM-ATT中基于单词上下文的语义注意力机制替换成本文基于词性上下文的注意力机制。结果表明 BiLSTM-POSATTBiLSTM-ATT基础上取得了平均5.19%的准确率提升和6.14%F1-score提升,甚至超过了之前最好的模型DIFD,验证了基于语法的注意力机制在跨领域场景下的有效性。在添加文档级数据进行语义增强之后,本文最终的方法S3M获得了进一步的性能提升,在平均准确率和F1-score上比DIFD分别提升了7.14%7.6%

3表明,在使用BERTBERT-ADARoBERTa等强大的预训练语言模型编码器后,本文提出的方法S3M仍能获得显著的提升,有力地证明了基于语法的注意力机制和基于文档情感分类的语义增强策略在跨领域方面级情感分类任务上的有效性。

转自:“蔻享学术”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com