1.引言
在所给予的文本中识别情绪以及对应的原因是近年来自然语言处理中比较热门的领域之一。在这之中,对话场景作为一种人类重要的情绪表达方式,是一种重要的文本形式。而且对于通用人工智能来说,能够识别日常对话场景下的情绪以及相对应的原因是十分重要的。在本篇文献综述中,我们将回顾近些年来的工作,介绍这一领域内最新的研究进展。介绍将分为以下两个部分:1)对话场景下的情绪抽取和语料库介绍。2)情绪原因联合抽取的研究前沿与进展。
2.对话场景下的情绪抽取和语料库介绍
在对话场景下进行情绪的抽取的任务是获取对话场景下某一特点对话主体的情绪,并进行识别,归纳,整理,分析等任务[1]。由于近年来神经网络,深度学习的模型在人工智能领域的优异表现,以及互联网时代下涌现的大量数据,这一领域受到了大量的关注[2],[3],[4],[5]。在对话场景下的情绪抽取可以用来分析社交媒体上用户的对话数据,同时在实时场景中辅助用户的对话内容,其拥有广泛的应用前景。
与此同时,构建一个合适的对话场景数据集是十分必要的。传统的对话问答系统更多的是由一个领域内的专业对话构成的[6]。这些系统使用的数据集规模小,且范围有限,并不适用于通用的情绪抽取。在之后的工作中,陆续有一些数据集发表,他们分别是ERC - IEMOCAP [7], SEMAINE [8], Emotionlines [9], MELD [10], DailyDialog [11] 和 EmoContext [12]。在这些数据集中,除了SEMAINE数据集,其余数据集都有情绪的分类式标注。同时,ERC - IEMOCAP, SEMAINE和MELD数据集是多维度的(指包含声音,文本,视觉等多维度信息),而其余的两个数据集只有文本信息。值得注意的是,这些数据集中都没有与情绪相对应的原因标注,这在的情绪原因抽取任务中将造成一定的困难,而由于情绪原因联合抽取不需要这种标注,我们不必太过在意这一问题。
3. 情绪原因联合抽取的研究前沿与进展
情绪原因抽取(ECE)是旨在获取文本中的情绪,以及情绪背后隐藏的原因。这项工作在2010年被首次提出[13],并在之后受到了广泛的关注[14],[15],[16]。然而,情绪原因抽取存在着诸多问题。首先,在进行情绪原因抽取时,在抽取原因前必须对情绪进行标注,这显然不符合现实生活中的场景应用。其次,先对情绪进行标注的情绪抽取忽略了情绪和原因之间可能是互相关联的。
为此,情绪原因联合抽取(ECPE)这一新的任务在2019年被提出[17],在这一项工作中,给出了一个两阶段的方案来实现这一任务:首先,将文章中的情绪和原因独立的抽取出来。其次,对情绪和原因进行配对和过滤。然而,两阶段的抽取方法本身并不完美,还需要进一步的优化。这体现在第一步的错误可能会影响第二部的错误,以及情绪原因联合抽取本身无法直接获得上。为此,基于多标签学习滑动窗口的情绪原因联合抽取和ECPE-2D被提出[18],[19],以用来优化ECPE。在基于多标签学习滑动窗口的情绪原因联合抽取中,ECPE任务被转换为滑动窗口中的以情绪为中心的原因抽取问题。在ECPE-2D中,作者使用了一种二维的表达方式来表达情绪原因对,之后,通过对情绪原因对的交互与预测,作者实现了一个一体的端到端的框架,完成了情绪原因联合抽取的任务。
同时,有许多其他的工作也旨在优化两阶段的抽取方法,实现端到端的建模。其中,有的工作将情绪-原因联合抽取转化为排序问题,基于语篇结构提出了一个端到端的句对排序模型[20];有的工作将情绪-原因联合抽取转化为有向图构建问题,基于转移系统提出了端到端的基于状态转移的模型[21]。
4.结论
