龙空技术网

万晓军:情感文本生成研究与应用

橘猫最大 50

前言:

而今大家对“文本生成算法研究报告怎么写”大致比较着重,兄弟们都想要剖析一些“文本生成算法研究报告怎么写”的相关内容。那么小编也在网上收集了一些对于“文本生成算法研究报告怎么写””的相关文章,希望各位老铁们能喜欢,咱们快快来了解一下吧!

报告指南

这份报告的主题是情感文本生成。从自然语言生成技术的应用和需求入手,引出情感表达文本生成的问题,从评论生成、情感对话、反讽生成、情感转换、多模态情感生成等方面介绍了情感文本生成的研究进展。

专家介绍

万晓军,北京大学计算机科学技术研究所研究员,博士生导师,语言计算与互联网挖掘实验室负责人。《CL》和《NLE》编委,《TACL》执行主编,自然语言处理领域重要国际会议EMNLP-IJCNLP 2019项目委员会主席,多次担任ACL、EMNLP、AAAI等重要国际会议主席或高级项目委员会委员。荣获ACL2017年度优秀论文奖、IJCAI 2018年度优秀论文奖、2017年度吴文俊人工智能技术发明奖、CCF NLPCC少年先锋奖等荣誉或奖项。主要从事自然语言处理和文本挖掘相关研究,包括自动文摘和文本生成、情感分析和语义计算。

报告内容

在人机交互领域,除了让机器理解人类的行为,还应该让机器生成人类理解的语言。近年来,自然语言生成也引起了人们的关注。自然语言生成的应用,如重要新闻摘要、新闻写作,以及文化娱乐的作用,如诗词创作,也能写好古诗词。还有就是电商网站的标题和描述的生成,会有更吸引人的标题供大家点击购买。最后一个是由算法自动生成的书,这也是未来一个有趣的趋势。当然,这么简单的一本书,要写一部小说还是很难的。

我们来看看机器写作的需求,从淘宝上搜一下。相关的写作软件还是很多的,但是这些软件的功能还是比较单薄的,只能用来推荐素材或者用技术模板写套路文章。而且售价也比较低。几块钱就可以买一套,可能不是特别好,价格定的比较低,所以这个需求还是很旺盛的。我们的研究团队还做了很多写作机器人,包括今日头条的合著者“小明”,来写体育新闻。中间是和南方都市报合作写的民生新闻,比如天气,春运抢票。最后, 右边的这个是和科学网络合作的。最新发表的英文科研论文,通过机器翻译和文体变换,自动翻译成中文的短新闻,方便大家了解最新的科学进展。

自然语言文本有很多种类型,一种是新闻事实,描述具体的事物。在新媒体时代,我们的人民和网民越来越多地表达自己的观点,有更多的情感表达文本。近年来,人们更加重视这类文本的生成,更加重视事实描述性文本,现在则是情感表达性文本。

自然语言的目的是带着特定的情绪提问。例如,如果你迟到了,你可以产生不同种类的情绪回复。这些回复都有特定的情绪,你可以开心也可以生气。不同的情绪可以生成相应的情绪文本。如果你的情绪是准确的。另外,自然语言生成的文本也是通顺的,产生的情感文本要与语境相适应,情感上要合理。

情感文字的产生对机器更加人性化有很大的作用。如果生成的文本只是客观描述事实,这样的算法还是不够人性化,所以希望机器能和人类有情感互动。美国科幻电影《她》(中文译为“她”)讲的就是这样一个爱上AI算法,拥有情感表达和语言表达能力的人类。除此之外,还有评论的生成,情感的对话,情感的转化。

评论的产生,评论具体的输入,当然可以指出是表扬还是批评。对于具体的特征,比如汽车,有很多系列的特征,为这些特征输入相应的分数,这些分数代表情感倾向。5分表示非常满意,1分表示不满意。在其他特性上,得分是一样的,只是在舒适度上,从3变成了5。在下面的成绩中,当分数为3时,成绩是舒服的,毕竟是跑车。5分,很舒服,包裹的很好,坐起来很舒服。可见这是一种深层次的深度学习模型来完成工作。

前面是具体的输入,有时希望生成一批正面评价,一批负面评价,也有实际需要。例如,需要积极地促进某事。此时使用的是混合对抗生成网络,这里主要使用多类分类器制作鉴别器,可以有效克服生成文本时模式崩溃的问题,使生成的文本更加多样化,不至于生成外观单一的文本。最后的结果也显示了我们预期的效果。第一,情感准确率比传统模型好很多。就多样性而言,这些文本彼此大相径庭。我们最终的机型也有这样的优势,还有流畅度。

接下来是情感对话,是昨天找到的一个蛋糕聊聊天工具。说一句话,生成一个回复给你。在要求回复的时候,你可以选择右边情绪的类别,是开心还是生气,它会据此生成相应的开心回复或者生气回复。这是一个有趣的演示,不够完善,本身也很难。这只是一种尝试。所以用了很多表情符号,可以代表情感类别,文字也做了相应的修改。在此基础上,建立了一个条件模型。在给定的上下文中,首先使用编码器进行编码,然后输入编码结果。最终会获得更好的情感对话结果。例如,我需要离开这个房间。如果指定的结果是肯定的,我会说“爱你,我什么时候回来?”如果是否定的,它会说“别回来了”, 因此保证了回复更加相关,同时可以保证情感的准确性。

情绪生成的另一个任务是情绪转化,需要情绪之外的其他内容保持一致。当然只是指情绪,比如由消极转为积极。另外,可以大做文章,加一个积极的情绪或者加一句积极情绪的句子。传统的方法,有些是基于短语的,从原始生活中检测出对应的情感表达短语,删除原始短语,然后从数据中选取一些与当前句子相似、符合特定情感的表达,插入内容得到最终结果。会有一些问题,不够灵活,可能控制不了情绪转化的程度。于是我们提出了一个方法,我们会直接修改潜在空间,做一个小的修改,保证内容变化不大,同时,小的修改之后, 让情感分类器得到想要的情感。这样的模型,使用这样的算法,快速梯度迭代,对空间做了很好的修改。所以看一下最后一个实际例子,从正到负,输入的句子是“服务和食物都很好”,修改权重小的时候直接转负。如果改装的权重较大,则是“很差的服务和食物”,控制情绪的程度是模型的优势。

接下来是更困难的任务。有时我们表达自己的感情,不是字面上的,而是作为一种讽刺或讽刺的形式。比如这个例子,“我的计划泡汤了,我很喜欢!”这很讽刺,但是用了很多正面的词。这种情况在日常生活中很常见,但是生成这样的文本却非常困难。所以我们也做了一个模型,主要是考虑到会有一个反语的判别器和一个奖励函数。需要情绪生成前后一致,做一个奖励函数,在模型中起重要作用,最后让非讽刺句变成讽刺句。最后得到一个结果,不是特别完美。比如你不想睡觉,明天可能就有意思了。这是最初的输入句子,最后生成“我不想睡觉,我很沮丧,明天会很有趣”,最后生成一个讽刺的效果, 符合人类的实际使用情况。

最后可以生成带字幕的自动图像描述,如果有积极的情感词效果会更好。只要标记大量的情感数据,就可以设计出更好的模型,生成具体情感的相应描述结果。第二个任务,多模态反语生成,图片生成对应的句子,共同形成反语效果。像这张图,天气不好,乌云密布,我们设计的词是“天气很好”,用文字的语义达到了讽刺的效果。我们尝试过,但是没有办法解决这样的问题,很难。因此,情感的产生可以结合不同的模式,在语言产生的同时也可以产生口型。合成语音时不仅文本有情感,语音也有一定的情感。最后, 它在文字、图像、声音上都有相关的情绪,最后能获得更好的交互效果。

标签: #文本生成算法研究报告怎么写