万晓军:情感文本生成研究与应用

橘猫最大 08-14 47

前言：

而今大家对“文本生成算法研究报告怎么写”大致比较着重，兄弟们都想要剖析一些“文本生成算法研究报告怎么写”的相关内容。那么小编也在网上收集了一些对于“文本生成算法研究报告怎么写””的相关文章，希望各位老铁们能喜欢，咱们快快来了解一下吧！

一

报告指南

这份报告的主题是情感文本生成。从自然语言生成技术的应用和需求入手，引出情感表达文本生成的问题，从评论生成、情感对话、反讽生成、情感转换、多模态情感生成等方面介绍了情感文本生成的研究进展。

二

专家介绍

万晓军，北京大学计算机科学技术研究所研究员，博士生导师，语言计算与互联网挖掘实验室负责人。《CL》和《NLE》编委，《TACL》执行主编，自然语言处理领域重要国际会议EMNLP-IJCNLP 2019项目委员会主席，多次担任ACL、EMNLP、AAAI等重要国际会议主席或高级项目委员会委员。荣获ACL2017年度优秀论文奖、IJCAI 2018年度优秀论文奖、2017年度吴文俊人工智能技术发明奖、CCF NLPCC少年先锋奖等荣誉或奖项。主要从事自然语言处理和文本挖掘相关研究，包括自动文摘和文本生成、情感分析和语义计算。

三

报告内容

在人机交互领域，除了让机器理解人类的行为，还应该让机器生成人类理解的语言。近年来，自然语言生成也引起了人们的关注。自然语言生成的应用，如重要新闻摘要、新闻写作，以及文化娱乐的作用，如诗词创作，也能写好古诗词。还有就是电商网站的标题和描述的生成，会有更吸引人的标题供大家点击购买。最后一个是由算法自动生成的书，这也是未来一个有趣的趋势。当然，这么简单的一本书，要写一部小说还是很难的。

我们来看看机器写作的需求，从淘宝上搜一下。相关的写作软件还是很多的，但是这些软件的功能还是比较单薄的，只能用来推荐素材或者用技术模板写套路文章。而且售价也比较低。几块钱就可以买一套，可能不是特别好，价格定的比较低，所以这个需求还是很旺盛的。我们的研究团队还做了很多写作机器人，包括今日头条的合著者“小明”，来写体育新闻。中间是和南方都市报合作写的民生新闻，比如天气，春运抢票。最后，右边的这个是和科学网络合作的。最新发表的英文科研论文，通过机器翻译和文体变换，自动翻译成中文的短新闻，方便大家了解最新的科学进展。

自然语言文本有很多种类型，一种是新闻事实，描述具体的事物。在新媒体时代，我们的人民和网民越来越多地表达自己的观点，有更多的情感表达文本。近年来，人们更加重视这类文本的生成，更加重视事实描述性文本，现在则是情感表达性文本。

自然语言的目的是带着特定的情绪提问。例如，如果你迟到了，你可以产生不同种类的情绪回复。这些回复都有特定的情绪，你可以开心也可以生气。不同的情绪可以生成相应的情绪文本。如果你的情绪是准确的。另外，自然语言生成的文本也是通顺的，产生的情感文本要与语境相适应，情感上要合理。

情感文字的产生对机器更加人性化有很大的作用。如果生成的文本只是客观描述事实，这样的算法还是不够人性化，所以希望机器能和人类有情感互动。美国科幻电影《她》(中文译为“她”)讲的就是这样一个爱上AI算法，拥有情感表达和语言表达能力的人类。除此之外，还有评论的生成，情感的对话，情感的转化。

评论的产生，评论具体的输入，当然可以指出是表扬还是批评。对于具体的特征，比如汽车，有很多系列的特征，为这些特征输入相应的分数，这些分数代表情感倾向。5分表示非常满意，1分表示不满意。在其他特性上，得分是一样的，只是在舒适度上，从3变成了5。在下面的成绩中，当分数为3时，成绩是舒服的，毕竟是跑车。5分，很舒服，包裹的很好，坐起来很舒服。可见这是一种深层次的深度学习模型来完成工作。

前面是具体的输入，有时希望生成一批正面评价，一批负面评价，也有实际需要。例如，需要积极地促进某事。此时使用的是混合对抗生成网络，这里主要使用多类分类器制作鉴别器，可以有效克服生成文本时模式崩溃的问题，使生成的文本更加多样化，不至于生成外观单一的文本。最后的结果也显示了我们预期的效果。第一，情感准确率比传统模型好很多。就多样性而言，这些文本彼此大相径庭。我们最终的机型也有这样的优势，还有流畅度。

接下来是情感对话，是昨天找到的一个蛋糕聊聊天工具。说一句话，生成一个回复给你。在要求回复的时候，你可以选择右边情绪的类别，是开心还是生气，它会据此生成相应的开心回复或者生气回复。这是一个有趣的演示，不够完善，本身也很难。这只是一种尝试。所以用了很多表情符号，可以代表情感类别，文字也做了相应的修改。在此基础上，建立了一个条件模型。在给定的上下文中，首先使用编码器进行编码，然后输入编码结果。最终会获得更好的情感对话结果。例如，我需要离开这个房间。如果指定的结果是肯定的，我会说“爱你，我什么时候回来？”如果是否定的，它会说“别回来了”，因此保证了回复更加相关，同时可以保证情感的准确性。

情绪生成的另一个任务是情绪转化，需要情绪之外的其他内容保持一致。当然只是指情绪，比如由消极转为积极。另外，可以大做文章，加一个积极的情绪或者加一句积极情绪的句子。传统的方法，有些是基于短语的，从原始生活中检测出对应的情感表达短语，删除原始短语，然后从数据中选取一些与当前句子相似、符合特定情感的表达，插入内容得到最终结果。会有一些问题，不够灵活，可能控制不了情绪转化的程度。于是我们提出了一个方法，我们会直接修改潜在空间，做一个小的修改，保证内容变化不大，同时，小的修改之后，让情感分类器得到想要的情感。这样的模型，使用这样的算法，快速梯度迭代，对空间做了很好的修改。所以看一下最后一个实际例子，从正到负，输入的句子是“服务和食物都很好”，修改权重小的时候直接转负。如果改装的权重较大，则是“很差的服务和食物”，控制情绪的程度是模型的优势。

接下来是更困难的任务。有时我们表达自己的感情，不是字面上的，而是作为一种讽刺或讽刺的形式。比如这个例子，“我的计划泡汤了，我很喜欢！”这很讽刺，但是用了很多正面的词。这种情况在日常生活中很常见，但是生成这样的文本却非常困难。所以我们也做了一个模型，主要是考虑到会有一个反语的判别器和一个奖励函数。需要情绪生成前后一致，做一个奖励函数，在模型中起重要作用，最后让非讽刺句变成讽刺句。最后得到一个结果，不是特别完美。比如你不想睡觉，明天可能就有意思了。这是最初的输入句子，最后生成“我不想睡觉，我很沮丧，明天会很有趣”，最后生成一个讽刺的效果，符合人类的实际使用情况。

最后可以生成带字幕的自动图像描述，如果有积极的情感词效果会更好。只要标记大量的情感数据，就可以设计出更好的模型，生成具体情感的相应描述结果。第二个任务，多模态反语生成，图片生成对应的句子，共同形成反语效果。像这张图，天气不好，乌云密布，我们设计的词是“天气很好”，用文字的语义达到了讽刺的效果。我们尝试过，但是没有办法解决这样的问题，很难。因此，情感的产生可以结合不同的模式，在语言产生的同时也可以产生口型。合成语音时不仅文本有情感，语音也有一定的情感。最后，它在文字、图像、声音上都有相关的情绪，最后能获得更好的交互效果。

本文地址：http://www.longkongtuishu.com/cad80BA1sBFYEDF1U.html

标签： #文本生成算法研究报告怎么写

万晓军:情感文本生成研究与应用

万晓军:情感文本生成研究与应用

博思软件申请文字报告生成专利，实现在前端预览并提供多种格式下载的报告生成方法