深度学习在文本简化方面有什么最新应用进展?
雷锋网按:本文作者谭继伟、姚金戈,均为北京大学计算机科学与技术研究所在读博士生,研究方向主要包括文本信息推荐与自动摘要。
背景与介绍
近年来,机器翻译任务依靠深度学习技术取得了重大突破。最先进的神经机器翻译模型已经能够在多种语言上超越传统统计机器翻译模型的性能。在传统统计机器翻译模型上积累深厚的谷歌,也终于开始将最新的神经机器翻译系统逐步上线。
目前神经机器翻译的技术基础是端到端的编码器-解码器架构,以源语言句子作为输入,目标语言同义句作为输出。容易想象,只要具备充足的训练数据,类似架构完全有可能推广到其他涉及文本改写的任务上。例如,输入一段文字,希望系统输出一小段核心语义不变、但更为简洁的表达。这样的改写统称为文本简化(text simplification)。
近两年深度学习技术应用相对较多的是其中的一个实例,在自然语言生成研究中一般