揭秘阿里小蜜:基于检索模型和生成模型相结合的聊天引擎 | PaperDaily #25
面向 open domain 的聊天机器人无论在学术界还是工业界都是个有挑战的课题,目前有两种典型的方法:一是基于检索的模型,二是基于 Seq2Seq 的生成式模型。前者回复答案可控但无法处理长尾问题,后者则难以保证一致性和合理性。 本期推荐的论文笔记来自 PaperWeekly 社区用户 @britin。本文结合检索模型和生成模型各自的优势,提出了一种新的融合模型 — AliMe Chat。 阿里小蜜首先采用检索模型从 QA 知识库中找出候选答案集合,然后利用带注意力的 Seq2Seq 模型对候选答案进行排序,如果第一候选的得分超过某个阈值,则作为最终答案输出,否则利用生成模型生成答案。 如果你对本文工作感兴趣,点击底部的阅读原文即可查看原论文。 关于作者:Britin,中科院物理学硕士,研究方向为自然语言处理和计算机视觉。 ■ 论文 | AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine ■ 链接 | https://www.paperweekly.site/papers/1302 ■ 作者 | br...


