搜狗开源业内最全「阅读理解工具集合」,助力研发人员快速构建高效模型
机器阅读理解是当前智能问答领域中的热门研究问题,它的目标是根据给定的问题和文章(段落),在文章(段落)中抽取或改写文字片段作为问题的答案。举例来说,当前多数的搜索引擎,当用户输入的搜索关键字是一个问题时,就会尝试从搜索结果的网页中寻找答案并以最高优先级呈现给用户。例如搜索“搜狗的吉祥物是什么”,搜索引擎就会反馈如下: 这其中所利用到的技术便是“机器阅读理解”。 近年来,由于神经网络的复兴和大规模数据集的可访问,阅读理解的研究取得了很大的进展,相继涌现出许多优秀的机器阅读理解模型。例如,在SQuAD 1.0的排行榜中就已经有80多个提交的模型,其中有相当一部分模型的性能已经超越了人类的表现。 这里存在一个问题。作为一个研究人员或开发者,为了比较这些模型的优缺点并加以利用,重现这些模型是非常必要的。但在已有的模型中,很多