【干货】微软SIGIR 2016演讲:基于但不限于知识库、万维网的问答系统
今天为大家推荐的是SIGIR 2016大会上,来自微软研究院自然语言处理方向的两位研究员——Scott Wen-tau Yih和Hao Ma的分享。 研讨会的主题是“基于但不限于知识库、万维网的问答系统”(Question Answering with Knowledge Base, Web and Beyond)。 研讨会从搜索引擎的发展历程出发,以微软搜索引擎——Bing为例,从最初基于文字搜索的问答系统,发展到了以Cortana为代表的基于对话的问答系统。 而这背后基于的原理都是如何让机器去更好的理解自然语言,比如可以用自然语言和用户交流的通用语言处理器,有效可以处理陈述句式或问句等。 现代问答系统中常见的问题分类主要有—— ·事实类问题: 基于实体客观事实的信息查询; 竞技类信息 ·描述性问题: 观点类或指导性查询(例如“如何做”的问题) ·多模式问题 基于视觉的问答 旅行助手 ·人工智能的能力测试 阅读理解 小学水平的科学或数学知识测试等 目前,在技术层面,搜索问答系统主要有以下几个方面的挑战—— ·问题分析:包括回答类型、格子填充、语义分析等 ·文本/数据分析 ·意译&am...