《中国人工智能学会通讯》——1.2 问答与智能信息获取
1.2 问答与智能信息获取 问答系统作为智能表征的研究领域,几十年来一直受到学术界的关注,国际评测 TREC 历经十余年对问答系统从几个方面进行了评测[4] 。问答系统的发展杂问题的发展过程,逐步具有了更多的智能行为特性。这个过程并不是一个单纯的直线,而是反反复复螺旋式进步。早期的问答系统虽然可以回答特定类型的问题,但是覆盖度和鲁棒性都比较差,速度也比较慢,还不能很好地应用在真实的商业系统中。 互联网大数据的产生,使问答系统在几个方面获得了改善的机会。一个是信息源数据的丰富,使得从人工构建语料库发展到从互联网获取海量有针对性的语料,如问答社区,即时通讯软件等。另一个是知识库,从人工定义特定领域知识库,发展到大规模知识图 谱 的 构 建, 例 如 YAGO [5] 、Freebase [6] 、Google 的Knowledge Graph [7] 以及 NELL [8] 。这些知识库从知识工程的角度体系化地组织了人类关于世界的认知,广度和深度都达到了空前的地步,并且还在不断的发展中。此外,互联网还存在海量的多源异构信息,包括地理信息、用户的行为日志等。这些前所未有的信息内容可以用来构建...