基于中文知识图谱的电商领域问答算法设计与系统实现

被引:0
作者
杜泽宇
机构
[1] 华东师范大学
关键词
电子商务; 知识图谱; 问答系统; 问句多样性; 依赖缩减;
D O I
暂无
年度学位
2016
学位类型
硕士
导师
摘要
随着互联网语义数据的不断产生和大规模积累,问答应用因为可以提供给用户智能的知识服务而受到青睐。典型地,基于知识图谱的问答应用不断产生。然而,目前大多数问答系统和这些系统的研究都面向英文的,而中英文之间的语义表述区别很大,因此中文问答系统还存在很多新的挑战。近年来,由于电子商务的快速发展和全面流行,直接推动了机器客服的庞大需求。本文从电子商务领域的角度出发,针对用户的多样性和不确定性,对领域中文知识库进行优化,提出了一个基于中文知识图谱的自动问答框架(CEQA),并尝试提高用户体验和缓解人工客服的压力。主要研究内容如下:1.出于电子商务的特殊性考虑,提出了商品特征的条件随机场实体识别算法,该算法能够对电商环境下问句中品牌、型号和单品实体进行有效识别;2.针对用户问句的多样性和不确定性,本文引入依赖缩减算法,该算法利用语义依存分析和基于图的缩减算法来降低用户问句噪声,从而提高语义解析的准确性;3.为了克服用户表达的多样性,即多词一意现象,提出实体链接算法,该算法先对自然语言粗分类后混合word2vec相似特征排序,从而将问句解析结果以URL的形式链接到知识库。实验结果表明,在加入了实体识别,依赖缩减和链接后,提升了问答的准确性,并在开放的电商问答数据上得到了验证。为验证CEQA框架的可行性、运行效率和用户友好等方面,本文设计并实现了一个问答系统(CEQA Live)。真实系统的良好运行,为框架的性能验证提供了良好的环境,也证明本研究的应用潜力。
引用
收藏
页数:66
共 10 条
[1]
融合FAQ、本体和推理技术的问答系统研究 [D]. 
张巍 .
太原理工大学,
2011
[2]
基于领域本体中文自动问答系统相关技术的研究与实现 [D]. 
郭磊 .
华东理工大学,
2013
[3]
基于本体的航空领域问答系统 [J].
张克亮 ;
李伟刚 ;
王慧兰 .
中文信息学报, 2015, 29 (04) :192-198
[4]
基于汉语框架网的旅游信息问答系统设计 [J].
李茹 ;
王文晶 ;
梁吉业 ;
宋小香 ;
刘海静 ;
由丽萍 .
中文信息学报, 2009, (02) :34-40
[5]
A semantic matching energy function for learning with multi-relational data.[J].Antoine Bordes;Xavier Glorot;Jason Weston;Yoshua Bengio.Machine Learning.2014, 2
[6]
Evaluating question answering over linked data.[J].Vanessa Lopez;Christina Unger;Philipp Cimiano;Enrico Motta.Web Semantics: Science; Services and Agents on the World Wide Web.2013,
[7]
Building Watson: An Overview of the DeepQA Project [J].
Ferrucci, David ;
Brown, Eric ;
Chu-Carroll, Jennifer ;
Fan, James ;
Gondek, David ;
Kalyanpur, Aditya A. ;
Lally, Adam ;
Murdock, J. William ;
Nyberg, Eric ;
Prager, John ;
Schlaefer, Nico ;
Welty, Chris .
AI MAGAZINE, 2010, 31 (03) :59-79
[8]
Semantic search on the Web.[J].Bettina Fazzinga;Thomas Lukasiewicz.Semantic Web.2010; 1,2
[9]
Performance issues and error analysis in an open-domain Question Answering system [J].
Moldovan, D ;
Pasca, M ;
Harabagiu, S ;
Surdeanu, M .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2003, 21 (02) :133-154
[10]
NATURAL LANGUAGE QUESTION-ANSWERING SYSTEMS . 1969 [J].
SIMMONS, RF .
COMMUNICATIONS OF THE ACM, 1970, 13 (01) :15-&